2024/12/17 09:42

谷歌發(fā)布AI圖像生成新工具Whisk，支持上傳多張圖片以圖生圖

IT之家遠(yuǎn)洋

谷歌今日發(fā)布了一款名為 Whisk 的全新 AI 圖像生成工具，該工具允許用戶使用其他圖像作為提示來(lái)生成圖像，而不需要冗長(zhǎng)的文本提示。用戶只需提供圖像，即可指定 AI 生成圖像的主題、場(chǎng)景和風(fēng)格。

使用 Whisk 時(shí)，用戶可以為主題、場(chǎng)景和風(fēng)格分別提供多張圖像作為提示。（當(dāng)然，用戶仍然可以選擇使用文字提示。）如果手頭沒(méi)有合適的圖像，用戶還可以點(diǎn)擊骰子圖標(biāo)，由谷歌自動(dòng)填充一些圖像作為提示（這些圖像似乎也是 AI 生成的）。此外，用戶還可以在流程的最后階段在文本框中輸入一些文字，以添加關(guān)于目標(biāo)圖像的額外細(xì)節(jié)，但這并非必需步驟。

Whisk 隨后會(huì)生成圖像，并為每張圖像生成相應(yīng)的文本提示。如果用戶對(duì)生成結(jié)果滿意，可以選擇收藏或下載圖像；如果需要進(jìn)一步調(diào)整，則可以通過(guò)在文本框中輸入更多文字或點(diǎn)擊圖像并編輯文本提示來(lái)進(jìn)行優(yōu)化。

谷歌在一篇博文中強(qiáng)調(diào)，Whisk 的設(shè)計(jì)初衷是“快速的視覺(jué)探索，而非像素級(jí)的精細(xì)編輯”。該公司還表示，Whisk 可能會(huì)出現(xiàn)“偏差”，因此允許用戶編輯底層的提示。

據(jù)體驗(yàn)者稱，在短暫的使用過(guò)程中，Whisk 帶來(lái)了有趣的體驗(yàn)。圖像生成需要幾秒鐘的時(shí)間，雖然生成的圖像有時(shí)會(huì)有些奇怪，但所有生成的內(nèi)容都易于迭代修改。

谷歌表示，Whisk 使用的是其最新一代的 Imagen 3 圖像生成模型，該模型也于今日發(fā)布。

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無(wú)關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對(duì)本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請(qǐng)讀者僅作參考，并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

基于大語(yǔ)言模型命名實(shí)體識(shí)別的AI智能問(wèn)答優(yōu)化
郵電設(shè)計(jì)技術(shù) 施志雄，段該甲，馬龍軒，吳婕16:12
中國(guó)移動(dòng)發(fā)布“5G-A×AI融智創(chuàng)新”行動(dòng)計(jì)劃，今年將著力構(gòu)建5G-A新型網(wǎng)絡(luò)能力體系
廠商供稿 15:37
OpenAI CEO 奧爾特曼：DeepSeek 并未影響 GPT 的增長(zhǎng)，將推更好的開(kāi)源模型
IT之家遠(yuǎn)洋15:04
筑AI生產(chǎn)力底座酒仙橋論壇丨AIDC創(chuàng)新驅(qū)動(dòng)力新變革專場(chǎng)將于4月16日隆重舉行
C114通信網(wǎng) 13:09

谷歌發(fā)布AI圖像生成新工具Whisk，支持上傳多張圖片以圖生圖

谷歌發(fā)布AI圖像生成新工具Whisk，支持上傳多張圖片以圖生圖