C114通信網(wǎng)  |  通信人家園

人工智能
2024/12/17 09:42

谷歌發(fā)布AI圖像生成新工具Whisk,支持上傳多張圖片以圖生圖

IT之家  遠(yuǎn)洋

谷歌今日發(fā)布了一款名為 Whisk 的全新 AI 圖像生成工具,該工具允許用戶使用其他圖像作為提示來生成圖像,而不需要冗長的文本提示。用戶只需提供圖像,即可指定 AI 生成圖像的主題、場景和風(fēng)格。

使用 Whisk 時,用戶可以為主題、場景和風(fēng)格分別提供多張圖像作為提示。(當(dāng)然,用戶仍然可以選擇使用文字提示。)如果手頭沒有合適的圖像,用戶還可以點(diǎn)擊骰子圖標(biāo),由谷歌自動填充一些圖像作為提示(這些圖像似乎也是 AI 生成的)。此外,用戶還可以在流程的最后階段在文本框中輸入一些文字,以添加關(guān)于目標(biāo)圖像的額外細(xì)節(jié),但這并非必需步驟。

Whisk 隨后會生成圖像,并為每張圖像生成相應(yīng)的文本提示。如果用戶對生成結(jié)果滿意,可以選擇收藏或下載圖像;如果需要進(jìn)一步調(diào)整,則可以通過在文本框中輸入更多文字或點(diǎn)擊圖像并編輯文本提示來進(jìn)行優(yōu)化。

谷歌在一篇博文中強(qiáng)調(diào),Whisk 的設(shè)計(jì)初衷是“快速的視覺探索,而非像素級的精細(xì)編輯”。該公司還表示,Whisk 可能會出現(xiàn)“偏差”,因此允許用戶編輯底層的提示。

據(jù)體驗(yàn)者稱,在短暫的使用過程中,Whisk 帶來了有趣的體驗(yàn)。圖像生成需要幾秒鐘的時間,雖然生成的圖像有時會有些奇怪,但所有生成的內(nèi)容都易于迭代修改。

谷歌表示,Whisk 使用的是其最新一代的 Imagen 3 圖像生成模型,該模型也于今日發(fā)布。

給作者點(diǎn)贊
0 VS 0
寫得不太好

免責(zé)聲明:本文僅代表作者個人觀點(diǎn),與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí),對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實(shí)相關(guān)內(nèi)容。

熱門文章
    最新視頻
    為您推薦

      C114簡介 | 聯(lián)系我們 | 網(wǎng)站地圖 | 手機(jī)版

      Copyright©1999-2024 c114 All Rights Reserved | 滬ICP備12002291號

      C114 通信網(wǎng) 版權(quán)所有 舉報(bào)電話:021-54451141