在加拿大溫哥華昨日舉行的全球最大計(jì)算機(jī)視覺會(huì)議 CVPR 2023 上,LG 人工智能研究所公開了該公司首個(gè)生成式 AI 商業(yè)化服務(wù) Captioning AI,為需要管理大量圖片的客戶提供了更高效的解決方案。
▲ 圖源:LG
LG 介紹,Captioning AI 基于零次學(xué)習(xí)技術(shù),使 AI 可以像人類一樣利用其先前積累的經(jīng)驗(yàn)和知識(shí)來解釋它第一次看到的物體或場(chǎng)景。平均而言,該服務(wù)能在 10 秒內(nèi)為一張圖片生成 5 個(gè)完整的描述性句子和 10 個(gè)關(guān)鍵詞。如果將圖片數(shù)量擴(kuò)大到 1 萬張,這些工作將在兩天內(nèi)完成,從而在短時(shí)間內(nèi)建立定制化的圖片搜索和管理系統(tǒng)。
LG 表示,Captioning AI 是 LG 人工智能研究所與全球最大的圖庫之一 Shutterstock 深度合作研發(fā),后者在圖像標(biāo)簽方面擁有豐富的專業(yè)知識(shí)。此外,雙方還進(jìn)行了學(xué)習(xí)數(shù)據(jù)的過濾和篩選等 AI 倫理驗(yàn)證,以確保版權(quán)透明度。
Shutterstock 首席技術(shù)官 Sezal Amin 表示:“目前,我們正在通過為全球 10 家客戶開展早期訪問(Early Access)計(jì)劃來進(jìn)一步開發(fā)這種服務(wù)。這項(xiàng)服務(wù)意在幫助人們關(guān)注更重要的內(nèi)容和具有創(chuàng)造性的任務(wù),而不是重復(fù)性的機(jī)械任務(wù)。”
據(jù)此前報(bào)道,韓國(guó)政府為進(jìn)一步加強(qiáng)新興技術(shù)領(lǐng)域發(fā)展,本月初已決定加大對(duì)人工智能技術(shù)研發(fā)的投入,投資約 5000 億韓元(IT之家備注:當(dāng)前約 26.9 億元人民幣)推進(jìn)韓國(guó) AI 項(xiàng)目發(fā)展。