6 月 20 日消息,近日,社交媒體公司 Snap 旗下的 Snap Research 部門(mén)宣布,他們研發(fā)出了一種新的技術(shù),可以讓 AI 生成圖像的速度大幅提升,從原來(lái)的幾分鐘甚至幾小時(shí)縮短到不到兩秒。
![]()
這種新的技術(shù)被稱(chēng)為 SnapFusion,它可以根據(jù)用戶(hù)輸入的文字提示,快速生成清晰的圖像。Snap 公司表示,這是目前學(xué)術(shù)界公布的最快的速度。該公司在博客文章中介紹了這項(xiàng)技術(shù)的原理和優(yōu)勢(shì):
Snap Research 通過(guò)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)和去噪過(guò)程,使得模型非常高效,同時(shí)保持了圖像質(zhì)量。因此,現(xiàn)在可以運(yùn)行模型來(lái)根據(jù)文字提示生成圖像,并在移動(dòng)設(shè)備上幾秒鐘內(nèi)得到結(jié)果,而不是像其他研究那樣需要等待很長(zhǎng)時(shí)間。
Snap Research 還發(fā)布了一篇論文(PDF 格式),詳細(xì)介紹了 SnapFusion 技術(shù),并展示了一些由該技術(shù)生成的藝術(shù)作品。論文中指出:
具體來(lái)說(shuō),我們提出了一個(gè)高效的 UNet,通過(guò)識(shí)別原始模型的冗余,并通過(guò)數(shù)據(jù)蒸餾減少圖像解碼器的計(jì)算。此外,我們通過(guò)探索訓(xùn)練策略和引入無(wú)分類(lèi)器指導(dǎo)的正則化,增強(qiáng)了步驟蒸餾。
不過(guò),這項(xiàng)新技術(shù)還需要一段時(shí)間才能面向廣大用戶(hù)開(kāi)放。但是 Snap 公司表示,它“有潛力在未來(lái)為移動(dòng)設(shè)備上的高質(zhì)量 AI 生成圖像體驗(yàn)提供強(qiáng)大的動(dòng)力”。IT之家猜測(cè),這項(xiàng)新技術(shù)很可能會(huì)添加到 Snapchat 移動(dòng)應(yīng)用程序的未來(lái)更新中。
關(guān)鍵詞: