Google 提出 Parti 文本轉圖像技術 文字描述快速生成精美圖像

2022.06.24 06:14PM

目前在市場上類似的技術越來越多,除了Google此次提出的Parti,還包含先前由NVIDIA提出的GauGAN,或是OpenAI提出的Dall-E,以及諸如VQ-GAN+CLIP 和 Latent Diffusion Models等,均可透過簡單文字描述輸入,即可快速生成擬真影像。

Google提出名為Parti的文本轉圖像技術,透過輸入文字敘述內容,即可快速生成對應圖像結果。

Parti是透過200億組輸入資料進行訓練,全名為「Pathways Autoregressive Text-to-Image」 (路徑自回歸模型文本轉圖像),同時隨著可使用參數增加,所生成圖像也會更逼真。

而為了避免造成額外影響,目前Google並未透過公眾內容訓練Parti,避免產生潛在偏見風險。

-
▲Parti背後運作流程
-
▲隨著訓練資料數量增加,所生成影像精度也會更高

在訓練過程中,Google更表示會加入一些「噪訊」進行干擾,藉此讓人工智慧在訓練過程產生對抗生成訓練效果,避免生成結果變成千篇一律,同時也能讓生成結果精度提高。

目前在市場上類似的技術越來越多,除了Google此次提出的Parti,還包含先前由NVIDIA提出的GauGAN,或是OpenAI提出的Dall-E,以及諸如VQ-GAN+CLIP 和 Latent Diffusion Models等,均可透過簡單文字描述輸入,即可快速生成擬真影像。

-

相關消息

蘋果新聞
《F1》電影將破 3 億美元全球票房 成蘋果史上最高收益電影
Mash Yang
17 個小時前
關於android播放3gp內含AAC無法撥放問題
hanawa
15 年前
Xbox Game「Lips」Model
stoneip
16 年前
達梭系統收購搜尋應用平台公司 Exalead
news.tw
15 年前
HP引領資料中心結構、伺服器延展性和應用程式自動化的新潮流
news.tw
15 年前
快訊
日亞網友一致推薦 3 款 MUJI 收納神器,線材零食都可以收得乾淨
Shopping guide
1 天前
快訊
送給媽媽的夢幻逸品,日本 Vermicular IH 琺瑯電子鑄鐵鍋,現在下單再送專屬食譜書
Shopping guide
2 個月前
快訊
樂維 RK 藍牙無線機械鍵盤只要 2290,CP 未免也太高
Shopping guide
1 個月前
新奇搞笑
貨幣博物館「裝滿百萬美元的展示箱」被認真魔人破解其實超裝55萬
Twelve
2 天前