NVIDIA GauGAN2 更新 使用者輸入文字描述即可進行精細圖像創作

2021.11.24 08:41PM

NVIDIA GauGAN2採用了NVIDIA Selene超算系統,其中透過1000萬張風景圖像進行學習訓練,並且讓系統能將描述字詞與風景圖像建立關連,藉此快速對應使用者輸入字詞,進而產生相應圖像,藉此簡化過往創作精細圖像需要經歷流程,對於影像創作應用需求將能減少更多時間成本。

NVIDIA在GTC 2019期間展示的GauGAN研究工具,在持續更新為GauGAN2後,目前更加入能以簡單描述字句,即可自動建立精細圖像。

在GauGAN2使用模式中,使用者僅需輸入「有海灘的夕陽」 (sunset at a beach)等字詞即可自動生成精細圖像,甚至可以進一步加入更精準描述,例如「有礁岩海灘的夕陽」 (sunset at a rocky beach),或是將「夕陽」換成「下午」、「雨天」等字詞,都能讓GauGAN2立即調整生成圖像。

另外,配合先前透過簡單手繪即可讓系統自動生成圖像的功能,在GauGAN2則可讓圖像生成更符合使用者所需結果,例如自動形成使用者所構想海灘形式,以及夕陽呈現位置等。

依照NVIDIA說明,GauGAN2採用分割映射、圖像修復,以及文字描述轉圖像生成功能,並且在原本單一對抗生成網路運算中,加入文字語意識別結果,讓使用者能以更簡單方式進行創作,並且透過手動方式讓生成圖像更為精細。

而在背後運算則採用了NVIDIA Selene超算系統,其中透過1000萬張風景圖像進行學習訓練,並且讓系統能將描述字詞與風景圖像建立關連,藉此快速對應使用者輸入字詞,進而產生相應圖像,藉此簡化過往創作精細圖像需要經歷流程,對於影像創作應用需求將能減少更多時間成本。

相關消息

遊戲天堂
FCC電檢照片顯示華碩將推出一黑一白兩款ROG Ally 2電競掌機,增強握柄人體工學、黑色機型可能為Xbox認證機型
Chevelle.fu
1 個月前
在地生活
吉伊卡哇廠商限定圖片外流 日方決定取消台灣訂單
討喜小姐
1 個月前
開箱評測
Cooler Master NCORE 100 Air直立式ITX風冷機殼評測,超小占地面積能容高規格系統的精緻機殼
Chevelle.fu
1 個月前
產業消息
Sony將在5月13日公布Xperia 1 VII,首支預告聚焦Alpha相機技術
Chevelle.fu
1 個月前
開箱評測
不想要耳塞 Sony無線降噪耳機折590元 平價降噪耳罩式耳機可選它
Tandee
1 個月前
產業消息
三星旗下HARMAN收購持有B&W、天龍馬蘭士的Sound United
Chevelle.fu
1 個月前
關於android播放3gp內含AAC無法撥放問題
hanawa
15 年前
人物專訪
GPS導航發明前計程車怎麼找路?以前載客常遇到霸王車、靈異事件?本篇就讓「老司機」親自說給你聽!
丹費特
1 個月前
遊戲天堂
吉伊卡哇袋著走聽見玩家心聲大更新 期待退坑玩家回流
討喜小姐
2 個月前