NVIDIA GauGAN2 更新使用者輸入文字描述即可進行精細圖像創作 #NVIDIA Selene (168955)

NVIDIA GauGAN2採用了NVIDIA Selene超算系統，其中透過1000萬張風景圖像進行學習訓練，並且讓系統能將描述字詞與風景圖像建立關連，藉此快速對應使用者輸入字詞，進而產生相應圖像，藉此簡化過往創作精細圖像需要經歷流程，對於影像創作應用需求將能減少更多時間成本。

NVIDIA在GTC 2019期間展示的GauGAN研究工具，在持續更新為GauGAN2後，目前更加入能以簡單描述字句，即可自動建立精細圖像。

在GauGAN2使用模式中，使用者僅需輸入「有海灘的夕陽」 (sunset at a beach)等字詞即可自動生成精細圖像，甚至可以進一步加入更精準描述，例如「有礁岩海灘的夕陽」 (sunset at a rocky beach)，或是將「夕陽」換成「下午」、「雨天」等字詞，都能讓GauGAN2立即調整生成圖像。

另外，配合先前透過簡單手繪即可讓系統自動生成圖像的功能，在GauGAN2則可讓圖像生成更符合使用者所需結果，例如自動形成使用者所構想海灘形式，以及夕陽呈現位置等。

依照NVIDIA說明，GauGAN2採用分割映射、圖像修復，以及文字描述轉圖像生成功能，並且在原本單一對抗生成網路運算中，加入文字語意識別結果，讓使用者能以更簡單方式進行創作，並且透過手動方式讓生成圖像更為精細。

而在背後運算則採用了NVIDIA Selene超算系統，其中透過1000萬張風景圖像進行學習訓練，並且讓系統能將描述字詞與風景圖像建立關連，藉此快速對應使用者輸入字詞，進而產生相應圖像，藉此簡化過往創作精細圖像需要經歷流程，對於影像創作應用需求將能減少更多時間成本。

資料來源

https://mashdigi.com/nvidia-updated-gaugan2/

Mash Yang

猜你喜歡

資料來源

Mash Yang

相關消息