NVIDIA GauGAN2 更新 使用者輸入文字描述即可進行精細圖像創作

2021.11.24 08:41PM
照片中提到了Segmeintatien、Fuzzy th: 20、Sketch,包含了屏幕截圖、2020國際固態電路會議、一生一次的事件、圖片、英偉達

NVIDIA GauGAN2採用了NVIDIA Selene超算系統,其中透過1000萬張風景圖像進行學習訓練,並且讓系統能將描述字詞與風景圖像建立關連,藉此快速對應使用者輸入字詞,進而產生相應圖像,藉此簡化過往創作精細圖像需要經歷流程,對於影像創作應用需求將能減少更多時間成本。

NVIDIA在GTC 2019期間展示的GauGAN研究工具,在持續更新為GauGAN2後,目前更加入能以簡單描述字句,即可自動建立精細圖像。

在GauGAN2使用模式中,使用者僅需輸入「有海灘的夕陽」 (sunset at a beach)等字詞即可自動生成精細圖像,甚至可以進一步加入更精準描述,例如「有礁岩海灘的夕陽」 (sunset at a rocky beach),或是將「夕陽」換成「下午」、「雨天」等字詞,都能讓GauGAN2立即調整生成圖像。

另外,配合先前透過簡單手繪即可讓系統自動生成圖像的功能,在GauGAN2則可讓圖像生成更符合使用者所需結果,例如自動形成使用者所構想海灘形式,以及夕陽呈現位置等。

依照NVIDIA說明,GauGAN2採用分割映射、圖像修復,以及文字描述轉圖像生成功能,並且在原本單一對抗生成網路運算中,加入文字語意識別結果,讓使用者能以更簡單方式進行創作,並且透過手動方式讓生成圖像更為精細。

而在背後運算則採用了NVIDIA Selene超算系統,其中透過1000萬張風景圖像進行學習訓練,並且讓系統能將描述字詞與風景圖像建立關連,藉此快速對應使用者輸入字詞,進而產生相應圖像,藉此簡化過往創作精細圖像需要經歷流程,對於影像創作應用需求將能減少更多時間成本。

0 則回應