Google 在 Vertex AI 平台新增 Lyria 文本轉音樂模型,加速生成豐富內容,提升 AI 創作能力。
除了持續擴充Vertex AI人工智慧模型資源,Google更宣布將文字轉音樂模型Lyria以預覽版本形式透過Vertex AI平台提供使用,讓Vertex AI平台成為目前唯一可提供涵蓋影像、語音、視訊及音樂內容生成模型的管道。
Lyria可透過文字指令方式快速製作高解析度音質、可提供細節聲音差異,以及豐富曲風的音樂內容,可協助品牌業者快速製作用於產品行銷、發表活動,或是店內沉浸體驗的配樂,並且能依照品牌形象客製化細節,而對於創作者而言也能縮減影片、Podcast等內容製作時間,讓創作者能在短短幾分鐘內產生符合情境需求的音樂,同時無須擔心版權侵害問題。
另一方面,Google也更新去年底推出的Veo 2影片生成工具,加入更多編輯功能與鏡位控制選項,讓創作者能更精準調整影片內容呈現細節,進而快速產生所需影片內容,甚至可以針對影片細節進行調整,例如移除影片中某個人物,或是變更影片顯示比例等。
其他部分,則包含將文字轉圖像模型Imagen 3的內容生成功能升級,並且加入可重建圖像缺少或損壞細節,同時也提高物件移除後的影像品質。而用於生成音訊內容、支援超過35種語言的Chirp 3,目前則可即時自訂語音內容,透過輸入10秒長度音訊即可產生客製化語音,並且能將人工智慧生成語音融入既有真實語音,或是將對話內容轉錄為文字,即可標注區分不同說話者陳述內容。
而在此次更新,Google更標榜Vertex AI成為目前唯一可提供涵蓋影像、語音、視訊及音樂內容生成模型的管道,讓使用者能快速透過文字指令生成靜態影像,同時也能直覺產生影片內容與配樂,並且加上自訂旁白內容,藉此在短時間內製作一個可用於行銷的宣傳影片。
跟先前推出的人工智慧工具一樣,Google也強調此次推出的Lyria等功能也會加入SynthID數位浮水印、安全過濾機制,並且符合資料治理原則,同時也會針對使用者使用Google此類服務發生版權爭議,將會出面提供賠償等負責作法。
目前廣告公司Goodby, Silverstein & Partners與達利博物館已經利用Veo 2及Imagen 3,將西班牙超現實主義畫家薩爾瓦多達利 (Salvador Dalí)於1937年構思的電影劇本《馬背上的長頸鹿沙拉》 (Giraffes on Horseback Salad,或是The Surrealist Woman)化作真實。
包含歐萊雅集團 (L』Oréal S.A.)也透過Veo、Imagen製作其產品行銷素材,美國食品公司卡夫亨氏 (The Kraft Heinz Company)也藉由Veo 2協助其創意行銷內容,讓過往必須花費2個月時間製作內容,僅需在短短8小時內完成。