亞馬遜推出 Nova 系列 AI 模型 強化內容生成

2024.12.04 12:29PM

亞馬遜在 re:Invent 2024 大會上發佈 Nova 系列 AI 模型,包含文字、影像和影片生成功能,並計劃於 2025 年推出語音生成模型,以提升內容創作效率。

在re:Invent 2024大會演講中,亞馬遜執行長Andy Jassy宣布名為Nova的自有多模態自動生成式人工智慧模型,並且區分Micro、Lite、Pro及Premier四種規模版本,另外更針對影像生成需求推出名為Nova Canas的模型,同時也宣布推出可自動生成影片內容的Nova Reel。

此次揭曉四種規格版本,包含Micro、Lite、Pro都已經可提供AWS用戶使用,而Premier則要等到2025年第一季才會對外開放。

亞馬遜標榜Nova系列模型能帶來高達75%的成本效益,並且能以更快速度產生內容,更可透過微調方式提高生成準確性。

其中,規模最小、僅對應文字內容生成的Nova Micro,在整體精度表現比起Google Gemini 1.5Flash 8B、Meta Llama 3.1 8B更高,而Nova Lite雖然在視覺理解表現略輸Claude 3.5 Sonnet V2、GPT-4o、Gemini 1.5 Pro及Llama 3.2 90B,但整體表現依然較好。

而同步推出的影像生成模型Nova Canas,則是針對藝術創作使用需求打造,並且強調比Dall-E 3、Stable Diffusion 3.5 Large能有更高生成準確率,更可在短時間內生成輸出。

Nova, 亞馬遜推出自有Nova系列自動生成式人工智慧模型,更推出可生成影像、影片的衍生版本<br><span style='color:#848482;font-size:16px;'>預計2025年推出語音生成語音模型,以及能有更多互動的模型</span>, mashdigi-科技、新品、趣聞、趨勢

至於對應影片生成的Nova Reel,則可對應橫移、360度環繞,或是縮放等拍攝視角,目前僅可生成6秒時間長度影片,但亞馬遜表示很快將能推出可生成2分鐘時間長度影片版本。

不過,亞馬遜並未透露其自有人工智慧模型訓練數據來源,僅說明是透過特定專用數據,以及授權使用數據交叉訓練而成。

另外,亞馬遜更透露接下來將擴展至語音生成語音 (speech to speech)的應用模式,預計會在2025年第一季推出,並且將在之後接續擴展至任何形式均可輸入、生成的使用模式,意味使用者可透過文字生成影片,或是將影片內容轉換為文字描述等,屆時預期將讓自動生成式人工智慧模型能有更多應用形式。

Nova, 亞馬遜推出自有Nova系列自動生成式人工智慧模型,更推出可生成影像、影片的衍生版本<br><span style='color:#848482;font-size:16px;'>預計2025年推出語音生成語音模型,以及能有更多互動的模型</span>, mashdigi-科技、新品、趣聞、趨勢

但亞馬遜此次並未公布市場傳聞的下一版Alexa數位助理服務,或許會等到其自動生成式人工智慧模型應用發展至一定程度,才會有更進一步說明。

相關消息

科技應用
EVOX《對話式 AI 白皮書》:掌握 AI 商務溝通新趨勢
癮特務
3 天前
即拍即印普普風概念印章,製造屬於自己的圖像
annti wang
15 年前
開箱評測
被評價為「每步都非常舒服」的恢復型拖鞋 2種熱賣的日常款比較
Gizmodo Japan
1 天前
文化創意
國家鐵道博物館第一階段開放 免費展區即有豐富內容、柴電工廠吸收新知
Chevelle.fu
21 個小時前
汽車未來
全新改款 BMW iX 豪華純電旗艦休旅強勢上市!「THE NEW BMW iX」現場直擊,亮點分享一次了解!
癮特務
10 天前
開箱評測
這麼薄卻可6裝置充電、總輸出達130W 這款Anker充電器規格簡直是拼命了
Gizmodo Japan
22 個小時前
開箱評測
可以與行李箱組合的三合一背包 我無法割捨Patagonia的理由
Gizmodo Japan
21 個小時前
產業消息
聯發科2025Q2手機營收佔52%預期旗艦天璣年內創造30億美金營收 首款2nm晶片維持9月設計定案
Chevelle.fu
1 天前
《奇妙之旅》家族競技展開 熱鬪場內容介紹
皮耶哈
15 年前