Gemini 1.5 Pro和GPT-4o大比較 只有一筆預算到底要買哪個AI服務呢?

by atticus
2024.05.16 11:19PM
照片中提到了Gemini 1.5、GPT-40,跟雙子座有關,包含了平面設計、平面設計、商標、設計、文本

一週內Google和OpenAI都推出了新一代的AI服務,分別是Gemini 1.5 Pro和GPT-4o。如果我每個月只能花20美金購買AI服務,那要選擇Gemini 1.5 Pro還是GPT-4o呢?我們從價格和擴張性來比較,2款AI服務共有的功能,Gemini 1.5 Pro獨有的功能和GPT-4o獨有的功能分別比較。

先講結果,如果你是Google服務重度使用者,生活離不開Gmail、Google Docs、Google日曆和Google相簿這些服務,那肯定推薦購買Gemini 1.5 Pro;假若你更偏向讓AI服務成為你的小老師或好夥伴,教你英文、數學、唸故事給你聽、陪你聊天或幫你和他人聊天,那選擇GPT-4o會更適合些,推薦看完以下的功能比較,更能選擇你想要的AI助手服務喔!

價格比較

能使用Gemini 1.5 Pro的Gemini Advance要價新台幣650元,能使用GPT-4o的GPT Plus要價20美元(折合新台幣約641元),兩者的價格幾乎一樣。不過第一次購買Gemini 1.5 Pro的使用者前2個月不用錢,第三個月開始再付費即可,而且Gemini Pro是含有2TB容量雲端空間,如果剛好要升級Google服務容量的話,Gemini Advance可能是不錯的選擇。

另外Open AI宣稱GPT-4o將能免費使用,確定能免費使用的時間未定,只是付費版的使用量是免費版的5倍。

應用程式連結

Gemini 1.5 Pro更多整合到Google Workspace服務裡,也就是Gmail、Google Docs、Google Drive和Google日曆中,如果你是這些Google服務的重度使用者。那今年的Gemini 1.5 Pro將會有很大的幫助,包括直接請Gemini整理Gmail的資料、例如帳單,還能整理所有的帳單到一個Google資料夾中。

另外Gemini 1.5 Pro也推出了Ask Photos功能,在Google相簿中能做更深度的搜尋,還可以找出自己車子的車牌,也可以透過Ask Photos整理女兒學習游泳的歷程,終於不用自己一張張分門別類整理照片了!

GPT-4o並沒有強調和不同的應用程式連結,不過ChatGPT Plus版中就有GPT Store可以有各種的外掛可以使用,例如年輕人最愛的設計軟體Canva就有GPT外掛服務,使用者可以在ChaGPT上面透過指令製作出Canva的設計稿。需要話流程圖的話也可以透過Diagrams這個外掛、在ChatGPT上下指令畫出流程圖。

總結來說,如果你是Google服務重度使用者,那Gemini 1.5的服務就相當有用,如果你想嘗試更多元的應用程式和AI服務的連結,GPT-4o的外掛會更好用。

▲透過GPT外掛應用程式的服務,可以下指令做出Canva的設計稿。

▲透過Gemini 1.5 Pro的Ask Photos功能,可以找到相簿中自家車的車牌了。

影片溝通功能

Gemini 1.5 Pro推出了Ask with Video功能,可以邊拍影片邊問Gemini問題。Google以唱臂故障的鐵三角黑膠唱機為例,透過手機拍攝唱臂故障的情形,並詢問該如何修復,Ask with Video利用辨識影片中唱臂的晃動狀況分析是哪種故障情況,提供故障排除的建議。

GPT-4o也提出了類似的功能,展示者在紙上寫的一元一次方程式,並請GPT-4o解出,而且不只是單純解出X是什麼,而是教展示者一步一步解出答案。

▲GPT-4o教你解數學題目。

▲Gemini 1.5 Pro的詢問影片功能展示。

GPT-4o有、Gemini 1.5 Pro沒有的功能

語音即時翻譯

透過GPT-4o能成為語言不同的人成為中介翻譯者,OpenAI的發表會上使用者對GPT-4o下了指令「我正在和一位義大利人對話,你聽到英語的時候就翻譯成義大利語、你聽到義大利語的時候就翻譯成英語」,成為了即時口譯的工具。

即時影片辨識:家教和盲人導航功能

使用者請GPT-4o教學生什麼是三角函數,透過手機拍攝平板電腦上的畫面,GPT-4o一步步引導學生學習三角形不同的邊、和角度計算的方式,藉此讓人認知未來學生學習都能讓GPT-4o成為家教。不過這個做法可能需要一些設定,因為同時應用到GPT-4o的攝影辨識能力和語音辨識能力。

即時影片辨識功能還可作為盲人的導航助理,GPT-4o可以告訴盲人目前的環境狀況,叫計程車的時候還可以輔助車已經開到路邊可以上車,這個功能普及的話會是所有盲人的福音。

語調和插話

GPT-4o語音功能將可以透過指令改變情緒,例如請GPT-4o編個睡前故事,念完後可以下指令請GPT-4o以不同情緒唸出。對它說「我愛你GPT-4o」,GPT-4o還能以不好意思的情緒回應。此外GPT-4o回答的時候,人們可以像一般對話一樣直接插話,過去的ChatGPT會重新來過,現在的GPT-4o能理解並繼續接話,猶如一般人一樣。

▲主持人請GPT-4o講個「機器人愛情」的故事,講到一半插話請GPT-4o改變音調說故事。

桌機版軟體

GPT-4o將推出桌機版原生軟體,Gemini 1.5 Pro仍需要透過瀏覽器使用。

Gemini 1.5 Pro有、GPT-4o沒有的功能

專案助理AI Teammate

AI Teammate猶如組織協同作業的萬能助理,在展示中我們先為AI Teammate取名Chip。在專案中的各種討論,就可以將Chip拉進來,他會幫你找資料和解答。

例如我們問「IO的腳本在哪呢?」Chip就會從所有的資料中找給你。又例如:「IO的發表專案確認了嗎?」

Chip就會給你目前專案的作業進度,包括發想在4月25日確認、5月18日會完成設計、5月22日測試、11月15日開始行銷。每個結論都有引用的資料依據,都可以回頭爬梳資料。

▲連專案進度都可以追蹤整理,每個條列重點都有信件或文件的來源依據。

旅遊規劃功能

Gemini 1.5 Pro將於未來幾個月內提供旅遊規劃功能,使用時你可以說出你想要去日本東京7天,偏好文化行程,不吃生魚片。那麼Gemini就會推薦你適合的機票、飯店以及餐飲店,而且這些資訊都是動態調整,可以隨時增加條件或是進行調整,就像是跟旅行社專員對話一樣。

用AI分析通話防詐騙

Gemini Nano是簡化的大型語言模型,可在手機端離線使用。它可以監控並即時分析通話內容,當對話觸及高風險的詞語或行為,像是提到銀行帳戶、密碼,或是要你購買點卡或轉帳時,手機會出現語音要你提高警覺,並於畫面上顯示要繼續通話或是立即掛斷。

影片生成

影片生成方面Gemini 1.5 Pro不像GPT-4o可以直接產出文本,不過這次Google IO 2024發表會中,Google也發表了Veo生成影片服務,包括能生成一分鐘的影片、將相片生成為影片、還能做局部修改的功能。這都指向之前Open AI推出的影片生成服務Sora。倒底兩者誰強誰弱,目前則不得而已,使用者可以到Google DeepMind網站申請使用

▲Google Veo生成影片展示畫面。

結論

如果您是 Google 服務重度使用者,生活離不開 Gmail、Google Docs、Google 日曆和 Google 相簿這些服務,那麼 Gemini 1.5 Pro 是更好的選擇。 它與這些服務的整合更深入,並提供獨特的功能,例如 Ask Photos,可讓您輕鬆整理照片和影片。

如果您更偏向讓 AI 服務成為您的老師或好夥伴,教您英文、數學、唸故事給您聽、陪您聊天或幫您和他人聊天,那麼 GPT-4o 會更適合您。 它具有更廣泛的功能,包括語音即時翻譯、即時影片辨識、語調和插話等。

總而言之,Gemini 1.5 Pro 和 GPT-4o 都是功能強大的 AI 服務,各有優缺點。 最終選擇哪一種取決於您的需求和偏好。如果還無法決定的話,那先用免費版試試看也可以。