搜尋關於語言的資訊

OpenAI 推出 GPT-4 語言模型強化圖像識別與互動能力

OpenAI發布GPT-4，具圖像識別、多模輸入設計與自訂回應風格，提升真實性及可靠性，應用於微軟新工作模式。隨著Google表示在Workspace導入生成式人工智慧技術之後，OpenAI趕在微軟即將展開發表活動前，正式宣布推出全新GPT-4大型語言模型。相較先前推出的GPT-3.5主要針對文本內容進行理解與快速反應，OpenAI表示GPT-4將能針對圖像內容進行識別理解，並且進一步生成互動文本內容。同時，雖然在整體表現仍不比人類大腦，但在特定專業與學術理解已經能趕上人類理解能力。除了先前的文本內容理解與此次增加圖像內容識別理解功能，新版GPT-4模型更強化多模輸入設計，將能進一步識別

Mash Yang

照片中提到了G、文、Google，跟谷歌、谷歌有關，包含了谷歌翻譯、谷歌翻譯、翻譯、語言

網頁版 Google 翻譯終於支援以上傳方式翻譯圖像文字方便理解不同語言內容

支援語言部分，則總計對應113種語言識別效果，並且能將識別結果翻譯成總共133種語言，另外翻譯後的文字內容也能複製，或是保存紀錄。行動版Google翻譯很早就能藉由Google Lens技術翻譯圖像形式的文字內容，Google稍早也正式宣布將此項功能帶到網頁版Google翻譯。使用方式基本上與行動版相同，只是網頁版主要還是透過上傳影像或擷圖內容，讓系統能自動識別圖像內容對應文字。而支援語言部分，則總計對應113種語言識別效果，並且能將識別結果翻譯成總共133種語言，另外翻譯後的文字內容也能複製，或是保存紀錄。在近期公布消息中，Google表示其結合人工智慧與深度學習技術的語言翻譯功能，

Mash Yang

照片中提到了479、CE、EVI，跟谷歌有關，包含了谷歌ログ、Google Ads、谷歌商家資料、Google購物

Google 通用語言模型研究結果公布強調比 OpenAI 的 Whisper 有更好語意理解表現

在美式英語的理解表現中，Google更說明其通用語言模型相比其他先進語言模型的單詞錯誤率更低，正確率甚至提高6%比例，相比OpenAI提出的大型語言模型Whisper對應的18種語言，其單詞錯誤率平均在32.7%，而Whisper的單詞錯誤率平均在40%以下。 Google稍早公布其去年11月投入的通用語言模型研究結果，其中加入長達1200萬小時語音內容長度，以及280億組訓練參數，同時對應超過300種語言，目前已經能支援超過100種語言識別，未來目標可支援超過1000種語言。依照Google說明，其通用語言模型採持續自我監督學習，並且不斷進行微調，藉由BEST-RQ演演算法在無外部監督情況

Mash Yang

照片中提到了comm、Microsoi，跟微軟公司有關，包含了微軟總部、雷蒙德、微軟、總公司

微軟多型態大型語言模型「Kosmos-1」發表可同時理解文字與圖像內容往全能型人工智慧技術發展邁進一大步

許多人其實也對全能型的人工智慧技術發展表示擔憂，認為發展過度「聰明」的人工智慧，有可能加速影響人類既有生活模式，甚至可能導致人類滅亡，但也有看法表示此類擔憂純屬多慮，認為此類技術發展過程仍會加上諸多保護機制，避免人工智慧影響加劇。雖然近期與OpenAI合作將ChatGPT技術應用在新版Bing搜尋服務等產品，但微軟顯然並未停下自行建構大型語言模型的腳步。在稍早公布名為「Kosmos-1」的多型態大型語言模型，將能同時理解文字與圖像內容，藉此對應更複雜、多元的人工智慧技術應用。微軟表示，用於訓練「Kosmos-1」資料同樣源自網路，同時為了讓「Kosmos-1」能進一步理解圖像內容，研究人員

Mash Yang

照片中提到了99 Annotations、Playback speed、cc Subtitles/CC (13)，包含了雨傘、當然、不足、機、主流

YouTube 增加多種語言聲道選項增加更多影片觀看率

YouTube在此次增加多種語言聲道選項，將能在原本影片呈現語言之外，增加更多語言選項，藉此讓不同語言觀眾也能輕易觀看。在稍早更新中，YouTube表示針對創作者新增在影片提供多種語言聲道選項，藉此讓不同語言觀眾能更容易觀看影片。雖然YouTube很早就增加字幕功能，甚至提供字幕翻譯選項，讓不同語言觀眾可以輕易觀看各國地區創作者上傳影片，但不免還是要一直盯著字幕才能理解影片內容。因此，YouTube在此次增加多種語言聲道選項，將能在原本影片呈現語言之外，增加更多語言選項，藉此讓不同語言觀眾也能輕易觀看。 YouTube其實在過去一年內已經向少數創作者提供測試此功能，並且說明增加多語言聲道

Mash Yang

聯發科與中研院、國教院合力開發以千億參數的繁體中文 AI 語言生成模型開放開源下載

對於台灣或是香港的搜尋與 AI 翻譯使用者，應該都會對於多數語言模型別說是分辨香港繁體或是台灣繁體，甚至簡繁用語也完全不分的情況感到頭痛，不過未來繁體中文使用者有望獲得更好的 AI 繁體語言使用環境；聯發科集團旗下所屬的前瞻技術研究單位聯發創新基地、中央研究院詞庫小組與國家教育研究院三方組成的研究團隊宣布，將開放全球首款繁體中文語言大型模型到開源網站進行測試，此次釋出的繁體中文大型模型以開源 BLOOM 模型為基礎，相較當前可用的最大繁體中文模型大 1,000 倍，所使用的訓練資料也高出 1,000 倍，當前開放外界下載，可用於包括問答系統、文字編修、廣告文案生成、華語教學與客服系統。目前開

Chevelle.fu

微軟新版 Bing 搜尋服務整合 OpenAI 人工智慧技術未來也會持續導入 OpenAI 下一代大型人工智慧語言模型

在整合OpenAI技術部分，新版Bing搜尋服務更可利用人工智慧自動生成功能，藉此協助使用者找到更多解答，或是完成相關規劃。例如使用者可以透過新版Bing搜尋服務規劃旅遊行程，系統就會依照預計前往地點、時間自動產生符合需求的飛機航班、住宿，甚至旅遊過程推薦觀光行程等。在於美國總部舉辦活動上，微軟宣布在新版Bing搜尋服務整合OpenAI旗下人工智慧技術，將可藉由大型人工智慧語言模型更深入理解使用者實際需求。同時，微軟更透露未來更新的Bing搜尋服務，將會加入OpenAI下一代大型人工智慧語言模型，亦即先前有不少傳聞的GPT-4。在此次更新的Bing搜尋服務中，微軟表示採用名為「Promet

Mash Yang

照片中提到了道永續發展、吉原料,、装置，跟三星集團有關，包含了美女、黑髮、皮膚、頭髮、長發

三星 Galaxy S23 系列搭載 Snapdragon 8 Gen 2 for Galaxy 登場，採用更多永續材質與一致性設計語言並支援星空攝影、多重曝光等模式

三星在 2023 年上半年的 Unpacked 活動公布新一代 Galaxy S23 系列，維持與前一代相同的三機型陣容，包括集結既有 Galaxy S 與 Galaxy Note 技術大成的 Galaxy S23 Ultra ，以及主流旗艦 Galaxy S23+ 、 Galaxy S23 ；相較 Galaxy S22 呈現兩種不同的設計語言， Galaxy S23 系列採用統一的極簡與鏡頭凸顯設計語言，使產品更具家族一致性，同時 Galaxy S23 也帶來更強的像機體驗，同時強調相較上一世代使用更多的永續材質，此外也帶來更多的拍攝功能，其中 Galaxy S23 Ultra 還搭載達 2

Chevelle.fu

照片中提到了DeepMind，跟深心有關，包含了谷歌深度思維、人工智能、機器學習、深度學習

編劇要失業？DeepMind 公布劇本編寫人工智慧語言模型「Dramatron」輸入簡單條件之後即可創作完整劇情內容

DeepMind表示「Dramatron」訓練資料來源多半來自網路內容、新聞、書籍等內容，因此產生腳本內容可能還是會有偏見或冒犯文字等情況，甚至可能出現侵權內容，因此建議使用者利用「Dramatron」進行創作時，依然要作內容檢視，避免造成更大影響。 DeepMind近期對外公布新款人工智慧語言模型「Dramatron」，將能在使用者輸入簡單條件之後，即可快速建構完整電影或劇情腳本。依照說明，「Dramatron」利用階層化應用語言模型框架，透過分析使用者輸入基本劇情摘要，即可透過一系列內容建構，進而完成一部電影或劇情腳本，甚至連劇名、角色、劇情節奏、地點描述與對話內容都能完整列出，而使用者

Mash Yang

可能改變 AI 產業的更聰明 GPT-4 類神經網路語言模型即將推出可能全面通過圖靈測試

雖然過去有不少人工智慧系統標榜通過圖靈測試，但主要是在滿足特定情況之下，而相關看法認為OpenAI接下來準備推出的GPT-4，將會成為第一款全面通過圖靈測試的人工智慧系統。相關消息指稱，由OpenAI推動、基於Google翻譯語言模型為基礎，並且納入超過1750億組參數的GPT-3類神經網路語言模型，最快將會在今年12月推出名為GPT-4的全新版本，而最晚則會在明年2月以前推出。在2020年5月推出GPT-3類神經網路語言模型之後，OpenAI執行長Sam Altman曾在今年4月時透露，GPT-4類神經網路語言模型將在未來幾個月內推出，今年9月則有分析師認為此模型最快會在今年底問世，同時

Mash Yang

熱門文章