科技應用 微軟 OpenAI GPT-4 ChatGPT 大型語言模型 OpenAI 推出 GPT-4 語言模型 強化圖像識別與互動能力 OpenAI發布GPT-4,具圖像識別、多模輸入設計與自訂回應風格,提升真實性及可靠性,應用於微軟新工作模式。 隨著Google表示在Workspace導入生成式人工智慧技術之後,OpenAI趕在微軟即將展開發表活動前,正式宣布推出全新GPT-4大型語言模型。 相較先前推出的GPT-3.5主要針對文本內容進行理解與快速反應,OpenAI表示GPT-4將能針對圖像內容進行識別理解,並且進一步生成互動文本內容。同時,雖然在整體表現仍不比人類大腦,但在特定專業與學術理解已經能趕上人類理解能力。 除了先前的文本內容理解與此次增加圖像內容識別理解功能,新版GPT-4模型更強化多模輸入設計,將能進一步識別 Mash Yang 2 年前
科技應用 Google 翻譯圖像 網頁版 Google 翻譯終於支援以上傳方式翻譯圖像文字 方便理解不同語言內容 支援語言部分,則總計對應113種語言識別效果,並且能將識別結果翻譯成總共133種語言,另外翻譯後的文字內容也能複製,或是保存紀錄。 行動版Google翻譯很早就能藉由Google Lens技術翻譯圖像形式的文字內容,Google稍早也正式宣布將此項功能帶到網頁版Google翻譯。 使用方式基本上與行動版相同,只是網頁版主要還是透過上傳影像或擷圖內容,讓系統能自動識別圖像內容對應文字。 而支援語言部分,則總計對應113種語言識別效果,並且能將識別結果翻譯成總共133種語言,另外翻譯後的文字內容也能複製,或是保存紀錄。 在近期公布消息中,Google表示其結合人工智慧與深度學習技術的語言翻譯功能, Mash Yang 2 年前
科技應用 Google OpenAI Whisper Google 通用語言模型研究結果公布 強調比 OpenAI 的 Whisper 有更好語意理解表現 在美式英語的理解表現中,Google更說明其通用語言模型相比其他先進語言模型的單詞錯誤率更低,正確率甚至提高6%比例,相比OpenAI提出的大型語言模型Whisper對應的18種語言,其單詞錯誤率平均在32.7%,而Whisper的單詞錯誤率平均在40%以下。 Google稍早公布其去年11月投入的通用語言模型研究結果,其中加入長達1200萬小時語音內容長度,以及280億組訓練參數,同時對應超過300種語言,目前已經能支援超過100種語言識別,未來目標可支援超過1000種語言。 依照Google說明,其通用語言模型採持續自我監督學習,並且不斷進行微調,藉由BEST-RQ演演算法在無外部監督情況 Mash Yang 2 年前
科技應用 微軟 OpenAI ChatGPT Kosmos-1 微軟多型態大型語言模型「Kosmos-1」發表 可同時理解文字與圖像內容 往全能型人工智慧技術發展邁進一大步 許多人其實也對全能型的人工智慧技術發展表示擔憂,認為發展過度「聰明」的人工智慧,有可能加速影響人類既有生活模式,甚至可能導致人類滅亡,但也有看法表示此類擔憂純屬多慮,認為此類技術發展過程仍會加上諸多保護機制,避免人工智慧影響加劇。 雖然近期與OpenAI合作將ChatGPT技術應用在新版Bing搜尋服務等產品,但微軟顯然並未停下自行建構大型語言模型的腳步。在稍早公布名為「Kosmos-1」的多型態大型語言模型,將能同時理解文字與圖像內容,藉此對應更複雜、多元的人工智慧技術應用。 微軟表示,用於訓練「Kosmos-1」資料同樣源自網路,同時為了讓「Kosmos-1」能進一步理解圖像內容,研究人員 Mash Yang 2 年前
科技應用 youtube YouTube 增加多種語言聲道選項 增加更多影片觀看率 YouTube在此次增加多種語言聲道選項,將能在原本影片呈現語言之外,增加更多語言選項,藉此讓不同語言觀眾也能輕易觀看。 在稍早更新中,YouTube表示針對創作者新增在影片提供多種語言聲道選項,藉此讓不同語言觀眾能更容易觀看影片。 雖然YouTube很早就增加字幕功能,甚至提供字幕翻譯選項,讓不同語言觀眾可以輕易觀看各國地區創作者上傳影片,但不免還是要一直盯著字幕才能理解影片內容。 因此,YouTube在此次增加多種語言聲道選項,將能在原本影片呈現語言之外,增加更多語言選項,藉此讓不同語言觀眾也能輕易觀看。 YouTube其實在過去一年內已經向少數創作者提供測試此功能,並且說明增加多語言聲道 Mash Yang 2 年前
產業消息 AI 繁體中文 連發科 中研院 大型語言模型 BLOOM 聯發科與中研院、國教院合力開發以千億參數的繁體中文 AI 語言生成模型開放開源下載 對於台灣或是香港的搜尋與 AI 翻譯使用者,應該都會對於多數語言模型別說是分辨香港繁體或是台灣繁體,甚至簡繁用語也完全不分的情況感到頭痛,不過未來繁體中文使用者有望獲得更好的 AI 繁體語言使用環境;聯發科集團旗下所屬的前瞻技術研究單位聯發創新基地、中央研究院詞庫小組與國家教育研究院三方組成的研究團隊宣布,將開放全球首款繁體中文語言大型模型到開源網站進行測試,此次釋出的繁體中文大型模型以開源 BLOOM 模型為基礎,相較當前可用的最大繁體中文模型大 1,000 倍,所使用的訓練資料也高出 1,000 倍,當前開放外界下載,可用於包括問答系統、文字編修、廣告文案生成、華語教學與客服系統。 目前開 Chevelle.fu 2 年前
科技應用 微軟 bing OpenAI ChatGPT New Bing 微軟新版 Bing 搜尋服務整合 OpenAI 人工智慧技術 未來也會持續導入 OpenAI 下一代大型人工智慧語言模型 在整合OpenAI技術部分,新版Bing搜尋服務更可利用人工智慧自動生成功能,藉此協助使用者找到更多解答,或是完成相關規劃。例如使用者可以透過新版Bing搜尋服務規劃旅遊行程,系統就會依照預計前往地點、時間自動產生符合需求的飛機航班、住宿,甚至旅遊過程推薦觀光行程等。 在於美國總部舉辦活動上,微軟宣布在新版Bing搜尋服務整合OpenAI旗下人工智慧技術,將可藉由大型人工智慧語言模型更深入理解使用者實際需求。同時,微軟更透露未來更新的Bing搜尋服務,將會加入OpenAI下一代大型人工智慧語言模型,亦即先前有不少傳聞的GPT-4。 在此次更新的Bing搜尋服務中,微軟表示採用名為「Promet Mash Yang 2 年前
新品資訊 三星 高通 光線追蹤 Galaxy S23 ISOCELL HP3 Galaxy S23 Ultra Snapdragon 8 Gen 2 for Galaxy Galaxy S23+ 三星 Galaxy S23 系列搭載 Snapdragon 8 Gen 2 for Galaxy 登場,採用更多永續材質與一致性設計語言並支援星空攝影、多重曝光等模式 三星在 2023 年上半年的 Unpacked 活動公布新一代 Galaxy S23 系列,維持與前一代相同的三機型陣容,包括集結既有 Galaxy S 與 Galaxy Note 技術大成的 Galaxy S23 Ultra ,以及主流旗艦 Galaxy S23+ 、 Galaxy S23 ;相較 Galaxy S22 呈現兩種不同的設計語言, Galaxy S23 系列採用統一的極簡與鏡頭凸顯設計語言,使產品更具家族一致性,同時 Galaxy S23 也帶來更強的像機體驗,同時強調相較上一世代使用更多的永續材質,此外也帶來更多的拍攝功能,其中 Galaxy S23 Ultra 還搭載達 2 Chevelle.fu 2 年前
科技應用 DeepMind OpenAI Dramatron 編劇要失業?DeepMind 公布劇本編寫人工智慧語言模型「Dramatron」 輸入簡單條件之後即可創作完整劇情內容 DeepMind表示「Dramatron」訓練資料來源多半來自網路內容、新聞、書籍等內容,因此產生腳本內容可能還是會有偏見或冒犯文字等情況,甚至可能出現侵權內容,因此建議使用者利用「Dramatron」進行創作時,依然要作內容檢視,避免造成更大影響。 DeepMind近期對外公布新款人工智慧語言模型「Dramatron」,將能在使用者輸入簡單條件之後,即可快速建構完整電影或劇情腳本。 依照說明,「Dramatron」利用階層化應用語言模型框架,透過分析使用者輸入基本劇情摘要,即可透過一系列內容建構,進而完成一部電影或劇情腳本,甚至連劇名、角色、劇情節奏、地點描述與對話內容都能完整列出,而使用者 Mash Yang 2 年前
科技應用 AI OpenAI GPT-3 GPT-4 可能改變 AI 產業的更聰明 GPT-4 類神經網路語言模型即將推出 可能全面通過圖靈測試 雖然過去有不少人工智慧系統標榜通過圖靈測試,但主要是在滿足特定情況之下,而相關看法認為OpenAI接下來準備推出的GPT-4,將會成為第一款全面通過圖靈測試的人工智慧系統。 相關消息指稱,由OpenAI推動、基於Google翻譯語言模型為基礎,並且納入超過1750億組參數的GPT-3類神經網路語言模型,最快將會在今年12月推出名為GPT-4的全新版本,而最晚則會在明年2月以前推出。 在2020年5月推出GPT-3類神經網路語言模型之後,OpenAI執行長Sam Altman曾在今年4月時透露,GPT-4類神經網路語言模型將在未來幾個月內推出,今年9月則有分析師認為此模型最快會在今年底問世,同時 Mash Yang 2 年前