NVIDIA獨立於COMPUTEX 2024大會主題演講前的週日晚間,由執行長黃仁勳於台大體育館親自主持主題演講;這場主題演講可視為黃仁勳回報給台灣產業供應鏈、政府機關與研究單位長期合作的深情告白,無論是開場與台灣科技產業大老走訪夜市的前導影片,台灣科技公司如何應用其技術,還有中央氣象局的氣象預報專案計畫,再再強調NVIDIA與台灣密不可分,也多次感謝台灣產業鏈與NVIDIA攜手共進,同時活動中許多的短片的中文解說,則是透過黃仁勳的聲音訓練的合成語音,黃仁勳還打趣的說她的中文說得不夠好怕詞不達意,只好自己撰稿讓AI代勞。





呼應這場活動的受眾還包括開放抽選的一般民眾,黃仁勳選擇不同於GTC大談新硬體架構的深度技術內容,改以深入淺出的方式,搭配較為柔和的圖像視覺,希冀能使具有基本概念的科技愛好者也能理解的NVIDIA與AI的發展歷程,以及NVIDIA的GPU加速與AI能帶來什麼變革。



關於NVIDIA、加速運算與AI的淵源已經不是甚麼新故事,簡單節錄黃仁勳簡報中的幾個重點;首先是運算技術由IBM揭開序幕至今發展已有60年的歷史,而NVIDIA在2006年推出基於CUDA的GPU加速運算,然而在當時運算產業x86 CPU至上的環境下不被看好,但NVIDIA仍持續投入CUDA軟體資源等待黎明。



然而隨著2012年開發者透過CUDA與深度學習技術突破AlexNet機器視覺測試紀錄後,一夕之間CUDA成為AI技術的新寵,然而當時的深度學習與機器學習的AI技術主要應用於理解與辨識,後續也再次被唱衰無法有更突破性的發展;不過NVIDIA也沒只等著坐享其成,除了強化軟體與AI的結合,也透過創新的GPU架構、技術,以及發展與收購能與加速運算相輔相成的技術,而後在2023年由OpenAI釋出ChatGPT展現CUDA加速運算於生成式AI的優勢後,再度掀起AI技術浪潮。



黃仁勳提到,生成式AI是透過大型語言模型的方式將AI技術進一步昇華到理解與創造,生成式AI能夠理解人類的需求與想法,並設法將其轉化為原創的內容,或是協助人類自繁瑣的海量資料中彙整出可以理解的答案;黃仁勳也再度重申AI工廠的概念,表示生成式AI技術將會使得資料中心與雲端服務成為產出Token(詞元)的AI工廠,不同於現行以CPU為首的「軟體工廠」,人類需要熟捻專業的軟體技術才能產生內容,在AI工廠的世代,人類不再需要學習程式語言,僅須發揮在特定領域的專業,諸如工業設計、建築、機構等,就能透過與AI的自然語言互動,由AI協助產生Token,並化為人類可能需要的內容。


為此,NVIDIA在2024年的GTC大會公布NIM微服務,將NVIDIA在各項領域的AI技術打包後,使開發者可透過雲端節點取得預先訓練的不同領域AI模型,在透過針對不同情境的最佳化調整後,即可透過雲端服務商、資料中心、工作站佈署AI應用,且透過NVIDIA在CUDA架構的一致性,也不需針對不同的硬體環境重新編寫,同時開發者可透過全球性的服務網路取得資源。NVIDIA也藉機宣布基於Meta最新大型語言模型的Liama3-NIM微服務已經在今天於釋出。








當然,NVIDIA也不忘來一段近年必備的「The More You Buy,The More You Save」,直接透過圖表的方式呈現以1.5倍的設備支出、3倍的能耗換來100倍的性能提升;同時也以NVIDIA在8年以來的技術進展,以GPT-4 1.8T參數大型語言模型的訓練與推論比較NVIDIA新一代Blackwell架構與平台如何省下巨量的能耗,在模型訓練能將能耗縮減至1/350,而推論Token的能耗則減少至1/45,000。






在活動的尾聲,則是播放一段NVIDIA、黃仁勳與台灣科技產業十數年以來的交情,強調NVIDIA、黃仁勳不僅與台灣產業,更對台灣這塊土地所具備的深厚情感。