NVIDIA GTC Taiwan 2015 : Deep Learning 蓄勢待發,盼能帶動產業變革

2015.09.01 04:36PM
1129
是NVIDIA GTC Taiwan 2015 : Deep Learning 蓄勢待發,盼能帶動產業變革這篇文章的首圖

NVIDIA 連續兩年在台灣舉辦 GTC 台灣場次,而今年的場次相較去年更為豐富,且也如今年在 San Jose 舉辦的 GTC 2015 一樣加入大量機器學習與深度學習的課程。在稍早的媒體見面會也把重點放在與機器視覺、機器學習相關的講者交流,並希望藉此更推廣 GPU 於深度學習相關領域的應用。

當然以整體趨勢來說,機器學習與深度學習並不是新的概念,但就像今年 GTC 2015 主題演講所述,機器學習與深度學習在導入基於 GPU 的平行運算之後,效能與運算能力大幅提升,加上各類感測器蒐集大量的數據做為基礎資料庫,使機器學習與深度學習獲得驚人的突破,也更深深地影響日常生活。

NVIDIA 今年在 GTC 2015 與機器學習、 Deep Learning 相關文章可參閱以下:

GTC 2015 :結合平行運算、模仿人類感知的深度學習,正醞釀一波人工智慧革命

GTC 2015 :百度首席科學家談深度學習如何協助今日的圖像、語音與行為認知

GTC 2015 : Google 資深科學家暨工程師 Jeff Dean 用深入淺出的方式介紹深度學習

45f1f14f04de5450219f223f73ec1257

今天也請到 WeChat 在微信擔任技術顧問的香港科技大學計算機系主任楊強博士講述機器學習對於微信的影響;若有經常使用熱門即時通訊軟體,都會漸漸感受到目前的即時通訊軟體已經不光只是提供雙方兩造的即時通訊,包括代表企業與公共事務的公共帳號、電子商務服務、電子支付服務等服務上線後,儼然已經成為一個生態鏈,尤其微信在中國更是如此。

也因為微信在中國有高達 6 億的每日活躍用戶,也充分提供機器學習相當重要的素材,從最基本的使用者個人性別、年齡,到使用者分享資訊類型、服務使用情況、電子商務交易行為、語音與圖片的分享,都足以作為龐大的機器學習素材。

b09a34fabcd0cb0d2a356c4f0d20d5af

c8c009a4cf538e36151006dcb2ad807b

同時對於精準行銷,具社群平台特質的微信也能藉由加入好友圈共同討論話題、以及使用者使用習慣等特質等,作為廣告投放的參考,使廣告商、企業帳號在針對使用者進行廣告行銷推廣時,能使結果更精確。

a851a612c4e10595ddf8b7ece8e8b083

1220b074f220f4127456fc738d9750b3

同時微信也將其平台的應用加入群體智慧的概念,推出"為盲胞讀書"的有聲書彙整服務,利用使用者自發的閱讀有聲書的片段,並且藉由平行運算系統進行聲音的處理、判斷朗讀的內容精準度等條件進行篩選,最終將這些分段朗讀的片段整理成完整的有聲書,集群體之力提供給盲胞更多有聲書內容。

a5b808a8cdf47ea23d2b261175af6f88

f8d7e7c0f3bb149c8245307fe9b05a50

微信也再利用機器學習的聲音比對功能做出兩個有趣的延伸應用,首先是藉由聽到音樂時搖動手機,以麥克風蒐集外界聲音並且進行降噪處理以及分析,找出正在聆聽的音樂供使用者下載;另一個則是用以判斷正在收看的電視內容,藉此推薦使用者加入節目官方帳號,在結合使用者當下與官方帳號或是好友的傳訊,使節目製作者可分析收看族群,能夠給予廣告主針對收視戶特性的投放建議,以及作為即時互動遊戲的參考。

07c5da6e45e8db5443fdadf155b99200

8de7bff5c10e899a0c8f70a4a95068a8

至於影像識別功能方面,微信將其用於拍攝的物體辨識,提供例如結合店家的促銷、購物等活動,以及對準電影海報時可提供 AR 相機的應用等。

526238ffa5a0c0add5f72c453a8ba0e2

最後一個案例則是提供自然語言系統,因為微信有大量的服務內容,可由使用者的使用行為、對話語言等資訊建立人工智慧資料庫,能夠使人工智慧助手根據使用者的發問以及使用行為進行宛如人與人對話的內容,使人工智慧不再是冰冷的機械式文字敘述。

2fdd2ac8df83f5aa5931e9f3549c0bb4

接在楊教授之後的是 UMBO CV 的技術長 PL 張, UMBO CV 是一家技術導向的新創公司,他們的產品目標是打造一套簡單易用的雲端商用級監控系統平台;張技術長表示,目前的監控平台多半仰賴系統整合商以來自不同供應商的監控攝影機與中央儲存管理整合,但是系統整合度以及使用性並不友善。

以目前的商務監控系統,監視器是將資料彙整到中央儲存管理系統,再透過近端或是遠端的方式連接到中央儲存管理系統進行監看;然而這樣的問題是一旦系統發生錯誤,還得需要找出到底是監視器端還是管理平台出現問題,其次是當管理平台一壞,整套系統就等於失去效用。

UMBO CV 的概念是透過高效能且自帶儲存能力的連網攝影機,結合背後的雲服務平台,打造一套攝影機即端點的雲端系統;這套概念在硬體架構由於智慧手機帶動行動運算與行動連網革命後並不難,關鍵則在後台的雲服務上。

光是把資料同步到雲端並進行監控並不是大問題,然而透過人力監控卻是很大的問題,因為看過太多的案例顯示,負責監控的中央管理人鮮少能在事發當下就能察覺,通常都是出事之後才去調閱監控錄影帶;所以 UMBO CV 希望藉由雲端的機器學習系統自動進行監控與警告,同時也讓架設者達到隨插即用。

這套平台的挑戰有三點,首先是及時的影像串流,其次是及時的影像播放,這兩項需要達到低於一秒的延遲,最後就是最重要的人工智慧系統;這套平台是藉由機器學習平台做為場景判斷的基礎,可針對監控的環境進行場景識別、情境識別以及異常狀況偵測。

這個部份說來簡單,不過卻需要相當強的演算力,以人腦來說,大約有 200 億個神經元,且光是負責底層影像就有一千四百萬個神經元,是故得藉由 GPGPU 的運算力才能達到模擬人類視覺影像的能力;而 UMBO CV 強調,由於各國環境差異,它們在影像訓練資料庫並不打算採用既有的資料庫進行訓練,否則可能會由於各國對於如辦公室、賣場的布置差異產生判斷的誤差,對於 UMBO CV 打算供隨插即用的理念並不吻合。

ca391fdeb6f74b20300d178bf75e0997

最後一位講者則是先前在 Indiegogo 大紅的智慧餵貓器 CATfi 的奇群科技聯合創辦人林志達, CATfi 是一套藉由安裝感測器並且連接到雲端的貓咪餵食系統,其目的是藉由貓的飲食習慣判斷貓咪的健康狀態。

至於為何選擇貓而非狗?主要的原因在於貓咪不像狗在生病時會有明顯的表現,貓咪在生病時往往故作鎮定,但當貓咪出現顯著的病態時都已經為時已晚,很可能送醫後即便治好也得花上數十萬,所以才有了設計這套系統的發想。

88221580f8f8ac685cd918b1728ae24d

這套餵貓器包括前端的磅秤、水量、餐量的監控,以及作為辨識貓咪的貓咪臉部辨識系統構成,透過貓咪的體重、用餐情況上傳到雲端平台後,作為監測貓咪健康的依據。

d0ee2b51b6a747bfa22674bae44e245e

而貓咪臉部辨識系統對於這套平台是非唯一選擇,但卻是使整體使用體驗更好的方式,因為一般的邏輯可能會利用項圈的 RFID 標籤作為判斷貓咪的方式,但這樣就非得為貓咪戴上項圈,透過貓咪臉部識別則不需要這樣的程序。當然這也意味著後端的資料庫需要針對貓咪的特徵進行複雜的演算比對,否則當家中有兩隻以上花色相近的貓咪就無法正確判斷,這些就得需要以機器學習與機器視覺平台構成。

f3d727c53f50ac387b1197f4ea2ab62d

c32ec1d145660d4a9a0a9c88974ef663

在活動會場的展示區也展示了包括 VDI 虛擬化平台 DIGITS 平台DRIVE PX 等 NVIDIA 近期重點產品與服務,不過較為可惜的是被 NVIDIA 視為重點項目的 DRIVE PX 由於台灣汽車產業較不盛行,並未有更進一步的展示,然而預計 GTC Japan 會有為數相當的技術與應用展示。

--

或許你會對於這堂 Udmey 線上教學課程感到有興趣

教學完全指南:一步一步上手 Adruno

--

你或許會喜歡

最優惠3C家電福利品低家啦!

熱門影音產品出清49折起!

回應 0
新品資訊
改良舊式缺點,多了二片更方便的皮夾
Twelve
5 個小時前

熱門文章

最新消息

本日精選