中國近年的新創熱潮還未熄滅,而 NVIDIA 在今年 GTC 活動中也安排三家不同領域的新創公司介紹他們將如何利用 GPU 加速顛覆產業,包括無人機公司 BriSky , VR 視訊直播的先驅 CGangs ,以及影像辨識公司 SenseTime 。
原本中國就有相當多的無人機產業,不過 BirSky 則利用具深度學習能力的 Jetson TX1 打造新一代的智慧無人機,今天展示的包括他們新款的小型工業級無人機以及一款小型化娛樂級的無人機。
相較於既有的無人機,雖然多家廠商都標榜具備追蹤與障礙判斷的能力,然而透過 Jetson TX1 上的 Tegra X1 應用處理器, BriSky 的無人機更多了學習式的影像辨識與飛行路徑規劃能力,除了追蹤特定的人、物進行飛行以外,當遇到前方有障礙物時,更可主動分析前方障礙物類型,並進行迴避的動作;同時也能利用智慧學習的方式達到隨拋即飛,以及分析使用者的手勢進行降落、靠近等互動行為。
至於 CGangs 雖是 2013 年成立的中國新創公司,然而對於 VR 直播可說是先驅,例如先前韓國團體 BigBang 在澳門的演唱會,甚至奧斯卡頒獎典禮的直播,都是由他們承包;而他們的訣竅則是在於 VR 直播的攝影機與工作站。
他們在初期也研究過利用既有的運動相機作為 VR 直播攝影機,但發現影像品質、連續運作能力都未達影視直播的要求,故自行研發 VR 直播攝影機,最新的 Argus Panoptes VR 攝影機系統不僅搭載大片幅元件,更採用可交換鏡頭設計;為了乘載 4K VR 直播的影像需求,他們藉由搭載 Quadro M6000 的行動工作站進行即時的影像編碼處理,能輸出 4K 60P 的 h.264 或是 h.265 VR 影像。
至於 SenseTime 的 SenseFace 則是以基於動態與機器學習的人臉辨識系統,希望能應用在公眾安全監控、失蹤人口協尋或是商業級的 VIP 辨識應用領域;他們透過雙路的 Tesla K80 進行加速,強調單一機器可進行 16-32 路的動態影像輸入,同時在學習樣本採用動態影像取代傳統以靜態圖片的方式,辨識成功率可達 95% 以上,重點在於相較傳統 CPU 平台,學習 3,000 萬人樣本,可將原本一個月的學習時間縮減至 1 天內。
你或許會喜歡