微軟應該要感謝大家鼎力支持 How-Old.net ,因為他們因此獲得可觀的深度學習素材(更新:微軟強調不會保存與分享使用者上傳照片但保留分析資料)

2015.05.04 01:51PM
3859

微軟上週推出了基於機器學習的 How-Old.net 照片年齡分析服務,相信不少人也都玩的不亦樂乎吧?不過在大家對微軟推出這樣的服務感到新奇有趣時,微軟才真的是最該感謝上傳所有照片的使用者,因為機器學習的基礎,就是大量的有效素材。

在今年 NVIDIA 舉辦的 GTC 活動當中,基於機器學習的深度學習 Deep Learning 議程是相當火熱的主要議題,而且可說今年在 GTC 所宣布的所有產品、技術,都與深度學習環環相扣;由於 2012 年深度學習被實證在技術上因平行運算得以突破,故被視為機器學習當中的顯學,也在這一兩年持續突破,幾乎各大網路服務都投入深度學習的技術開發。

更新微軟聲明:

微軟到底會不會把使用者上傳的照片存下來? 真的不會!以下是官網上的說明:

「我們收到了一些使用者的提問,因此更新這篇文章說明我們的立場。回答使用者最關心的第一個問題:我們不會儲存也不會分享使用者的照片,使用者所上傳的照片只供猜測其年齡和性別。只要在網站猜出年齡後,使用者所上傳的照片就會從記憶體中去除。即便許多網路服務供應商都在服務條款中表明會蒐集並儲存使用者的資訊,但微軟選擇維護使用者的資訊,除了短暫辨識照片年齡的使用時間外,微軟絕不會儲存或分享使用者的照片。」

那麼,您一定會問,真的嗎?照片一直不斷上傳至網站,微軟若不存起來要怎麼分析、怎麼學習呢?問的好!重點來了,分析的關鍵即是大數據即時分析的神妙之處!別忘了微軟還有個秘密武器Azure!

資料的匯集跟派送可以用 Azure Event Hubs ,一秒鐘可進出幾百萬份資料,您的照片不會被存下,微軟存下的是從照片萃取出來的資料。這又是什麼資料呢?據說是名為「顏值」 的資料,或許就是青春的軌跡吧。所以請大家儘管放心,您的照片絕不會被留下來。

GTC 深度學習相關文章:

1:GTC 2015 :結合平行運算、模仿人類感知的深度學習,正醞釀一波人工智慧革命

2:GTC 2015 : Google 資深科學家暨工程師 Jeff Dean 用深入淺出的方式介紹深度學習

3:GTC 2015 :百度首席科學家談深度學習如何協助今日的圖像、語音與行為認知

關於深度學習的基本原理與應用可見先前 NVIDIA GTC 2015 撰寫的相關文章;不過筆者這篇要談的是微軟架設這個網站的可能原因以及大家為微軟貢獻了些甚麼。深度學習畢竟還是機器學習的一部分,雖然具備自主學習的能力,不過仍相當仰賴初期的有效學習素材。

也就是說,藉由 How-Old.net ,大家給了微軟大量的學習素材原料;可以推測的是,微軟這套系統已經受過基本的性別年齡判斷能力,然而對於微軟來說,他們也許認知本身能夠給予的學習素材有限,所以無法達到更正確的判斷結果,所以要使人工智慧邏輯更上一層樓,也就需要更多元的有效素材。

所以大家上傳到 How-Old.net 的照片也就成了微軟未來用以訓練年齡、性別的系統的訓練材料,畢竟透過這個網站,微軟可獲得不同人種、不同年齡層的人像照片,也可使學習素材更多元,使系統判斷能力更好。

那這套系統可以做甚麼?以筆者直覺認為最有效率的應用應該會是用在廣告應用,其中包括網頁社群廣告與互動看板廣告兩種應用;網頁社群廣告可藉由使用者自身的大頭貼、上傳的人物照片,而互動式看板則可透過內建的攝影機進行即時的雲端分析,解析使用者與觀看者的年齡層與性別,藉此推送合適的廣告內容。

尤其在互動看板的應用,先前就有不少廠商標榜具備閱聽者年齡、性別分析能力,不過由於平台不見得是基於深度學習,或是無人持續提供有效素材使系統精度提升,導致判斷能力始終卡在一個階段;而微軟的做法卻能夠使系統獲得大量的素材資料,當系統性能達到一定水準後,即可藉由雲連接的方式將系統推送給廣告客戶與互動看板廠商。

當然依照微軟的作法,上傳的這些照片只是微軟作為內部素材應用,不會將這些照片作其它的商業使用,如果只是單純使用 How-Old.net 計算且不分享,理論上也不該因此可透過 Bing 的搜尋引擎輕易的找到這些照片,只不過在使用的時候,也應該要有這些照片未來會成為微軟深度學習系統用的素材的心理準備。

你或許會喜歡

【獨家】iOS/Android/Windows三平台都可使用的行動鍵盤

今年送給朋友最科技最宅的禮物!

回應 1

1 則回應