少兒編程 > 文章資訊 > 機器人 > 蘋果AI總監(jiān)談人工智能:對強化學(xué)習(xí)很感興趣
蘋果AI總監(jiān)談人工智能:對強化學(xué)習(xí)很感興趣
童程童美 2017-03-31
雖然人工智能在圖像識別和產(chǎn)品推薦等方面取得了巨大的進(jìn)步,但是這項技術(shù)仍然面臨諸多挑戰(zhàn),特別是如何讓AI系統(tǒng)擁有“記憶功能”依然是一個難題。
摘要雖然人工智能在圖像識別和產(chǎn)品推薦等方面取得了巨大的進(jìn)步,但是這項技術(shù)仍然面臨諸多挑戰(zhàn),特別是如何讓AI系統(tǒng)擁有“記憶功能”依然是一個難題。
本周二(3月28日),蘋果的AI研究部門的總監(jiān)Ruslan Salakhutdinov在MIT Technology Review會議上探討了人工智能的局限性,不過他并未提及蘋果是怎樣將人工智能整合到Siri等產(chǎn)品中的。
Salakhutdinov于去年10月加入蘋果,他稱自己對強化學(xué)習(xí)(Reinforcement Learning)非常感興趣, 利用這種技術(shù)可以教會計算機通過反復(fù)優(yōu)化決策來獲取最好的結(jié)果。例如,谷歌就使用了強化學(xué)習(xí)來幫助數(shù)據(jù)中心達(dá)到最佳的散熱和操作配置,從而使其更加節(jié)能。
卡耐基梅隆大學(xué)(Salakhutdinov是該大學(xué)的副教授)的研究人員最近也在做這方面的研究:使用強化學(xué)習(xí)訓(xùn)練計算機玩上世紀(jì)90年代的視頻游戲“Doom”。很快,計算機就學(xué)會了如何快速并準(zhǔn)確地射擊外星人,而且還發(fā)現(xiàn)閃避能夠躲開敵人的火力。但是,它并不擅長記憶,比如記不住迷宮的布局,這使得它無法事先規(guī)劃和制定游戲策略。
Salakhutdinov的研究涉及到一種AI軟件,它能夠記錄“Doom”中的虛擬迷宮布局以及各個參考點,以便定位特定塔樓的位置。在游戲過程中,該軟件首先會判斷火炬的顏色(紅色或者綠色),然后根據(jù)火炬的顏色定位相應(yīng)顏色的塔樓。
最終,這個軟件學(xué)會了如何在迷宮中找到正確的塔樓。而且當(dāng)它發(fā)現(xiàn)自己找到的是錯誤的塔樓的時候,還會原路返回,尋找正確的塔樓。特別值得注意的是,該軟件在每次發(fā)現(xiàn)塔樓時都能夠回憶起火炬的顏色,Salakhutdinov解釋道。
不過,Salakhutdinov表示,這種類型的AI軟件需要“很長的訓(xùn)練時間”,而且還需要強大的計算能力,因此難以擴大規(guī)模。
此外, Salakhutdinov想要探索的另一個領(lǐng)域是:教會AI軟件通過“更少的樣本和經(jīng)驗”達(dá)到更快的學(xué)習(xí)速度。盡管沒有在演講中提及,但是他的這一設(shè)想顯然有利于蘋果在更短的時間內(nèi)創(chuàng)造更好的產(chǎn)品。
一些AI專家和分析師認(rèn)為,由于蘋果公司的隱私規(guī)則更加嚴(yán)格,限制了可用于訓(xùn)練AI系統(tǒng)的數(shù)據(jù)量,因此蘋果的AI技術(shù)不如谷歌和微軟等競爭對手。Fortune認(rèn)為,如果蘋果一直使用較少的數(shù)據(jù)來訓(xùn)練AI系統(tǒng),那么它或許能在滿足隱私要求的同時,仍然能夠像競爭對手那樣快速對軟件進(jìn)行改進(jìn)。