2015/2/24 09:45 案例 - 人工智慧 網路 宮本和明   2434  

谷歌擁有全球最尖端的人工智慧技術,並將其運用在了語音搜索等領域。擁有這種技術的谷歌收購了人工智慧新創企業“DeepMind”,開始加快增強技術實力的步伐。儘管與DeepMind有關的資訊有限,但仍然可以通過視訊及論文等,了解這項技術的大致情況。

DeepMind是一種能以驚人的速度自主學習的人工智慧技術,谷歌正在考慮將其應用到自動駕駛車等領域。同時,美國也出現了人工智慧會淩駕於人類之上的威脅論,有關安全性的討論日益激烈。

DeepMind的概要

DeepMind是總部位於倫敦的新創企業,由戴密斯•哈薩比斯(Demis Hassabis)等人於2010年創立。因為只需看一下視訊遊戲,就能以驚人的速度學會玩法,DeepMind讓全球為之震驚。該公司於2014年1月被谷歌收購,現在則作為“Google DeepMind”推進研發工作。同時,谷歌也開始著手將DeepMind植入YouTube等產品中。

可以廣泛學習的系統

谷歌CEO拉瑞•佩奇(Larry Page,上圖右側)在脫口秀主持人查理•羅斯(Charlie Rose,上圖左側)的訪談節目中,介紹了DeepMind的功能和谷歌的人工智慧戰略。佩奇表示,DeepMind是速度驚人、無需人類協助即可自主學習的系統。因此,DeepMind可以創造出超過人遊戲高手的分數。

DeepMind並不是按照每個遊戲來優化軟體,而是可以通過單一的程式來支援不同的視訊遊戲。過去,IBM的超級電腦“深藍”(DeepBlue)曾擊敗過國際像棋世界冠軍加裏•卡斯帕羅夫(Garry Kasparov),但這是一種專門面向國際像棋遊戲的專用系統。而DeepMind的最大特點是,可以不依賴於遊戲種類而廣泛地自主學習。

打磚塊遊戲

從DeepMind打遊戲的展示可以看出,其學習能力非常驚人。上圖為哈薩比斯在一次會議上介紹DeepMind學習“Breakout”(打磚塊)遊戲的過程。這是一款操作把手,讓球回彈打掉磚塊的遊戲,DeepMind一開始學得比較慢。

但一個小時後,DeepMind經過200次左右的遊戲,讓球回彈的比例達到了34%,實力與初學的玩家相當。兩個小時後,經過300次的遊戲,該系統超過了人的水準。四個小時後,該系統學會了在磚塊上打開通道、從背面打掉磚塊的超高技能。DeepMind只花費了四個小時就掌握了遊戲。這是一種能以驚人的高速度自主學習的人工智慧技術。

DeepMind的學習方法

DeepMind學習遊戲的方法已在一篇論文(《Playing Atari with Deep Reinforcement Learning》)上公開。這篇論文介紹了系統學習遊戲的工作原理及基準測試結果。

系統會接受來自感測器的輸入,學習控制規則,並進行可獲得最大分數的操作。也就是說,系統會看著遊戲畫面,自主學習能夠得分的打法。當然,系統並不是通過遊戲軟體的逆向工程來掌握遊戲技巧的。

具體測試方法是,利用學習街機遊戲的框架“Arcade Learning Environment”,使用雅達利公司(Atari)開發的7款遊戲進行了基準測試。如上所述,系統顯示出了可以廣泛學習的功能,並不是按照每款遊戲來更改架構和演算法。已證實系統具備可以廣泛自主學習的能力,而並非按照遊戲進行優化。

DeepMind的學習成果

系統顯示出了超越人類遊戲高手的結果。部分評測結果,按照不同遊戲顯示出了分數。第一行是遊戲名稱,左邊第一列為挑戰者的名字。“DQN”表示DeepMind,“Human”表示人類遊戲高手。其他則是現有遊戲學習系統。

從該表可以看出,DeepMind不僅以壓倒性優勢擊敗了現有遊戲學習系統,還在“Breakout”(打磚塊)、“Enduro”(賽車)、Pong(乒乓球遊戲)中,超過了人類遊戲高手。在上述打磚塊遊戲中,DeepMind獲得的分數是人類遊戲高手的5.4倍,顯示出了壓倒性的超高技能。

DeepMind的架構

據上面提到的那篇論文介紹,DeepMind是將作為深入學習(Deep Learning)方法之一的“卷積神經網路”(Convolutional Neural Network)與學習模型“強化學習”(Reinforcement Learning)結合在一起的系統。

卷積神經網路指的是將人腦構造形成模型的網路,用於從圖像等資訊中提取特徵量。而“強化學習”指的是在某一環境中(遊戲等)採取行動(操作遊戲),並利用其反饋結果(得分等)來學習的方法。

在視訊遊戲中,從操作按鈕到獲得分數,需要一個很長的過程。操作和得分在時間上相隔較長,因此很難判斷出哪種操作才是正確的。DeepMind是從視訊圖像中提取特徵量,像人類和動物一樣通過不斷摸索來學習的系統。

將DeepMind整合到谷歌產品中

佩奇在上述訪談節目中反覆指出,現在的電腦並未充分發揮功能。這句話的意思是電腦並未掌握與用戶相關的關聯資訊,需要從根本上進行改進。

佩奇還表示,改革的關鍵在於人工智慧,這次終於找到了一種久違的激動人心的技術。神經科學與電腦科學結合在一起,會催生新的領域,佩奇對人工智慧技術開發取得突破性的進展寄予厚望。

佩奇還透露,谷歌目前正在實施將DeepMind應用於該公司產品的項目。其中之一是搜索引擎,目標是利用DeepMind來掌握用戶的意圖,並為其提供最恰當的資訊。另外,該公司還計劃在YouTube的推薦功能及移動語音檢索功能中使用DeepMind,功能得到強化的系統將在幾年內問世。

DeepMind的路線圖

另一方面,哈薩比斯在接受BBC的採訪時,介紹了DeepMind的應用領域和路線圖,稱“深入學習”方法將在未來5年到10年內,進入生活中的各個領域。

家用機器人設想在家中打掃衛生或者做家務,使用DeepMind的話,機器人就能自主作出決定了。現行機器人在遇到程式以外的情況時,無法靈活應對,如果配備DeepMind的話,就能以驚人的速度不斷自主學習,應付多種情況的發生。

目前,自動駕駛車正處於開發測試階段,如果在這種汽車上使用DeepMind,整個運輸體系將有可能發生革新性的變化。

哈薩比斯最期待的應用領域是科學技術。如果將DeepMind應用於宏觀經濟、氣像、醫學、能源領域,就能實現人工智慧代替科學家進行研究的模型。

目前,很多優秀的科學家都是根據大量產生的資料進行研究的,但人類可以學習的範圍畢竟有限。哈薩比斯提出的構想是,讓DeepMind學習大量資料,代替研究人員進行研發。他希望經過DeepMind的不斷研究,科學技術的發展能夠比人類進行研究時更快一些。

人工智慧是否會淩駕於人類之上

另一方面,也有人對人工智慧系統能以驚人的速度自主學習這一點感到恐懼。特斯拉及SpaceX公司創始人伊隆•馬斯克(Elon Musk)在網上稱,人工智慧隱藏著巨大風險,5年以內將會出現問題。

這是人工智慧將超過人類智慧、超級智慧會稱霸全球這種危機感的表現。馬斯克反覆指出了問題點,其依據之一就是DeepMind。馬斯克在看到DeepMind能以驚人的速度學習遊戲之後,產生了危機感。

而且,網際網路上存在大量“教材”,完全具備學習人工智慧的環境。馬斯克還透露了對濫用這種技術的擔憂。他表示,必須阻止不懷好意的人躲在網上不斷學習這種技術。

順便一提,馬斯克曾向DeepMind投資,也是提高危險性的一方,這同樣是不爭的事實。估計因為馬斯克從內部掌握了人工智慧技術的威力,所以才會說出這樣的言論。

將會發生智慧爆炸

針對以馬斯克為代表的人工智慧威脅論,也有不少人提出反對意見。未來學家雷•庫茲韋爾(Ray Kurzweil)在馬斯克說出上述言論之後,通過可以安全使用人工智慧的方法,給了人工智慧威脅論決定性的一擊。

其實,人工智慧威脅論的源頭可以追溯到庫茲韋爾的著作《奇點臨近》(The Singularity is Near)。這本書的內容是,到2029年,人工智慧將會超過人類的大腦,到2045年將會達到奇點(Singularity,特異點,等於智慧爆炸),該書在社會上引起了巨大迴響。筆者曾在庫茲韋爾的演講會上聽過這方面的介紹,當時受到的強烈衝擊至今仍然記憶猶新。

出處:The Association for the Advancement of Artificial Intelligence

在控制危險性的同時堅持開發

雖然庫茲韋爾持有這樣的看法,但其對人工智慧仍然持客觀態度,並提出了可行的應對措施。庫茲韋爾就人工智慧威脅論表示,可以參考生物技術。生物技術問世之初,害怕有人利用基因重組來實施生物恐怖活動的危機感在社會上瀰漫開來。因此,早在1975年,業界就召開了具有里程碑意義的學會(稱為阿西洛馬會議,Asilomar Conference)。該學會評估了生物技術的危險性,並討論了保證安全性的方針。

庫茲韋爾認為,人工智慧技術也應該參考生物技術,對人工智慧項目的任務作出定義,並採取措施防止其遭到非法使用。其實,國際人工智慧促進協會早在2009年就在與阿西洛馬會議相同的地方召開會議,評定了人工智慧對社會帶來的影響(上圖)。

該會議由艾瑞克•赫威茲(Eric Horvitz,微軟研究所)主辦,參加人員包括Sebastian Thrun(谷歌自動駕駛車開發負責人)及吳恩達(Andrew Ng,通過YouTube學習識別貓)等多名知名研究人員。參會人員一致認為,人工智慧雖然像原子能一樣具有危險性,但人類也知道應該如何進行安全管理。

IT企業應該如何對待人工智慧

有的人接觸到像DeepMind一樣能以驚人速度學習的演算法時,會對技術進步寄予厚望,同時也會產生恐懼感。人工智慧會毀滅人類成了一個永恒的話題,在《終結者》(Terminator)等影片中也有所表現。

人工智慧威脅論似乎也在當前的美國社會蔓延。如何消除人們的恐懼感,已經成為IT企業的新課題。

順便一提,作為谷歌收購DeepMind的條件之一,哈薩比斯要求谷歌在公司內部成立道德委員會。這是要求谷歌建立起公平的審查機制,在該公司將DeepMind整合到現有服務中時,審查人工智慧的使用目的是否違反了社會道德。而且,哈薩比斯還要求谷歌不能將DeepMind用於軍事目的。這是因為哈薩比斯作為該技術的開發者,最了解這項技術的好處以及對社會造成的巨大衝擊。

包括日本公司在內,很多IT企業在技術開發上展開了激烈的競爭,但在人工智慧方面,正如哈薩比斯所提示的那樣,企業需要深入了解其危險性,並採取比現在更好的安全措施。

作者簡介:宮本和明

美國VentureClef公司代表

1955年出生於日本廣島縣。1985年被富士通派駐到美國Amdahl公司,在北美開展超級電腦業務。2003年在矽谷成立了VentureClef,以新創企業為中心開展軟體尖端技術研究。目前根據自己在矽谷長達20年的從業經歷,通過部落格“Emerging Technology Review”分析技術趨勢。

【日經BP社報導 http://big5.nikkeibp.com.cn/news/cone/73507.html?ref=ML】

■日文原文

「Google DeepMind」が驚異的な速さで學習!人工知能ㄟの危機感も高まる http://techon.nikkeibp.co.jp/article/FEATURE/20150129/401441/

■ 相關報導:

谷歌的硬體開發,是繼續打破常識還是做出妥協?

http://big5.nikkeibp.com.cn/news/tren/73491-201502031624.html

人工智慧開拓新世界,汽車2020年實現「全自動」

http://big5.nikkeibp.com.cn/news/auto/70568-201405151704.html

微軟與奇虎360合作「人工智慧+移動互聯」

http://big5.nikkeibp.com.cn/news/cone/70949-201406121621.html