阿爾法狗再進化自學三天勝人千年 谷歌用它來做什麼
早在今年五月對弈柯潔之前,AlphaGo就已經從“狗”進化為“神”,無需依賴人類訓練師,但谷歌的野心並不止步於此,Deepmind公司1/4精力已經被用於商業實踐和變現
《財經》(博客,微博)記者 劉以秦/文 謝麗容/編輯
北京時間10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界頂級科學雜志Nature雜志上宣佈瞭AlphaGo的新進步,可以在沒有人類幹預的情況下自我學習,新的AlphaGoZero在自我學習3天之後,就以100比0的成績戰勝瞭第一代AlphaGo。
自我學習能力的出現,對於人工智能和機器學習來說,是一個新的突破。“過去人們普遍認為機器學習是基於海量的大數據,但是從AlphaGoZero身上,我們發現算法比數據更重要。”AlphaGo項目的主要負責人戴維·席爾瓦(David Silver)說道。
也由於使用瞭更多的算法和更少的數據,所以AlphaGoZero隻使用瞭一臺計算機器和4個TPU,被它打敗的一代AlphaGo則用到多臺機器和48個TPU。
當人們驚訝於AlphaGoZero在圍棋領域的神級水平時,對於DeepMind團隊來說,這才隻是剛剛開始,他們的目的是通過培養自主學習的能力,來解決更多其他領域目前無法解決的棘手問題。
從AlphaGo、AlphaGoMaster到AlphaGo Zero
AlphaGo於2015年10月面世,在廣為台灣商標註冊人知的與棋手李世石對弈之前,它已經打敗瞭歐洲圍棋冠軍樊麾。樊麾接受《財經》記者采訪時表示,當時在他看來,一個計算程序要打敗職業棋手是不可能的事情。
結果他以0-5輸給瞭AlphaGo,但他也因此加入瞭DeepMind團隊,幫助訓練AlphaGo。2016年3月,在他幫助訓練下的AlphaGo以4-1的成績打敗瞭人類頂尖棋手李世石。2017年初,AlphaGo化名為“Master”,在網絡上挑戰60名人類棋手,保持全勝的成績。2017年5月,在烏鎮的,名為Master的第二代AlphaGo以3-0戰勝瞭目前人類最強棋手柯潔。
今年5月的比賽期間,DeepMind的多位高管就已經向《財經》記者透露,Master已經實現瞭自我學習能力,甚至有瞭自己的“直覺”,“我們發現AlphaGo已經不需要依賴人類訓練師瞭。”戴維·席爾瓦告訴《財經》記者。
與柯潔的對弈中,AlphaGo已經能下出很多人類棋手完全無法想象的路數,比賽後柯潔表示,第一代的AlphaGo還能找到破綻,Master已經實現瞭“從人到神”的飛躍。
而AlphaGoZero在“獨立”上更進一步,在訓練的過程中,它是自我對弈。從訓練圖上可以看出,由於一開始並不熟悉圍棋,對弈雙方的水平都很弱,但是隨著時間的推進,在短短3天互相博弈490萬局後,越來越強,實現瞭圍棋水平的突破。
(圖:AlphaGo訓練的72小時圖譜)
人類頂尖棋手柯潔被認為是圍棋天才,6歲開始學棋,17歲時在世界范圍內排名第一,一個人類天才十幾年的學習,被AlphaZero用3天時間超越。
但DeepMind團隊志不在此,“AlphaGo的意義不在於打敗人類,而是領悟知識,解決更多的問題。”戴維·席爾瓦表示。
商業化加速:1/4精力用於商業變現
今年5月,DeepMind創始人傑米斯·哈薩比斯在接受《財經》記者采訪時表示:“如果說谷歌是火箭,DeepMind就是燃料。”
在此定位之下,AlphaGo雖然進化神速,但絕對不會止步於圍棋。
這傢公司一開始隻是一傢位於英國倫敦的人工智能實驗室,研究方向是開發通用自我學習算法。2011年,哈薩比斯在埃隆·馬斯克等人的投資下,成立瞭DeepMind。2014年,谷歌以4億英鎊(約6.5億美元)的價格收購該公司,當時這傢公司隻有50名員工。AlphaGo就來自於這傢公司。
AlphaGo戰勝韓國第一棋手李世石引爆瞭AI技術和市場,也讓DeepMind在谷歌AI戰略中地位舉足輕重。
不過,DeepMind團隊從一開始研發AlphaGo系統的目的就是能實現行業應用,並帶來商業價值。圍棋為AlphaGo帶來瞭光環,卻並非最終目標。
哈薩比斯對《財經》記者說,“下一階段,DeepMind整個團隊75%的精力用於人工智能技術的研發,另外25%精力放在行業應用上。”
具體分工上,哈薩比斯繼續主導技術研究,另一位創始人穆斯塔法·蘇萊曼則負責主導商業化。
穆斯塔法認為,繼續技術研究和商業化是一種平衡。“我們手裡有很多實驗室裡的新技術,都是寶貴的資源,而這些技術的商用不僅能造福社會,一傢公司也必須大陸商標申請有可持續的商業利潤來源。”他告訴《財經》記者。
據他介紹,目前DeepMind由兩個團隊組成,哈薩比斯負責研發團隊,而他負責技術應用業務。技術應用團隊又再分為三個組,一個組服務谷歌的產業和谷歌的其他業務部門;第二個是醫療組,已經與英國的國傢醫療健康局合作;第三個組是能源組,目前還在啟動階段。
“這樣的分組是為瞭方便與不同領域的專傢更好地合作。”他說。
此前,DeepMind已經牛刀小試,成功利用機器學習為谷歌大幅度節約電量,帶來實際收益。
2016年,DeepMind團隊就利用AlphaGo的學習能力,不斷模擬探索更加省電的方案。DeepMind接管瞭谷歌數據中心的一些控制單元,包括風扇、空調、窗戶和服務器等,通過機器學習,幫助谷歌數據中心的冷卻系統節約用電40%,並提高瞭15%的能源使用效率。
哈薩比斯對《財經》記者說:“谷歌在數據中心設備上的用電太多,幾個百分點就意味著每年幾百萬美元,節約電力的算法每分鐘都在給公司省一大筆錢。”
這個算法團隊的開發團隊僅有5、6個人,uabank貸款專家|台中創業貸款|台中房屋貸款|台中企業貸款|台中汽車貸款耗時僅兩三個月。
目前,DeepMind的部分研發項目已經開始用於能源基礎設施管理、醫療系統和潔凈水源的改進等方面,公司也已經從中獲得收益。
DeepMind也已開始進軍醫療市場並從中盈利。2015年11月,它與英國倫敦皇傢自由醫院簽優美環保科技工程-靜電機,靜電機推薦,靜電機保養,靜電機清洗,靜電油煙處理機訂瞭為期五年的合同,任務是處理170萬名患者的醫療記錄。
在這次Nature雜志上發表的論文中,戴維·席爾瓦也強調瞭未來的行業應用,例如蛋白質折疊台灣電動床工廠(用於破譯遺傳密碼)、能量節約以及新材料的研發等等。
在過去,機器學習未能得到廣泛應用,主要原因之一就在於很多人類無法解決的領域中,也缺少大量的數據樣本來讓機器進行學習,例如醫療圖像處理等。AlphaGoZero能夠擺脫人類的依賴,不需要人類給出數據和樣本,這為更廣泛的行業應用提供瞭新的可能性。
這與谷歌成立母公司Alphabet實現組織變身的目的一致。母公司Alphabet創立後,整個企業資產負債表開始分賬計算,業務被獨立出來,明確瞭職責和成績,提升創新效率。
一位資本市場分析人士向《財經》記者分析評價,如果一直在之前的架構中,DeepMind對谷歌的技術輸血價值難以清晰衡量,DeepMind也很難有一個明確、長期、符合谷歌戰略的研究目標。
更重要的一個原因是,資深科學傢和強大的計算能力對AI業務的開展固然重要,但DeepMind走出去,獲取真實環境數據同樣重要,這些深入到行業的數據,比如醫療,恰恰是谷歌缺失的數據源。作為一傢搜索、社交基因的互聯網公司,谷歌手中的巨量數據,多是開放社交屬性類數據。
(責任編輯:婁在霞 )
和訊網今天刊登瞭《阿爾法狗再進化自學三天勝人千年 谷歌用它來做什麼》一文,關於此事的更多報道,請在和訊財經客戶端上閱讀。
- Apr 20 Fri 2018 21:07
阿爾法狗再進化自學三天勝人千年 谷歌用它來做什麼
close
全站熱搜
留言列表
發表留言