4/4 可免費閱讀文章篇數免費閱讀

本文出自

人工智慧,萬能或不能?

人工智慧,萬能或不能?

2017年10月號

驅動機器學習大爆發

What's Driving the Machine Learning Explosion?
安德魯.麥克費 Andrew McAfee , 艾瑞克.布林優夫森 Erik Brynjolfsson
瀏覽人數:1985
  • "驅動機器學習大爆發"

  • 字放大
  • 文章授權
    購買〈驅動機器學習大爆發〉文章授權
  • 購買文章
    購買〈驅動機器學習大爆發〉PDF檔
    下載點數 10
數據資料大幅增加、演算法有極大的改善、電腦硬體功能愈來愈強大。上述這三個因素,使得人工智慧目前如此受矚目。

自1950年代以來,機器學習系統就一直存在,為什麼突然在許多不同領域出現突破?這是因為有以下三個因素發揮作用:數據資料大幅增加、演算法有極大的改善、電腦硬體功能愈來愈強大。過去二十年來(不同應用的時間可能不太一樣),可用的資料已增加到一千倍,重要的演算法已改進十到一百倍,硬體速度提高至少一百倍。麻省理工學院(MIT)的托瑪索.波吉歐(Tomaso Poggio)表示,這些因素結合起來,可讓一些應用軟體改進高達一百萬倍,例如在自動駕駛汽車裡使用的行人偵測視覺系統。

我們來檢視每個因素。

資料。數十年來,大量的音樂CD、電影DVD和網頁,一直在添加全球的數位編碼資訊的數量,但在過去幾年之間,創作速率激增。智慧型手機與工業設備上的感測器傳出的訊號、數位照片與影片、不間斷的全球性社群媒體洪流和其他資料來源,所有這些結合起來,使我們置身在前所未見的資料豐富時代。現今世界上有90%的數位資料,是在過去兩年中創造出來的。物聯網(internet of things,IoT)蓬勃發展,可望連接數十億個新裝置和這些裝置的資料流(data stream),因此在未來十年,我們必定會有更多數位資料可用。

演算法。資料洪流很重要,不僅因為它使現有的演算法更有效,還因為它鼓勵、支持並加速開發出更好的演算法。現在主導這個領域的演算法與做法,像是深度監督式學習(deep supervised learning)和強化式學習(reinforcement learning),都有一個重要的基本特性:隨著訓練資料增加,演算法的成果也會改善。演算法的效能,通常會在某個點開始趨於平穩,之後即使給它更多資料,效能也不會改善太多,甚至沒有改善。但今日廣泛使用的許多演算法,似乎並非如此。同時,新的演算法正在把學習到的東西,從一種應用轉移到另一種應用,因此可以從愈來愈少的例子中學習。

電腦硬體。摩爾定律(Moore's Law)指出:積體電路上可容納的電晶體數目,每18到24個月會增加一倍。2015年摩爾定律提出五十週年時,這個定律仍然很強勁。最近有些人評論說,摩爾定律面臨物理學的限制,所以在未來幾年將會減緩;的確,標準微處理器的時鐘速率(clock speed)已趨於平穩。但湊巧的是,一種稱為繪圖處理器(graphic processing unit,GPU)的相關類型電腦晶片,應用在神經網路所需的計算類型時,非常有效。其實,神經網路從傳統的中央處理器移到GPU時,加速十倍並不罕見。GPU的開發,最初是用在快速顯示電腦遊戲等應用軟體的圖像,這可以提供規模經濟,壓低單位成本,但現在,愈來愈多GPU用於神經網路。隨著神經網路的應用愈來愈普遍,有幾家公司已開發最適合這項應用的專用晶片,包括Google的張量處理器(tensor processing unit , TPU)。Google 旗下人工智慧公司DeepMind共同創辦人謝恩.雷格(Shane Legg)說,在單一TPU裝置上運行一天的訓練,若是使用1990年的80486中央處理器,會需要25萬年。這能產生另一個大約十倍的改善。

這些改善之間具有綜效。例如,較好的硬體,使工程師更容易測試與開發更好的演算法,當然,也使機器能在合理時間內,處理數量大得多的資料集。現今已被解決的一些應用,例如將聲波從語音轉換成有意義的文字,若是在1990年代的硬體上運行,需耗費好幾百年。成功的結果,激勵更多聰明的研究人員進入這個領域,並促使更多投資人和高階主管資助進一步的工作。

進一步擴大這些綜效的,是另外兩個技術:全球網際網路化和雲端。現在,行動網際網路可以把數位技術提供到幾乎全球任何地方,把數十億潛在顧客連接到人工智慧的突破性進展。例如,你可能已在智慧型手機上使用的智慧型助理、大型公司現今在全球分享的數位知識庫,以及維基百科(Wikipedia)和Kaggle等群眾外包系統,它們的主要使用者與貢獻者,是你的組織之外的聰明人。

也許更重要的,是以雲端為基礎的人工智慧和機器人,它們有能力加速學習及擴散。例如,在某個地點有個機器人在努力從事一項任務,像是辨識物件,一旦它精通那項任務,就能把這個知識上傳到雲端,並和使用相容知識表示系統(knowledge-representation system)的其他機器人共享(Rethink Robotics公司正在開發這樣的平台)。以這種方式獨立工作的機器人,就可以有效地從數百、數千,甚至數百萬的眼睛與耳朵收集資料。把它們的資訊結合在單一系統內,它們就能極快速地學習,而且幾乎一瞬間就能分享它們的見解。

(侯秀琴譯自2017年7月18日HBR.org數位版文章)



安德魯.麥克費 Andrew McAfee

安德魯.麥克費是麻省理工學院的主任研究科學家,研究數位技術如何改變企業、經濟和社會。他和布林優夫森合著有《機器、平台、群眾:駕馭我們的數位未來》,以及《第二次機器時代:輝煌技術年代中的工作、進步與繁榮》,後者是《紐約時報》的暢銷書,並入圍《金融時報》/麥肯錫年度最佳商業書籍。他著有學術論文、為《金融時報》寫部落格,也寫文章發表在《哈佛商業評論》、《經濟學人》、《華爾街日報》和《紐約時報》。他曾接受「六十分鐘」節目(60 Minutes)訪問,並在TED、達沃斯(Davos)和亞斯本構想節(Aspen Ideas Festival)和其他許多聽眾面前,暢談他的研究。 麥克費曾就讀哈佛大學和麻省理工學院,與人共同創辦麻省理工數位經濟計畫。


艾瑞克.布林優夫森 Erik Brynjolfsson

艾瑞克.布林優夫森是麻省理工學院數位經濟計畫(Initiative on the Digital Economy)主任、麻省理工史隆管理學院(Sloan School of Management)管理科學講座教授,以及美國國家經濟研究局(NBER)研究員。他的研究探討資訊科技對企業策略、生產力和績效、數位商務和無形資產的影響。他在麻省理工學院講授資訊經濟學和分析實驗室(Analytics Lab)的課程。 布林優夫森是最早衡量資訊科技生產力的貢獻的研究人員之一,他也衡量組織資本與其他無形資產的互補作用。他的研究率先量化線上產品多樣價值(variety value),稱作「長尾」(long tail),並發展出資訊產品的訂價與搭售模式。他在哈佛大學取得應用數學與決策科學的學士及碩士學位,並獲得史隆管理學院管理經濟學博士學位。 布林優夫森著有幾本書,包括與麥克費合著的《機器、平台、群眾:駕馭我們的數位未來》(Machine, Platform, Crowd: Harnessing Our Digital Future, 2017),以及《紐約時報》的暢銷書《第二次機器時代:輝煌技術年代中的工作、進步與繁榮》(The Second Machine Age: Work, Progress, and Prosperity in a Time of Brilliant Technologies, 2014)。


本篇文章主題技術與營運

你可能還會想看