讓人工智慧融入資料科學團隊

How AI Fits Into Your Data Science Team
希拉蕊.梅森 Hilary Mason , 採訪▇ 華特.福力克 Walter Frick
瀏覽人數:8668
機器學習與人工智慧如何融入企業現有的資料能力?組織裡運用資料科學的方式可分解成三種能力:「了解商業」,問題並分析資訊,以做出決策;「產品資料科學」,打造能改善產品的演算法與系統;「研發」,使用資料開發新產品。

艾瑞克.布林優夫森與安德魯.麥克費,在他們為《哈佛商業評論》「人工智慧,來真的」專題系列撰寫的一篇文章中主張,人工智慧與機器學習,會迅速成為「通用技術」(general-purpose technology),與電力或內燃機同樣重要。它們代表我們的技術能力有了具里程碑意義的重大變化,將推動下一波經濟成長。

但我們如何實際運用這些技術?這些新能力在組織中將會處於什麼位置,企業如何利用它們?

為獲得實際、實地的觀點,《哈佛商業評論》英文版資深編輯華特.福力克(Walter Frick),專訪研究機器智慧的「快速前進實驗室」(Fast Forward Labs)創辦人希拉蕊.梅森(Hilary Mason)。以下是訪談摘要。

《哈佛商業評論》問(以下簡稱問):人工智慧現在是熱門話題。身為資料科學家和研究人員,你如何看待你這個領域的最新進展?

希拉蕊.梅森答(以下簡稱答):如果我們在十年、八年前進行這樣的談話,重點就會是大數據,包括我們是否能建立基礎設施,把所有資料整合到一個地點來進行查詢。一旦你做到這一點,就能作分析,分析法本質上就是計算事物,來回答有商業價值或產品價值的問題。人們一直都能計算資料中的東西,但我們在大約八年前看到的變化是,新軟體讓以前沒有財力、也沒有管道做這件事的人,也開始可以做了。

這導致資料科學的興起,也就是聰明地計算事物、預測事物,並依據資料建立模型。建立模型現在已變得便宜得多,不僅應用在價值極高的問題,像是精算科學,也應用在似乎微不足道的東西,像是建議、搜尋結果之類的事情。

然後,我們有了機器學習,這是資料科學中的一套工具,可以讓你聰明地計算事物,並納入回饋意見迴路(feedback loop)。我們開始使用這些模型,來獲得世界上更多資料,然後把那些資料回饋到這些模型中,好讓模型隨著時間而改進。

現在,我們談論的是人工智慧。這個詞本身有點鬆散,有技術含意,也有行銷含意,但它基本上是使用機器學習,特別是深度學習,以便能在這些基礎之上打造應用軟體。這意味著如果沒有機器學習,就不能做人工智慧。如果沒有資料分析,就無法進行機器學習,而如果沒有資料基礎設施,就無法進行分析。在我眼中,它們全部都有關聯。

問:機器學習與人工智慧如何融入企業現有的資料能力?

答:在組織裡,用許多方式運用資料科學,我發現,人們在管理它時經常犯的錯誤,是認為它在一個技術堆疊(tech stack)上運作,所以就只是一件事。但我會把它分解成三種能力,它們都仰賴同一項技術。第一種能力,是了解商業。這是分析法或商業智慧:能提出問題並分析資訊,以做出更好的決策。這通常由財務長或營運長辦公室負責。這不見得屬於技術領域。

第二種能力,是產品資料科學:打造出確實能改善產品的演算法與系統,其中有可能用到機器學習和人工智慧。例如,可用於垃圾電子郵件過濾器、推薦系統、搜尋演算法和資料視覺化等。這種能力通常屬於某一個事業,由產品開發或產品工程部門負責。

最後一種資料能力,往往被忽視,或是被納入產品資料科學裡。這是一種研發能力:使用資料,來開發新產品、新業務和新營收的機會。

問:這三種能力,都被機器學習和人工智慧改變了嗎?

答:讓我們花點時間,仔細檢視深度學習可做些什麼,因為它是現今人們稱為人工智慧的許多事物的核心,也是近幾年來機器學習進展的一大部分。首先,深度學習使先前無法作任何分析的資料,得以進行分析,例如,你可以在影片和聲音資料中真的找到價值。仍然很少有公司擁有大量這類資料,但我認為,這類公司可能會隨時間而增加。甚至連分析法,也受到使用圖像資料能力的影響,而不僅是使用文本(context)或結構化資料。第二,深度學習能讓我們使用新方法,來解決非常困難的資料科學問題,例如文本摘要。深度學習讓你能建立預測模型,品質與複雜程度達到前所未有的高水準。因此,深度學習也可強化資料科學的產品功能,因為它能產生新的產品機會。例如,有幾家公司很成功地使用深度學習,運用在電子商務推薦系統。接下來,深度學習當然會影響研發功能,因為它可以推展技術上的可行領域。

問:資料科學的重點在於分析、產品開發和研發。這是一種循序漸進的發展嗎?或是企業應同時嘗試這三者?

答:兩種情況都有一些。如果只追求其中一種使用案例(use case),就沒有充分把握機會。但在進入研發階段之前,先讓你的基礎設施和分析都穩固可靠,會很有助益。在實務上,我們發現,人們較樂於投資成本節約方案,而不是投資可能獲得新營收的機會。企業文化較能接受這種情況。

問:企業努力發展資料科學時,你看到他們還犯了什麼錯誤?

答:一個大錯誤與流程有關。我們注意到,人們把這些東西硬塞到軟體工程流程中,那沒有效。開發資料科學系統,在好幾個方面完全不同於軟體工程。資料科學專案啟動之初,你不知道它是否會奏效。但軟體工程專案一展開,你就知道它會奏效。

這表示軟體工程流程遇到不確定性時,就會失敗。相反的,資料科學需要一個容許不確定性的實驗流程。

此外,各家公司都有文化障礙要克服。許多公司不能接受不成功的研究,所以,進行高風險研究計畫的可憐資料科學家,最後在年度考核中受到懲罰,因為他們努力進行某項計畫兩個月,卻沒有成果,即使他們其實做得很好。資料科學需要有文化空間來實驗,從事可能失敗的事。企業必須了解,他們投資的是行動方案的組合,其中有一些方案最終會得到回報,產生的價值遠勝於漸進改善的產品。

問:你如何面對和這個主題相關的所有這些熱烈討論?你對高階主管有什麼建議?

答:對於我們現在所說的人工智慧潛力,我仍然保持強烈的樂觀態度。但我也很務實,因為我必須提供有效用的系統給客戶,這是很大的限制條件。有些人四處提出一些很誇大、荒謬的說法。另有一些人,把幾年前我們稱為迴歸分析的東西,改稱為人工智慧,只是為了從行銷角度來提高那些東西的價值。所以我的建議是,要記住,沒有神奇魔法。在概念層面上,人工智慧沒有任何高階主管無法理解的地方。如果有人向你推銷一個構想,並說:「我不想解釋它如何運作,但它是人工智慧,」這時非常重要的,是繼續問:它如何運作?進入系統的是什麼資料?資料裡可能有哪些模式,是系統可以學習的?產出的是什麼?因為深度學習系統產出的東西,通常只是以前沒有標籤的一個資料點,現在有標籤了,加上對那個標籤的一些信心,只是這樣而已。那並不是像你和我具有的那種智慧,而且,要出現具備看似人類那種智慧的東西,距離現在仍非常遙遠。

(侯秀琴譯自2017年7月21日HBR.org數位版文章)





本篇文章主題技術與營運