資料將產生13兆美元的全球經濟活動》大數據時代,誰領風騷?

Which Countries Are Leading the Data Economy?
巴斯卡.查克勒佛提 Bhaskar Chakravorti , 賈伊.巴拉 Ajay Bhalla , 拉維.桑卡爾.柴特維第 Ravi Shankar Chaturvedi
瀏覽人數:4994
《經濟學人》在2017年宣布,世界上最有價值的資源不再是石油,而是數據資料,經由數位足跡訓練的演算法將翻轉全球。而根據「數量、使用情況、可取用性、複雜度」這四項標準來評量,目前位居領先地位的,是美國、英國、中國和瑞士。

哪些國家是頂尖的數據資料生產者?根據麥肯錫顧問公司(McKinsey)的預估,資料驅動的人工智慧應用軟體,到2030年將產生13兆美元新的全球經濟活動,因此,產生資料的能力可能會決定下一波的世界秩序,很類似石油生產在上個世紀裡,對創造經濟強國所發揮的作用。

雖然中國和美國可能成為兩個人工智慧超級強權,但資料的來源不能如同石油驅動的舊經濟般,僅集中在少數地區,而是需要取自許多不同來源,而且,未來的人工智慧應用,將從意料之外的新參與者中產生。正在成形之中的新世界秩序,很可能比簡單的兩極結構更複雜,特別是因為資料正以令人難以置信的速度產生出來。

我們以過去的工作成果為基礎,繪製全球不同國家的數位演進情況和數位競爭力,試圖找到最深、最廣的有用資料庫。這對執行為數眾多的機器學習模型來說,是不可或缺的,而這些模型攸關人工智慧的成敗。對此很重要的一點,是要區分原始資料量,以及一個我們稱為「資料生產總值」(gross data product)的衡量標準,這是我們版本的新式國內生產毛額(GDP)。為了找出世界頂級的「資料生產總值」生產者,我們建議使用四個標準:

1.數量:一個國家消耗的絕對寬頻數量,這是該國產生的原始資料量的替代指標。

2.使用情況:網際網路活躍使用者的數量,用以衡量使用行為、需求和背景的廣度。

3.可取用性:制度上對資料流的開放程度,用以評估某個國家產生的資料,是否允許多個人工智慧研究人員、創新者和應用軟體更廣泛地使用和取用。

4.複雜度:人均寬頻消耗用量,這是衡量數位活動的精細度和複雜度的替代指標。

保障隱私,有助於人工智慧長期發展

有幾個細微之處需要注意。首先,我們明白,世界各地電腦產生的數位足跡涵蓋非常廣泛的活動,從發送簡訊到進行金融交易都包括在內。為了進行全球的同類比較,我們使用人均寬頻,作為衡量這種廣度和複雜度的指標(從某些方面來看,這是模仿使用人均所得來代表整體繁榮程度的替代指標)。

其次,各機構之間如何共享私人資料,以及是否有數位身分架構,可協助把個人和他們的數位活動連結起來,這些方面在各國之間會有差異。這些制度面因素,會影響到資料最終是如何拼湊在一起的。我們不會點出這些區別。我們是根據以下幾點,來選擇我們要分析哪些國家:(1)對全球數位經濟貢獻最大的國家,這可能是因為它們在我們早期數位演化指數上得分很高,或是因為它們的數位活動有強大動能;(2)這些國家在地理區和社會經濟地位方面,具有合理的廣泛分布;(3)這些國家可以提供堅實的資料和證據基礎,讓我們進行分析。

最後,決定可取用性的一個重要考慮因素是隱私。隱私考量和資料保護法規,可協助或阻礙演算法發展新功能的能力。我們在做這項分析時採取的立場是:建立架構,以確保隱私和資料受到保護,以及資料流動的開放性,是一項淨效益,也對人工智慧的長期發展有正面助益。以金融交易詐欺偵測問題為例。應用軟體利用來自不同地理位置和多種使用情境下的深刻見解,以協助建立有關可信賴度的各種模式,並標記安全風險;符合可取用性標準的系統,對這類用軟體有助益。雖然如此,但我們也明白,短期內可能會有一些國家(中國是個顯著的例子),公部門和私部門機構之間的資料共享,在國界之外幾乎沒有流動性,而且可能違反隱私和開放性規範,但因為可以在「圍牆花園」(walled garden)內訓練演算法,而產生暫時的優勢。

在評估以資料為基礎的潛在新世界秩序時,應使用上述的哪些標準?我們認為,可取用性應該是基本的標準。如果人們認同,具有最深遠影響的人工智慧應用,應該要能符合最大的公共目的,那麼,資料存取就是最關鍵的。麥肯錫公司近期針對人工智慧的公共利益所做的研究中,把資料存取視為主要障礙之一:麥肯錫找出的18個瓶頸中,有六個與資料可取用性、數量、品質和使用情況有關。

我們用兩個標準來繪製我們研究的三十個國家,得到的結果如圖:

強調開放,美國強大,中國環境不利

在上述所有三個標準上,美國的得分都很好(這似乎與一般大眾認知不同),而如果資料的可取用性,被認為是未來創造成功人工智慧應用的必要條件,那麼中國的環境就相當不利。如果歐盟(目前包括英國)採取集體行動,它就代表一個可以和美國抗衡的關鍵生產國。除了中國之外,其他金磚四國的成員(巴西、印度、俄羅斯)也有機會崛起成為強大的第二級競爭者,主要倚仗的是他們在產生原始資料方面的優勢;然而,他們也會因可取用性的問題而面臨阻礙。

至於較小的國家(像是紐西蘭),或是與較大的經濟聯盟無關的國家(像是南韓),若是它們的資料高度開放和流動,那麼它們面對的情況則不太一樣;對這些國家有益的做法是,與其他「開放」國家建立資料貿易協定,以克服先天的限制,無論先天限制是國內的使用者數量,或是國內寬頻的總用量。目前尚無法得知,這類貿易或資料共享協定將採取何種形式,但我們可以設想它們可能是一種獨特的可能性,特別是當我們明白「資料生產總值」具有價值,就像今天自由交易的任何其他產品一樣具有價值。

當然,高價值人工智慧應用的方向仍在持續出現。人工智慧本身也存在被過度炒作、誤解,以及不如預期的風險。但顯然,許多重要的應用已經在使用中,而且還有更多會出現。我們的分析架構有足夠的彈性,可解釋這種變動的情況。如果我們使用另外一組標準,認為這組標準與推動成功人工智慧應用更相關,那麼我們會看見一幅不同的景象。下圖呈現的是其中一種可能性,當中只考慮了複雜度和可取用性。

當我們用這種方式觀察時會發現,這個由資料驅動的「新」世界秩序,有一個更加線性的結構。高度的人均寬頻用量和制度開放的國家(圖中的右上角),成為明顯的贏家。可以想像一種情況,就是圖形右上方資料流的複雜度和移動性都很高,讓生產力較高的「自由貿易」區得以存在,位於這個區域裡的各國,會因運用彼此的資料庫而獲益。

承認不確定性,數位排序大不相同

最後,我們考慮了一個情境,那就是上述四個標準全都重要。如果我們給予這四個標準同等的權重,就會出現「新的」資料生產者排名和世界秩序。

當然,這些區隔是根據一系列假設,提供有關主要資料生產者所在位置的見解;這些假設是關於,哪些因素對未來最高價值的應用最重要。我們的目的,是承認這方面的不確定性,並展示不同的假設會產生不同的世界秩序情境。如果針對結果提出一組不同的問題,像是可能經由人工智慧,分配給每個國家的經濟或地緣政治價值,或是國家在為這樣的未來作準備之際,目前在「數位經商容易度」方面的排名,那麼就會出現不同的區隔和排名。我們正計畫在未來進行這些主題的研究專案。

資料,是新經濟的燃料

資料是新經濟的燃料,在未來的經濟中更是如此。《經濟學人》在2017年宣布,世界上最有價值的資源不再是石油,而是資料:「無論你是準備跑步、看電視,或只是困在車陣中,幾乎每項活動都會產生數位足跡,為資料提煉廠帶來更多的原料。」經由所有這些數位足跡所訓練的演算法將翻轉全球,而且很可能從中產生新的世界秩序,伴隨新的「GDP」(資料生產總值),可掌握一個衡量國家財富和權力的新興指標。既然新的競爭和合作機會正在醞釀發展,我們就該勾勒出這個領域當前是何種樣貌。

(劉純佑譯自2019年1月24日HBR.org數位版文章)


編按:每個排名或指數,只是根據特定方法和資料集來分析、比較公司或地區的其中一種方式。我們《哈佛商業評論》認為,精心設計的指數,可以提供有用的見解,儘管根據定義,它只呈現出更寬廣景象中的一個部分。一直以來,我們都提醒讀者要仔細閱讀研究方法。



巴斯卡.查克勒佛提

巴斯卡.查克勒佛提 Bhaskar Chakravorti

塔夫斯大學弗萊契學院(Fletcher School at Tufts University)全球企業學系主任,弗萊契學院全球情境商業中心創辦人暨執行主任,著有《快速變化的緩慢節奏》(The Slow Pace of Fast Change)。


賈伊.巴拉

賈伊.巴拉 Ajay Bhalla

萬事達卡全球網路(Mastercard)企業安全解決方案長,也是該公司管理委員會成員,並擔任塔夫斯大學弗萊契學院新興市場企業諮詢委員會資深委員。


拉維.桑卡爾.柴特維第

拉維.桑卡爾.柴特維第 Ravi Shankar Chaturvedi

塔夫斯大學弗萊契學院全球情境商業中心研究副主任暨博士研究員。


本篇文章主題策略執行