資料將產生13兆美元的全球經濟活動》大數據時代,誰領風騷?

Which Countries Are Leading the Data Economy?
巴斯卡.查克勒佛提 Bhaskar Chakravorti , 賈伊.巴拉 Ajay Bhalla , 拉維.桑卡爾.柴特維第 Ravi Shankar Chaturvedi
瀏覽人數:1405
《經濟學人》在2017年宣布,世界上最有價值的資源不再是石油,而是數據資料,經由數位足跡訓練的演算法將翻轉全球。而根據「數量、使用情況、可取用性、複雜度」這四項標準來評量,目前位居領先地位的,是美國、英國、中國和瑞士。

哪些國家是頂尖的數據資料生產者?根據麥肯錫顧問公司(McKinsey)的預估,資料驅動的人工智慧應用軟體,到2030年將產生13兆美元新的全球經濟活動,因此,產生資料的能力可能會決定下一波的世界秩序,很類似石油生產在上個世紀裡,對創造經濟強國所發揮的作用。

雖然中國和美國可能成為兩個人工智慧超級強權,但資料的來源不能如同石油驅動的舊經濟般,僅集中在少數地區,而是需要取自許多不同來源,而且,未來的人工智慧應用,將從意料之外的新參與者中產生。正在成形之中的新世界秩序,很可能比簡單的兩極結構更複雜,特別是因為資料正以令人難以置信的速度產生出來。

我們以過去的工作成果為基礎,繪製全球不同國家的數位演進情況和數位競爭力,試圖找到最深、最廣的有用資料庫。這對執行為數眾多的機器學習模型來說,是不可或缺的,而這些模型攸關人工智慧的成敗。對此很重要的一點,是要區分原始資料量,以及一個我們稱為「資料生產總值」(gross data product)的衡量標準,這是我們版本的新式國內生產毛額(GDP)。為了找出世界頂級的「資料生產總值」生產者,我們建議使用四個標準:

1.數量:一個國家消耗的絕對寬頻數量,這是該國產生的原始資料量的替代指標。

2.使用情況:網際網路活躍使用者的數量,用以衡量使用行為、需求和背景的廣度。

3.可取用性:制度上對資料流的開放程度,用以評估某個國家產生的資料,是否允許多個人工智慧研究人員、創新者和應用軟體更廣泛地使用和取用。

4.複雜度:人均寬頻消耗用量,這是衡量數位活動的精細度和複雜度的替代指標。

保障隱私,有助於人工智慧長期發展

有幾個細微之處需要注意。首先,我們明白,世界各地電腦產生的數位足跡涵蓋非常廣泛的活動,從發送簡訊到進行金融交易都包括在內。為了進行全球的同類比較,我們使用人均寬頻,作為衡量這種廣度和複雜度的指標(從某些方面來看,這是模仿使用人均所得來代表整體繁榮程度的替代指標)。

其次,各機構之間如何共享私人資料,以及是否有數位身分架構,可協助把個人和他們的數位活動連結起來,這些方面在各國之間會有差異。這些制度面因素,會影響到資料最終是如何拼湊在一起的。我們不會點出這些區別。我們是根據以下幾點,來選擇我們要分析哪些國家:(1)對全球數位經濟貢獻最大的國家,這可能是因為它們在我們早期數位演化指數上得分很高,或是因為它們的數位活動有強大動能;(2)這些國家在地理區和社會經濟地位方面,具有合理的廣泛分布;(3)這些國家可以提供堅實的資料和證據基礎,讓我們進行分析。

最後,決定可取用性的一個重要考慮因素是隱私。隱私考量和資料保護法規,可協助或阻礙演算法發展新功能的能力。我們在做這項分析時採取的立場是:建立架構,以確保隱私和資料受到保護,以及資料流動的開放性,是一項淨效益,也對人工智慧的長期發展有正面助益。以金融交易詐欺偵測問題為例。應用軟體利用來自不同地理位置和多種使用情境下的深刻見解,以協助建立有關可信賴度的各種模式,並標記安全風險;符合可取用性標準的系統,對這類用軟體有助益。雖然如此,但我們也明白,短期內可能會有一些國家(中國是個顯著的例子),公部門和私部門機構之間的資料共享,在國界之外幾乎沒有流動性,而且可能違反隱私和開放性規範,但因為可以在「圍牆花園」(walled garden)內訓練演算法,而產生暫時的優勢。

在評估以資料為基礎的潛在新世界秩序時,應使用上述的哪些標準?我們認為,可取用性應該是基本的標準。如果人們認同,具有最深遠影響的人工智慧應用,應該要能符合最大的公共目的,那麼,資料存取就是最關鍵的。麥肯錫公司近期針對人工智慧的公共利益所做的研究中,把資料存取視為主要障礙之一:麥肯錫找出的18個瓶頸中,有六個與資料可取用性、數量、品質和使用情況有關。

強調開放,美國強大,中國環境不利

在上述所有三個標準上,美國的得分都很好(這似乎與一般大眾認知不同),而如果資料的可取用性,被認為是未來創造成功人工智慧應用的必要條件,那麼中國的環境就相當不利。如果歐盟(目前包括英國)採取集體行動,它就代表一個可以和美國抗衡的關鍵生產國。除了中國之外,其他金磚四國的成員(巴西、印度、俄羅斯)也有機會崛起成為強大的第二級競爭者,主要倚仗的是他們在產生原始資料方面的優勢;然而,他們也會因可取用性的問題而面臨阻礙。

至於較小的國家(像是紐西蘭),或是與較大的經濟聯盟無關的國家(像是南韓),若是它們的資料高度開放和流動,那麼它們面對的情況則不太一樣;對這些國家有益的做法是,與其他「開放」國家建立資料貿易協定,以克服先天的限制,無論先天限制是國內的使用者數量,或是國內寬頻的總用量。目前尚無法得知,這類貿易或資料共享協定將採取何種形式,但我們可以設想它們可能是一種獨特的可能性,特別是當我們明白「資料生產總值」具有價值,就像今天自由交易的任何其他產品一樣具有價值。

當然,高價值人工智慧應用的方向仍在持續出現。人工智慧本身也存在被過度炒作、誤解,以及不如預期的風險。但顯然,許多重要的應用已經在使用中,而且還有更多會出現。我們的分析架構有足夠的彈性,可解釋這種變動的情況。如果我們使用另外一組標準,認為這組標準與推動成功人工智慧應用更相關,那麼我們會看見一幅不同的景象。圖2呈現的是其中一種可能性,當中只考慮了複雜度和可取用性。

當我們用這種方式觀察時會發現,這個由資料驅動的「新」世界秩序,有一個更加線性的結構。高度的人均寬頻用量和制度開放的國家(圖中的右上角),成為明顯的贏家。可以想像一種情況,就是圖形右上方資料流的複雜度和移動性都很高,讓生產力較高的「自由貿易」區得以存在,位於這個區域裡的各國,會因運用彼此的資料庫而獲益。

承認不確定性,數位排序大不相同

最後,我們考慮了一個情境,那就是上述四個標準全都重要。如果我們給予這四個標準同等的權重,就會出現「新的」資料生產者排名和世界秩序。

1. 美國

2. 英國

3. 中國

4. 瑞士

5. 南韓

6. 法國

7. 加拿大

8. 瑞典

9. 澳洲

10. 捷克

11. 日本

12. 紐西蘭

13. 德國

14. 西班牙

15. 愛爾蘭

16. 義大利

17. 葡萄牙

18. 墨西哥

19. 阿根廷

20. 智利

21. 波蘭

22. 巴西

23. 希臘

24. 印度

25. 南非

26. 匈牙利

27. 馬來西亞

28. 俄羅斯

29. 土耳其

30. 印尼

當然,這些區隔是根據一系列假設,提供有關主要資料生產者所在位置的見解;這些假設是關於,哪些因素對未來最高價值的應用最重要。我們的目的,是承認這方面的不確定性,並展示不同的假設會產生不同的世界秩序情境。如果針對結果提出一組不同的問題,像是可能經由人工智慧,分配給每個國家的經濟或地緣政治價值,或是國家在為這樣的未來作準備之際,目前在「數位經商容易度」方面的排名,那麼就會出現不同的區隔和排名。我們正計畫在未來進行這些主題的研究專案。

資料,是新經濟的燃料

資料是新經濟的燃料,在未來的經濟中更是如此。《經濟學人》在2017年宣布,世界上最有價值的資源不再是石油,而是資料:「無論你是準備跑步、看電視,或只是困在車陣中,幾乎每項活動都會產生數位足跡,為資料提煉廠帶來更多的原料。」經由所有這些數位足跡所訓練的演算法將翻轉全球,而且很可能從中產生新的世界秩序,伴隨新的「GDP」(資料生產總值),可掌握一個衡量國家財富和權力的新興指標。既然新的競爭和合作機會正在醞釀發展,我們就該勾勒出這個領域當前是何種樣貌。

(劉純佑譯自2019年1月24日HBR.org數位版文章)


編按:每個排名或指數,只是根據特定方法和資料集來分析、比較公司或地區的其中一種方式。我們《哈佛商業評論》認為,精心設計的指數,可以提供有用的見解,儘管根據定義,它只呈現出更寬廣景象中的一個部分。一直以來,我們都提醒讀者要仔細閱讀研究方法。



巴斯卡.查克勒佛提

巴斯卡.查克勒佛提 Bhaskar Chakravorti

塔夫斯大學弗萊契學院(Fletcher School at Tufts University)全球企業學系主任,弗萊契學院全球情境商業中心創辦人暨執行主任,著有《快速變化的緩慢節奏》(The Slow Pace of Fast Change)。


賈伊.巴拉

賈伊.巴拉 Ajay Bhalla

萬事達卡全球網路(Mastercard)企業安全解決方案長,也是該公司管理委員會成員,並擔任塔夫斯大學弗萊契學院新興市場企業諮詢委員會資深委員。


拉維.桑卡爾.柴特維第

拉維.桑卡爾.柴特維第 Ravi Shankar Chaturvedi

塔夫斯大學弗萊契學院全球情境商業中心研究副主任暨博士研究員。


本篇文章主題策略執行