分析與數據科學下一個關鍵數位優勢

新趨勢》運用「數據圖」超越競爭對手

下一個關鍵數位優勢

The Next Great Digital Advantage

下一個關鍵數位優勢

插畫/亞騰.馬攸許金(Artem Matyushkin)

當你在網購平台瀏覽商品,在Google搜尋任何疑惑事項的解答,打開Netflix或Spotify想看支影片或聽點音樂來消磨時間時,是否想過:為何這些演算法可以這麼精準地知道我的喜好?甚至在我想到之前,就提供最合我心的推薦?因為這些演算法的背後,都有一個最新的「數位優勢」⋯⋯

在亞馬遜(Amazon)每分鐘銷售的4,000種產品中,大約有50%是透過其個人化的推薦引擎展示給顧客。當你造訪亞馬遜網站時,網站的演算法會預測在那個當下你想要什麼,然後根據這項預測,從大約3.53億件商品中挑選出一些產品的組合,為你安排那些產品推薦。推動產生這些結果的,是亞馬遜不斷演變發展的「購買圖」(purchase graph)演算系統,也就是以數位方式呈現出現實世界中存在的「實體事物」(entity),其中儲存了有關這些實體的資訊(例如顧客、產品、購買情形、活動和地點等),以及它們之間的關係與相互影響的關係。亞馬遜的購買圖,會把消費者的購買歷程,和網站上的瀏覽數據、Prime Video上的觀賞數據、Amazon Music上的聆聽數據,和Alexa支援裝置的使用數據,全都連結起來。該公司的演算法使用「協同過濾」(collaborative filtering)技術,也就是整合多個因素,例如多樣性(推薦項目有多麼不同)、偶然性(有多麼出乎意料之外),和新奇度(有多麼新穎)等因素,以產生出全世界最複雜精細的某些建議。亞馬遜擁有豐富的數據和領先業界的個人化技術,因而能在目前占有美國電子商務市場的40%;最接近的競爭對手沃爾瑪(Walmart),市場占有率只有7%。

Google為了與亞馬遜競爭,於2021年4月公布自家的「購物圖」(Shopping Graph),這個由人工智慧(AI)強化的模型,可以在用戶搜尋時提供產品推薦。每天有超過10億人在Google上研究各項產品,購物圖將他們連結到整個網路上超過240億項商品,分別由數百萬個商家提供。「購物圖」建立在Google無與倫比的「知識圖譜」(Knowledge Graph)功能上;知識圖譜掌握了在其龐大網路中的各種實體,以及各個實體之間的關係,包括來自多個來源的結構性和非結構性數據,這些來源包括Android系統、語音和圖像搜尋、Chrome瀏覽器擴充程式、Google Assistant、Gmail、照片、地圖、YouTube、Google Cloud和Google Pay等。Google的購物圖系統,讓170萬個商家得以使用簡單但彼此關聯的工具,在整個Google上展示相關商品,有了這套系統,Google已經準備好迎接亞馬遜的挑戰。

像亞馬遜和Google的這種「數據圖」(datagraph),仰賴產品的使用數據(也就是顧客在使用平台或產品時的行為數據),來掌握公司與其顧客之間的連結、關係和相互關係。數據圖概念的靈感,來自「社會網絡」(social network)和「圖論」(graph theory;編按:數學的分支,使用由點與線構成的圖形,來呈現事物之間的關係,以供研究);其中「社交圖」(social graph)的定義,是呈現出個體之間的相互連結,其中的節點代表個人,而這些個人之間的關係(也就是與朋友、同事、主管等個人之間的關係),則以連結線來呈現。這個概念源自社會心理學家史坦利.米爾格倫(Stanley Milgram)的研究,過去二十年來,這個概念提供一個有用的觀點,可用來分析組織、產業、市場和社會的結構和內部互動情況。臉書(Facebook)在2007年推出臉書平台時,普及了數位社交圖的應用,這項工具讓開發人員得以設計一些應用程式,以整合進入臉書網站的資訊流和各種關係之間的連結。

領先的科技公司正在使用數據圖,以提供個人化的顧客推薦、更新產品、優化廣告等等。最成功的例子,包括亞馬遜的購買圖、Google的搜尋圖、臉書的社交圖、Netflix的電影圖、Spotify的音樂圖、Airbnb的旅行圖、優步(Uber)的移動圖,以及LinkedIn的專業圖,這些都充分利用了持續收集到的顧客互動數據,搭配專屬的演算法,因而得以在創造產品和用戶體驗等各方面,都超越競爭對手。

本文討論企業如何向數據圖領導公司的最佳實務取經,以獲得新的競爭優勢。

數據網路效應

要了解數據圖,我們首先需要了解「數據網路效應」(data network effect);用戶在使用產品或服務時產生的數據,會對其他用戶更有價值,在這種情況下就會發生數據網路效應。這種效應與直接網路效應不同,後者是指服務的價值會隨著更多用戶加入而成長,例如臉書或LinkedIn的情況;數據網路效應並不需要透過增加用戶數量,來提高這個網路的價值。相反地,既有用戶持續參與,會產生更廣泛和更深入的產品使用數據,這讓演算法能夠產生持續改善的結果。例如,Google每年2兆次搜尋當中的每一次,都有助於公司擴充其知識圖譜,改善其搜尋引擎,進而為用戶產出愈來愈好的搜尋結果。相較之下,如果用戶不再使用這個平台,平台就會變得陳舊,而且效用降低。

數據圖不是靜態的,並非反映某個時刻當下的情況資訊。數據圖是動態的,反映出數據科學家所謂的「動態數據」(data in motion)。這也是不可能以人工方式繪製數據圖的部分原因。在任何特定時刻,全球消費者與某家公司產品互動的數百萬個單位的數據,都需要由科技來即時收集和詮釋。

數據圖的三大成功要素

數據圖領導人會蒐集顧客行為數據,快速整合他們從中學到的事物,以改善本身產品和服務的每個層面。他們不斷改進自己分類和標記產品數據的方法,並發掘各實體之間的關係,好讓演算法能將商品更好地分類,以便提供個人化的推薦。他們持續更新自身的演算法,以便根據最新和最相關的數據來提供個人化的推薦,這有助於改善和延長顧客的互動交流。接下來,我們來檢視成功運用數據圖的公司有哪些關鍵行為。

1. 他們大規模學習,且行動迅速。

數據圖掌握了個人如何生活、工作、娛樂、學習、聆聽、社交、觀看、交易、旅遊、消費,以及進行其他與商業相關的任何活動。進行數位化,讓公司有可能大規模、廣泛而迅速地觀察所有這些領域裡的顧客數據,並進行編碼。例如,臉書的社交圖會時時刻刻分析28億人及其社交活動的數據:他們在做什麼?他們加了哪些人當好友?哪些人不再是好友?他們要去哪裡旅遊?他們談論哪些品牌?他們正在看什麼電影?他們正在聽什麼音樂等等。

數據圖掌握了人們如何工作、娛樂、學習、社交、交易、旅遊,以及進行其他與商業相關的任何活動。

LinkedIn的專業圖,即時掌握了在五千多萬家公司工作、曾就讀於九萬多所學校的7.74億專業人士,對職缺資訊的回應,以及他們如何更新現況和實況短片。此外,LinkedIn的專業圖也能把成員連結到其他的實體,例如他們擁有的技能,以便為用戶提供針對他們的廣告、學習建議、新聞提要等等。LinkedIn目前是微軟(Microsoft)的子公司,也是微軟數據生態系統的一部分,這讓它得以創造更生動鮮活的數據圖。

在傳統公司裡,顧客數據是儲存在不同部門的資料庫中,成為各自獨立的紀錄。若要獲得數位優勢,公司必須將數據整理成為互動圖,可以由演算法來分析,以提供見解,並為每位顧客提供個人化的價值。

2. 他們使用數據圖來豐富產品線。

數據圖領導人,會使用一套涵蓋各種類別的概念,例如購物、旅遊或搜尋等概念,以機器可讀的圖像格式,來組織整理他們的知識和專業技能。以Airbnb的旅遊圖為例。圖中描述了超過700萬間房屋的清單,標記的方式呈現出各種實體(城市、地標、活動等)、特性(例如顧客評論和營業時間),以及它們之間的各種關係,以產出不斷改善的建議,建議的內容不僅包括出租房屋的類型,也包括晚餐的最佳地點或遊覽景點的最佳時間。這種擴大產品範圍的能力,讓Airbnb能夠為顧客提供優於傳統旅館的服務,傳統旅館的數據儲存在各部門獨立的系統中(比如訂房數據儲存在預訂系統中,餐廳推薦數據儲存在禮賓服務系統中,水療中心的數據儲存在按摩服務預約系統中)。同樣地,Netflix持續改善75,000種細項類型的電影和電視節目的呈現和分類方式(就像Spotify對音樂和podcast的類似做法)。

Google已經能打造威力遠更為強大的服務。它的知識圖譜呈現字詞和概念之間關係的方式,能協助其演算法理解上下文。這讓Google能回覆口頭詢問,例如:「嘿,Google,預訂兩張下週三去羅馬競技場的門票,用Google Pay付款。」基礎知識是以「圖」的形式來呈現,所以演算法可以理解用戶在問什麼;演算法知道「羅馬競技場」是羅馬的一個景點,下週三是5月25日,「預訂」的意思是購買門票,而「付款」牽涉到使用儲存的信用卡(而非這些字詞的其他意義)。每一次的查詢和每一次的顧客互動,都會讓知識圖譜有所改善,以反映出意義改變時的新關係。

設想某位攀登過美國亞當斯山(Mount Adams)的登山愛好者,接下來想要攀登日本富士山。她在搜索查詢時可能會問:「相較於亞當斯山,攀登富士山應該做哪些不同的準備?」以目前的情況來說,需要搜尋好幾次才能獲得答案,但Google正在開發一種新模型,具有更複雜的知識鏈接(能夠順暢地進行多種語言的翻譯),以便更有效地回答這類查詢。

若要與數位領導企業競爭,你應自問:我們產品的相關知識,是否大多是以各自獨立的數據集存在,還是我們正在開發機器可讀的圖表,以辨識出我們顧客的偏好模式?

3. 他們贏得顧客的關鍵時刻。

2001年,Netflix的45.6萬名用戶,只選擇了系統2%的推薦。到了2020年,這個比率已經提高到80%,而Netflix擁有超過2億名訂戶。

Netflix使用其電影圖來贏得「關鍵時刻」:在90秒到2分鐘內,觀眾會決定,是要留在Netflix上看影片,還是去其他地方。Netflix透過演算法來客製化和更新主畫面,持續為每位訂戶提供針對個人所需的推薦。到2015年,Netflix每年防止了超過10億美元的取消訂閱,這要歸功於其個人化的推薦引擎。

為了贏得關鍵時刻,臉書以近乎即時的方式,對30億名用戶進行A/B實驗,為每位用戶提供個人化的首頁更新。臉書在顯示貼文之前,會檢視一組可能的貼文,並將其縮減到大約500種可能性,這是根據那名用戶過去的行為模式來挑選,他可能會去看的大約500種貼文。然後,臉書專屬的神經網路(neural network)對那些貼文進行評分和排序,接著以各種不同的媒體類型,例如文字、照片、聲音和穿插廣告的影片,來安排這些貼文。

臉書的數位內容庫可以即時將資訊提供給全球的顧客(這方面會受到各國法律的限制),優步則不同,優步之所以能夠滿足顧客的交通需求,其基礎在於,在明確的時間和確切的地點,是否有車輛可用。優步的關鍵時刻,是顧客願意等待司機的5分鐘。這家共乘公司追蹤智慧型手機有開啟其應用程式的司機和乘客(之前優步在用戶並未使用應用程式時也進行追蹤,經顧客強烈反對後,2017年被迫改變這項引發爭議的政策),使用這些數據來分析可能的需求模式。然後,它提供誘因給在選定地點提供服務的司機。該公司不斷優化安排路線的演算法,以便在關鍵時刻贏得顧客。

儘管許多公司都宣稱以顧客為中心,但很少有公司像這些領導企業那樣使用數據圖和演算法。請自問:我們是否使用AI支援的演算法,為顧客提供持續改善的產品,以確保他們與我們的產品互動,而不是離開我們?

著手進行的五大步驟

企業若是希望維持與數據圖領導業者競爭的能力,必須了解的第一件事情,就是成功的策略不只仰賴擁有大量資訊;關鍵在於即時蒐集相關的產品使用數據,以達成數據網路效應並建立優勢。企業若是觀察到顧客與其產品的更多互動,就能累積更豐富的數據;當企業向更多元的顧客群銷售更多產品時,便會累積更多不同種類的數據,可協助它們讓自家的商品進一步差異化。

企業若是沒有使用數據圖,或尚未成功使用數據圖,必須採取下列步驟迎頭趕上:

1. 擬定數據圖策略。

首先,讓具備產業知識的高階主管與數據科學家搭配合作,把你公司的數據圖予以概念化,檢視其未來的發展軌跡,並勾勒出合理可行的商業影響。許多欠缺亞馬遜或Netflix那種龐大資源的公司,已經這樣做了。例如,Stitch Fix是個人化的時尚服務平台,2010年由一名商學院學生所創辦,現在該公司的市值已高達16億美元,主要歸功於其「時尚圖」。

線上學習平台Coursera,展現新的市場進入者可以使用數據圖來顛覆市場。傳統大學提供「一體適用」的課程和證書;相較之下,Coursera在教育領域的運作就像是Netflix或亞馬遜。它透過可累積的模組,提供個人化的線上體驗,這些模組可以在不同的時段、地點、難度和價格點來消費使用。它使用自家專屬的「技能圖」,以傳統大學無法達成的方式,來客製化終身學習服務。

請自問,你的數據可以如何為你的業務提供獨特的優勢?你可能擁有專屬的「數據鉤子」(data hook),讓你在顧客使用產品時,觀察到他人無法獲得的詳細資訊。你的優勢可能來自卓越的數據範圍(你數據的深度和豐富度),以及能否取得合作伙伴的互補數據。你可能擁有更快的數據速度(動態數據,相較於競爭對手需要批次處理的片段式數據)。考慮如何透過收購〔例如微軟收購LinkedIn 和動視(Activision)〕,或組成聯盟(例如Google與Shopify的合作),來提升規模、範圍和速度。

2. 開發專屬的演算法。

獨立執行不同類型的分析,已經不足以成事。數據圖領導企業會在一個整體架構下,使用專屬的演算法,進行描述分析(「發生了什麼事?」)、診斷分析(「為什麼會發生?」)、預測分析(「可能會發生什麼事?」),以及規範分析(「應該發生什麼事?」)。你可以逐漸調整改變你的數據圖基礎設施,從設計用來分析靜態數據(批次處理、獨立分析)的傳統架構,轉變為分析即時的動態數據。

務必要把你的演算法,與你所在產業的其他演算法(以及相同類型的演算法)進行比較。例如,如果你的成功指標,是顧客依據你的推薦而採取行動的程度,那麼你推薦引擎的績效,相較於Netflix、Spotify和亞馬遜等領導業者的表現如何?

3. 產生信任感。

做為顧客數據的保管人,是一項重大責任。大多數顧客把電腦、演算法和機器學習視為複雜的「黑盒子」,而且許多人認為,自己的數據正在被使用(甚至濫用)來讓數位公司變得富有和強大。你使用演算法的方式,必須能讓人產生信任感,而且必須付出努力,以贏得蒐集和分析數據的權利。請使用消費者能夠理解的語言,來說明你在做什麼。

企業使用演算法的方式必須能讓人們產生信任感,而且必須付出努力,以贏得蒐集和分析數據的權利。

當消費者覺得自己的數據被濫用時,信任便會受到侵蝕。臉書已經成為這種困境的典型代表。最近,臉書數據科學團隊的一位吹哨人直接指控,該公司利用其數據和演算法來增加煽動性內容,以提高臉書網站的互動量,即使該公司進行的專屬內部研究指出,這麼做會傷害用戶和社會。臉書執行長馬克.祖克伯(Mark Zuckerberg)否認這些說法:「說我們為了獲利,刻意推送讓人們憤怒的內容,這樣的論點非常不合邏輯,」他說:「我們從廣告賺錢,廣告商一直告訴我們,他們不希望自家廣告旁邊出現有害或令人憤怒的內容。」祖克伯能否修復這些損害,取決於臉書未來如何使用其演算法和個人數據,以及它與用戶的溝通是否透明。

每家公司都必須不只在演算法的技術層面投入資源,還必須以消費者能夠理解和覺得安心的方式,說明自家公司在做什麼。顧客愈來愈期望了解數位產品如何運作,以及AI支援的服務是如何提供的,而且各國也要求各家企業依據當地法規,調整其數據營運。例如,在有嚴格隱私法規的德國,阿里巴巴需要的數據策略,與它在中國使用的不同。而且它必須以能促進信任的方式,和這兩國的消費者溝通。

4. 更新組織。

商業領導人必須分配必要的資源,以升級數據圖所需的技術基礎設施。他們必須招募的人才,是在數據科學和商業方面都兼具廣度和深度的人才。他們必須建立的數據組織,要能成為把企業所有部門都連結在一起的結締組織,體認到現代組織必須同時兼顧相互競爭的兩大派別:認為數據和演算法具備最優異的力量,能夠解決問題的派別,以及不認同這種看法的派別。這種緊張關係定義了現代組織的運作文化:一個好例子就是,Netflix執行長里德.哈斯廷斯(Reed Hastings)如何平衡矽谷的分析拉力和好萊塢的創意拉力。

5. 從你的數據圖獲利。

如果建構數據圖是用來支持和塑造策略,數據圖就能揭露價值不僅在於如何設計和製造產品,也在於產品如何為顧客解決特定的問題。數據圖提供的見解,能協助你選擇最合適的獲利機制,並擬定從數據進展到商業成果的清晰路徑。你可以透過基於數據網路效應所做出的可信建議,來保護你目前的營收和獲利,就如同Netflix使用即時數據來改善顧客保留率一樣。

你還可以使用你的數據圖來制定思慮更周詳的方法,透過追求新的價值領域來擴大你的營收和獲利流,如同蘋果公司(Apple)在進入信用卡、電視和健康照護領域時所做的那樣。而且,你可以在競爭對手已經善用數據圖的市場裡進行反擊,就如同迪士尼(Disney)以Disney+成功進入影音串流市場的競爭那樣。

重塑優勢

大家都看過麥當勞(McDonald's)店門口「銷售超過X十億個漢堡」的宣傳標語,而且多年來看到這個數字持續上升。不過,追蹤每年銷售了多少個漢堡已經是過時的做法。數據圖的領導企業不太關心這些絕對數字。相反地,他們會問:我們是否有每位消費者在哪裡購買漢堡的數據?在什麼時間買?他會搭配什麼飲料?他在購買漢堡之前或之後會做什麼?我們的顧客是哪些人?他們的年齡、收入、地點、偏好、生活方式等等又如何?我們要如何滿足他們更多的需求,好讓他們在我們這裡,比在其他商家消費更多?並確信他們的錢花得有價值,而且會持續回來光顧?

數據圖將會重塑各個產業的競爭態勢,而且比大多數人預期得更快。現在正是時候,每家公司都不再能夠僅使用數據來改善營運效率,而應體認到數據圖的競爭優勢。資深領導人必須投資以升級他們的數據架構,以便即時全面了解,消費者如何與他們的產品和服務互動。有了這種架構之後,領導人便能開發出獨特的方法,來解決顧客的問題。

(蘇偉信譯自“The Next Great Digital Advantage,” HBR, May-June, 2022)