數據供應鏈一團糟,如何修復看過來

Your Data Supply Chains Are Probably a Mess. Here's How to Fix Them.
湯瑪斯.戴文波特 Tom Davenpo , 希奧多羅斯.埃弗基尼歐 Theodoros Evgeniou , 湯瑪斯.雷曼 Thomas C. Redman
瀏覽人數:2733
數據比以往任何時候都更重要,但大多數組織仍在一些關鍵問題上放錯重點:更關注數據基礎設施,而非數據產品;建立的數據往往很少考慮到最終用途;缺乏共同的數據語言,每個部門各自為政。本文提出一套「數據供應鏈」管理流程,讓公司可以解決上述問題。數據和其他任何類型的資產一樣重要,而且數據產品日益和實體產品一樣重要,如何管理數據,是領導人不能忽視的問題。

數十年來,數據管理一直困擾著大型公司。幾乎所有公司都花很多錢在這上面,卻發現結果不盡如人意。雖然這個問題似乎沒有變得更糟,但隨著經理人和公司努力加強由數據來驅動、善用高階分析和人工智慧(AI),並運用數據來競爭,於是,解決這個問題變得日益迫切。本文將透過「數據產品」(data product)和「數據供應鏈」的角度,探討一種強大的數據管理方法。

大多數公司在處理少數一些常見但重要的數據管理問題時,碰到困難。

第一,企業聚焦在數據管理的技術能力,而這是由資訊科技職能掌控的,必須要獲取、儲存和移動數據。這種工作沒那麼容易,因為建構技術「管道」深具挑戰性。但在這麼做的時候,企業較關注基礎設施,對產出的注意少得多:所謂產出,是指最後產生的數據產品,可用於做決策、使產品和服務進行差異化,以及滿足顧客。

第二,數據是在組織的不同單位裡產生的,以滿足各個部門的需求,並不是供其他部門日後在數據產品、業務決策或流程中使用。實體產品相反,例如汽車,設計底盤和啟動器等組件時,就已將最終產品放在心上。

第三, 大多數組織缺乏通用的數據語言。數據很微妙、有細微的差別,而且對不同情境中的不同人有不同的含意。

更糟的是,一些部門把「他們的數據」據為己有,可能不願與人分享。或者,雖然願意分享,卻不會花時間解釋那些細微的差別,好讓其他人有效使用。這導致其他部門建立自己「近乎疊床架屋」的數據庫,加重整體的亂象。

最後,企業對外部發生的事情愈來愈感興趣,利用外部數據來回答各式各樣的問題。但外部數據大致上缺乏管理,幾乎沒有供應商認證或數據品質評量。

數據供應鏈管理是以數據產品為流程的最終結果,這種數據管理方法,可以協助處理以上說的每一個問題。它同等重視數據管理的所有階段,從數據的收集到整理,再到數據產品的消費等各個階段。這種方法可以平衡共用數據的優點,以及產品中獨特與客製化數據的優點,而且同等適合用於內部和外部數據。相當少公司採用數據供應鏈管理,但這麼做的公司,通常表示產生了更好的結果。

數據產品的流程和供應商管理

企業產出的數據產品,總是採取財務報表、提交法規監管機構的報告等形式。雖然如此,這類產品的範圍和重要性仍與日俱增。許多公司的目標,是把分析和人工智慧衍生的模型,嵌入一些服務內、外部顧客的產品中。一些很好的例子包括:摩根士丹利(Morgan Stanley)的「下一個最佳行動」(Next Best Action)、LinkedIn的「你可能認識的人」(People You May Know)、Google的許多搜尋產品,以及萬事達卡(MasterCard)的「支出脈動」(SpendingPulse)和「商業定位器」(Business Locator)。充分列舉上述的問題之後,「整理」數據花費的時間,遠比建構模型要長,而且仍然不能解決所有的問題。

幸好,有更好的方法可獲取高品質數據。這種方法,建立在實體產品製造商使用的流程和供應商管理技術之上。尤其是製造商向來深入本身的供應鏈,清楚說明自己的要求、對供應商進行資格審查、堅持供應商必須衡量品質,並在問題的源頭進行必要的改進。這使得他們能以最少的「實體產品整理」,將零組件組裝為成品,從而提高品質,並降低成本。

美國菸草和無菸產品供應商奧馳亞(Altria),在數據供應鏈中採用供應商品質管理。奧馳亞每天依賴來自十萬多家便利商店的銷售點數據,以完成本身的市場報告和分析。直屬於高階分析副總裁科比.弗林(Kirby Forlin)的一支團隊,負責管理這項工作。合約中明定對數據的要求,而這個團隊的目標,是協助商店達成這些要求。一開始,奧馳亞聚焦在它最基本的要求。原本數據品質很差,每日提交的數據,只有58%符合他們的要求。但奧馳亞的團隊很有耐性,三年內將品質提高到98%。隨著基本品質分數提高,奧馳亞團隊將更高階的要求加進去。正如弗林指出的:「這是仍在進行中的工作。證據顯示,我們可以愈來愈信任那些數據,這使我們的分析實務省下大量的工作,也讓人信任我們做的工作。」

邁向數據供應鏈的步驟

若要在公司內部建立數據供應鏈,可依循實體供應鏈流程和品質管理使用的一些步驟:

1. 擬定管理職責。步驟1a,數據長或產品經理應該在員工當中任命一位「數據供應鏈經理」,協調這項做法,並從整個供應鏈的每個部門(包括外部的數據來源)招募「負責人」。步驟1b,是把與數據共享和所有權有關的問題,放在首要位置。我們發現,如此一來,大多數問題都會迎刃而解,因為極少經理人會在同事面前,表達反對數據共享的強硬立場。

2. 確認並記錄為創造和維護數據產品,需要的數據與相關成本、時間、品質要求。

3. 描述供應鏈。畫一張流程圖,描述數據創造點∕原始數據來源,以及要採取哪些步驟,以便移動、豐富、分析各項數據,用於數據產品當中。

4. 定義和建立衡量方法。一般來說,這麼做的目的,是實施能顯示數據是否符合要求的衡量方法。首先要衡量的是數據正確性,以及從數據創造到納入數據產品花費的時間。每個數據產品供應鏈的衡量指標都不同。

5. 建立流程控制,並評估是否符合要求。使用步驟四的衡量方法來控制流程,並確定符合步驟二的要求的程度,以及找出差距。

6. 調查供應鏈,以確認需要做哪些改善,包括整體和特定數據產品的改善。確認步驟五發現的差距,是來自步驟三流程圖的什麼地方。

7. 進行改善並持續監測。找出並消除步驟六找到差距的根本原因,必要時重回之前的步驟。持續監測投入數據和數據產品、尋求改善產品,以及做這件事需要的新數據,以及更好的數據來源。

8. 數據來源「認證合格」。公司將繼續運用數量日益增多的外部數據供應商,因此,一個有助益的做法,是找出其中哪些供應商總是能提供高品質的數據。審查他們的數據品質計畫,透過這種方式來「認證」合乎資格的供應商,並找出不合格供應商的薄弱環節。

就資產規模來說,鑰匙銀行(Key Bank)是美國前二十大銀行,使用廣義的數據供應鏈概念,以架構它的數據管理計畫。它將整個流程分解為「獲取∕整理∕消費」等領域,並試著改善每個領域的效率和成效。它最近將不少數據儲存和分析作業轉移到雲端,結果發現,整個供應鏈的彈性和速度改善很多。它的消費活動歷來著重在典型的商業智慧能力,但現在也有強大的數據科學功能。

這需要供應鏈進行改變,轉向更大程度的數據虛擬化,以及能建構數據視圖,跨越不同的數據市集(data mart)和納入外部的數據。這家銀行已能利用本身的數據供應鏈,快速開發出很依賴數據的新銀行產品。例如,它是美國最大的薪資保障計畫(Payroll Protection Plan)放款機構之一,最近也推出全國性的數位醫生銀行。這家銀行的數據長麥克.翁德斯(Mike Onders),其實就是數據供應鏈經理。他和員工評估自家銀行的數據供應鏈,提供各種所需數據產品的能力。

我們促請所有公司積極管理本身最重要的數據供應鏈。對企業來說,數據和其他任何類型的資產一樣重要,而且,數據產品日益和實體產品一樣重要。幾十年來,改善實體供應鏈的相同思維,目前已證明對數據產品有同樣的價值。

(羅耀宗譯)



湯瑪斯.戴文波特 Tom Davenpo

美國貝伯森學院(Babson College)資訊科技與管理學的校聘傑出教授、麻省理工學院數位商務中心(MIT Center for Digital Business)研究員、國際分析研究所(International Institute for Analytics)的共同創辦人,以及德勤分析(Deloitte Analytics)資深顧問。他的新作是《運用大數據》(Big Data at Work),並著有暢銷書《決勝分析力》(Competing on Analytics)。


希奧多羅斯.埃弗基尼歐 Theodoros Evgeniou

歐洲工商管理學院(INSEAD)決策科學與技術管理學教授。


湯瑪斯.雷曼 Thomas C. Redman

人稱「數據醫生」(Data Doc),擔任數據品質解決方案公司(Data Quality Solutions)總裁,協助企業和個人,包括新創公司、多國籍公司、高階主管和各層級領導人,規畫如何創造以數據驅動的未來。他特別重視品質、分析法和組織能力。


本篇文章主題數據資料