大多數分析專案沒那麼需要大數據

Most Analytics Projects Don't Require Much Data
湯瑪斯.雷曼 Thomas C. Redman , 羅傑.賀爾 Roger W. Hoerl
瀏覽人數:1608
有時候,你的企圖心不需要這麼大。

太多公司在一窩蜂投入進階資料科學、大數據、機器學習(machine learning)和人工智慧(artificial intelligence)之際,卻忽略了「小數據」。這真是一大失誤。小數據專案相對比較容易處理、資料隨處可得,而且威力強大,因此對於每一個組織的每一個部門裡的所有員工、主管和所有層級領導人,都有深刻的意義。

小數據專案的團隊由少數幾位員工組成,運用小型的資料集來處理自家辦公室裡的議題,而小型資料集只有數百個資料點,不像大數據專案使用的是數百萬個資料點。小數據專案極為專注在使用人人可取得的基本分析方法。這類專業只要幾位兼職人員花少數幾個月就能完成,而且平均每個專案每年可產生一萬美元到25萬美元的財務效益。企業內部有許多有潛力的小數據專案,我們可以合理預期,一個有四十名員工的部門,一年可完成二十個專案。這樣累積起來的效益非常大。

大數據專案往往需要數十名人員參與,每個人有不同的重視事項,還牽涉到辦公室政治、龐大的預算和失敗率很高,相比之下,小數據專案成功的機率比較高。因此,小數據專案可以建立組織的數據能力,協助整個公司學習如何成功運用數據、獲得所需的技能、建立信心,並且培養處理大數據所需的文化。而且,現在有許多人擔心會被自動化取代,或是自己的工作會變動到難以掌控,而讓這些人參與小數據專案,可以讓所有人培養數據能力,並克服恐懼。

此外,小數據專案很有趣!一位已在通訊產業工作二十年的第一線主管,領導她的團隊完成一系列小數據品質專案,我們也參加了他們的慶功晚宴,她在晚宴上稱讚說:「這是我二十年職涯當中最棒的經驗。這是第一次讓我感覺到自己能夠掌控一切情況。」我們在世界各地協助創造出數百、甚至數千個這種成功故事。人們很高興能夠理解數字、數字背口後的意義,以及探究釐清真正的情況。他們喜歡跟團隊一起工作,樂見自己努力的結果改善了自己的工作績效和公司的績效。

要讓小數據發揮威力並不難,困難的是如何調整思維,改為優先重視這類專案。我們建議你馬上就開始,並採取下列步驟。

讓所有人加入,包括你自己

你每年至少要親自帶領直接部屬執行一個小數據專案。你會學到很多,並且親身體驗小數據的威力、獲得信譽,而且這麼做可以樹立良好的典範。你應鼓勵部屬加入你的數據專案,賦予他們權力用自己的獨特方式讓小數據發揮作用。

只要知道要檢視哪些地方,就不難找出小數據專案的機會。以下三個領域是「目標集中處」:

1. 排除隱藏的資料工廠(hidden data factory;編按:指為了改正錯誤數據所進行的額外工作):數據品質糟糕是常有的事,目標是在處理數據裡的錯誤時,應減少沒有附加價值的工作。

2. 減少時間的浪費:我們發現,人們浪費許多時間等待會議開始、等同事的意見、等貨物抵達等等。目標是要減少這種時間。

3. 簡化交接的流程:當專案工作進展到由你的團隊接手、在你的團隊內部來回進行、從你的團隊移交出去時,工作交接如果做得不好,可能會增加複雜性、成本或時間。目標是要精簡這些交接過程。

等到你比較熟練了,可能會想專注在某個領域,並設定積極的目標,然後挑戰你的團隊達成這個目標。

採取嚴謹的做法

許多小數據專案相當簡單,因此你可能會很想要直接跳到解決方案。但是,我們發現最好的方法是採取嚴謹、直接的流程,就像以下這樣:界定要解決的商業問題、收集所需的數據、分析這些數據、執行改善方案、維持改善的效益、找出下一個機會,然後重複進行這個循環。熟悉精實法(lean)、六標準差(six sigma)、數據分析生命週期(the data analytic life cycle)或其他科學方法的人,會發現這些方法有類似之處。

提供訓練

要確保你和你的團隊接受可提供實務經驗的訓練,而且訓練內容還要解釋所用方法背後的「為什麼」和「怎麼做」。在我們曾合作的某家公司裡,數據品質訓練課程包含了八場工作坊,每一場九十分鐘,只專注在一個重要主題,像是測量或現場實作,讓參加的學員立即實際運用學到的基本知識。課堂上所用的例子,都是針對每一個人的專業領域:財務部門的人拿到財務方面的例子、工程師拿到工程方面的例子,以此類推。這種結合基礎知識、相關範例和實作經驗的課程,協助這家公司的員工迅速培養和應用他們學到的技能。

找出你獨有的專長領域

讓自己處理至少一個問題,然後根據所學到的東西,為自己規畫一個利基領域。也許你很擅長處理數據品質測量和改善,因此成為你團隊裡的數據品質專家。或者你可以善用你對顧客關係的興趣,培養有關這個領域的指標和指標背後含意的能力。這麼做有助於你對團隊做出有價值的貢獻,也打造出令你滿意的職涯。

你在採取上述步驟時請記住,雖然你專注進行小數據專案,但這並不表示你不能進行大數據計畫,可能現在就做,也可能是未來才進行。確實,要解決大問題,必須靠大數據。不過,忽略了小數據專案較容易創造的效益,卻去推動你還沒有準備好可完成的大數據專案,只因為後者比較吸引人,那就太不明智了。所以你應該要進行策略性思考。特別是剛起步的時候,應強調的是小數據。

我們知道,許多人會覺得本文建議的方向有違直覺,因為大數據跟人工智慧實在太熱門了。不過,不妨設想你的組織在十年後的樣子。我們希望你看到一組菁英的資料科學家和技術人員,致力處理少數幾個複雜的問題。除此之外,我們也希望你看到的是一個更平等的工作場所,每個人都愈來愈能夠自在處理數據,為許多機會做出貢獻。小數據的道路會引領你走向那樣的未來。你該上路了。

(陳佳穎譯)



湯瑪斯.雷曼

湯瑪斯.雷曼 Thomas C. Redman

被稱為「資料醫生」(Data Doc)、資料品質解決方案公司(Data Quality Solutions)總裁,協助企業和人們,包括新創公司、多國籍公司、高階主管、各層級領導人,規畫如何創造以資料驅動的未來。他特別重視品質、分析,還有組織能力。


羅傑.賀爾

羅傑.賀爾 Roger W. Hoerl

紐約聯合學院(Union College)統計學講座副教授,他協助該校推出分析法和統計學的課程。在此之前,他是奇異公司全球研究中心(GE Global Research)應用統計實驗室負責人。


本篇文章主題數據資料