4/4 可免費閱讀文章篇數免費閱讀

延伸閱讀

迎接AI,先做到「AI Ready」

「大數據」 + 「機器學習」,才有「人工智慧」。
陳昇瑋 Sheng-Wei Chen
瀏覽人數:28503
迎接AI,先做到「AI Ready」
做好資料基礎建設,才是做好導入AI的準備。

隨著人工智慧掀起熱潮,許多企業也想跟進,但這並非一蹴可幾。資料科學涵蓋了三個範疇,包括「大數據」、「機器學習」、「人工智慧」,其中大數據相當於原料,機器學習相當於處理器(processor),人工智慧相當於結果(outcome);也就是說,大數據加上機器學習,才能產生人工智慧。而以台灣企業目前的資料運用程度,顯然與人工智慧應用還有一段距離。

台灣企業資料運用現況,尚處於「描述」、「診斷」兩階段

如果將台灣企業運用資料的情況與描述、診斷、預測與指示四種分析階段對照。我們對於資料運用方法的認知,泰半還停在前兩個階段。(延伸閱讀,請見本刊2017年5月號專訪〈讓資料為你產生價值〉)

目前,金融業因為金融監理法規的要求累積了大量資料,科技業與部分傳統產業製造業因為要發展工業4.0,也積極蒐集製程相關資訊,電子商務零售平台則掌握大量交易資料。這些行業的在地領導企業,其中許多已經投資「商業智慧」(Business Intelligence)資訊平台,它們的日常管理已經可以監看關鍵績效指標(Key Performance Indicators)、資源儀表板(Dashboard),也可以產出動態決策報表,也就是說,企業可以掌握事情如何發生、為何發生的資訊,並據此進行管理;不過,許多企業仍仰賴人力判斷,來解讀產出的報表與資訊,因此資料價值的開發程度並不高,通常只有三成至五成左右。若要更有效地運用資料,就必須以電腦來解釋分析。

破除資料運用四大迷思,建立正確資料運用觀念

除了資料價值開發不足,企業的資料運用觀念也不一定正確。目前,台灣企業還普遍存在四項迷思:

迷思一:只要有數據,就是大數據。許多企業已體認到蒐集數據的重要,卻往往以為數據等於大數據。其實,具備了3V特性──大量(Volume)、高速(Velocity)、多樣(Variety)的數據,才是大數據。

迷思二:有數據就有價值。蒐集的數據,要經過處理、分析及開發最終產品(可能只是個影響決策的模型,也可能徹底改造營運流程),才能產生價值。以AlphaGo為例,它擁有的數據、棋譜,其實並不是什麼別的圍棋AI團隊沒有的資料。也就是說,好的資料固然重要,但分析模型的進步(最重要是深度自我強化模型的改善),才是提升AlphaGo能力的主因。

迷思三:將資料處理、機器學習,交給IT部門。很多企業認為與電腦、資訊相關的工作,都可以由IT部門負責,但其實資料科學家與IT人員的訓練,大相逕庭。資料科學家必須具備四大領域的知識:「數學與統計」、「程式設計與資料庫」、「領域知識與軟性技能」、「溝通與視覺化」,而IT人員通常著重於「程式設計與資料庫」的技能,普遍缺乏建立分析模型最需要的「數學與統計」訓練。因此,企業應避免誤用兩種不同的專才。

迷思四:資料分析,就是分析ERP、CRM系統中的資料。企業普遍認為,資料分析僅限於分析資料庫中的結構化資料(這也是為何企業常誤用管理資料庫的IT人員,來做資料分析)。但其實非結構化的資料,例如影像、錄音、視頻、文字等等,蘊含更多價值,卻往往被忽視。而且這種資料的分析門檻更高,更需要專業的資料科學專家來處理。

如果企業要彰顯資料分析的真正價值,除了破除上述迷思,資料運用能力還是一定要走到「預測」與「指示」階段。國外已有不少成功案例,例如,許多讀者可能也耳熟能詳的,影音串流平台Netflix能夠依據資料分析來預測市場需求,並據此來製作節目;又例如,日本職棒已有能力以高速攝影機搭配電腦視覺技術,在比賽的前兩局內,破解對方投手投不同球路時的細微差異。而許多國際大型電子商務平台不只能進行精準行銷,還能夠做消費需求預測。這些運用資料的方法,則還沒有真正進入台灣企業日常商業運用。而這兩種資料運用的層次,如果沒有資料科學家統整資料,並輔以機器學習等技術和工具是難以做到的。

做好資料基礎建設,才是做好導入AI的準備

台灣企業雖然關切大數據,卻普遍沒有導入機器學習技術,因此現在台灣企業的人工智慧應用,多是購自外部的套裝解決方案,皆非自行發展技術。這可能導致企業購得以「描述分析」為主的套裝解決方案,或是將資料暴露給外部廠商,造成資安疑慮。



若決心要應用人工智慧,較有資源的大企業,還是要從內部培養自己的資料科學及AI團隊。而資源有限的中、小企業,則可採行較務實的混合(hybrid)作法,自行蒐集數據,進行基礎的數據管理、分析,養成自己的數據人才,而門檻較高的機器學習、人工智慧應用,就與外部夥伴合作,例如台灣的AI解決方案提供者、軟體業者。如此一來,也能協助帶動台灣AI相關產業成長,逐漸建立較完整的產業生態。

簡言之,企業即使還無法立即進入人工智慧應用,最好也能做到「AI Ready」,做好迎接人工智慧的準備(ready for AI)。藉由完善資料基礎建設(infrastructure),做好數據管理,在合適的人工智慧解決方案出現時,企業就能順利導入,加速銜接,努力跟上。(採訪整理:游樂融)



陳昇瑋 Sheng-Wei Chen

現為台灣資料科學協會理事長、中央研究院資訊科學研究所研究員暨資料洞察實驗室主持人,研究領域為大數據分析、深度學習、計算社會科學及多媒體系統。


本篇文章主題分析

你可能還會想看