數據資料小數據在人工智慧裡的大角色

小數據在人工智慧裡的大角色

Small Data Can Play a Big Role in AI

因小數據技術進步而提高的效率、準確度和透明度,逐漸應用在各個產業和企業職能部門。但競爭優勢的來源不會是自動化,而是人為因素。例如,隨著人工智慧在員工技能訓練中扮演的角色日益加重,它從較小數據集當中學習的能力,將讓員工專家能夠把自己的專業知識納入訓練系統之中,持續改善那些系統,並且有效率地將自身技能轉移給其他員工。因此,別低估未開發數據集的力量。
今日,有超過四分之三的大型企業正在實施「數據渴求」型(data-hungry)的人工智慧行動方案,這些方案包括神經網路,或是根據大規模資料庫來接受訓練的深度學習系統。然而,組織裡最有價值的數據集當中,有很多都非常小:它們的單位是千位元組或百萬位元組,而不是艾位元組(exabyte,10的18次方位元組)。這些數據缺乏大數據的數量和速度,因此常會被忽略,在個人電腦和功能部門數據庫中閒置無用,也沒有連結到全公司的資訊科技創新行動方案。

但我們最近對醫學編碼人員進行的一項實驗證明,新興的人工智慧工具和技術,再配合仔細關注人為因素,能為使用小型數據來訓練人工智慧和改造各項流程,開創出新的可能。

以典型的大型組織來說,每一個用來驅動人工智慧或先進分析行動方案的大數據集(具有十億列和行),可能伴隨一千個未被使用的小數據集。這類例子很多:針對新顧客區隔的行銷調查,會議紀錄,少於一千列和行的電子表單。在我們的實驗中,未被使用的小數據集,是一個由醫療編碼人員團隊負責添加到病歷圖表裡的註解,數千個病歷圖表中,每一個圖表只有幾十個註解。

醫療編碼人員會分析個別病人的病歷圖表,並把有關診斷、療法、藥物等的複雜資訊,