人工智慧與機器學習想要改善AI,不是多餵數據就行

想要改善AI,不是多餵數據就行

Adding More Data Isn't the Only Way to Improve AI

想要改善AI,不是多餵數據就行

插畫/Daniel Liévano

若想提升AI的效能,我們直覺認為:那就餵它更多數據。只要這樣就好嗎?為了支持愈來愈龐大的AI模型,不但會超出現有硬體的能力,也會讓AI以不利於永續發展的方式增加碳足跡,更別說如果AI的演算法已經存在錯誤,再多數據都無法改善這個問題。也許AI需要的是來自人類其它面向的協助,用另一種方式來推動AI持續進化。

人工智慧(AI)藉由分析某個特定的數據集與偵測其中的模式,來獲得「智慧」。它對這個數據集以外的世界一無所知,因此產生了許多種危險。

改變一個像素,就可能混淆AI系統,讓它將一匹馬誤認為一隻青蛙,或者更可怕的是,在醫療診斷或機器操作上出錯。AI完全依賴數據集也引發了嚴重的安全漏洞:惡意代理程式(malicious agent)可以在數據中引入幾乎無法察覺的微小變化,藉以欺騙AI演算法。最後,AI系統「不知道自己不知道什麼」,可能會自信滿滿地做出錯誤預測

增加更多數據並不一定能克服這些問題,因為實際的商業和技術限制永遠會局限數據的數量。而且,要處理大型數據集,就需要愈來愈龐大的AI模型,這超出現有硬體的能力,也會讓AI以不利於永續發展的方式增加碳足跡

我們已經找出一種替代補救措施:將數據驅動的AI,連結到這個應用領域裡其他的科學或人類資訊。這來自我們在加州大學(University of California)社會利益資訊科技研究中心(CITRIS)和巴納陶研究所(Banatao Institute)的二十年經驗,期間我們與學者和企業高階主管合作,將AI應用於許多方面。這種替代補救措施的進行...