策略釋放AI的「創造力」,它能自學找出解方

釋放AI的「創造力」,它能自學找出解方

Why AI That Teaches Itself to Achieve a Goal Is the Next Big Thing

釋放AI的「創造力」,它能自學找出解方

oxygen/Getty Images

競賽類的AI,和大多數公司用來進行預測AI,兩者有什麼區別?前者有創造能力。這種AI使用了「強化學習」,並不是靠餵歷史數據,來分析未來的變數;而是透過反覆試驗和錯誤來自我學習,擅長將某些會隨著時間流逝而改變優先執行順序的任務,來進行優化。那麼,領導人該怎麼去運用這種「更聰明」的AI,讓他們「發揮創造力」,幫你找出最佳解決方案?

圍棋的世界級棋王李世乭(Lee Sedol),在著名的2016年「人機大戰」第二局比賽中,很不理解Deepmind開發的AlphaGo軟體所下的第37步棋,結果花了將近15分鐘才落子。其他經驗豐富的棋手,也沒見過那一步棋的下法,有位評論員表示機器犯了錯誤。其實那是一個經典的例子,顯示人工智慧(artificial intelligence,AI)演算法似乎不只能在數據中辨識型態,還能學習具有策略、甚至具有創意的事物。確實,Deepmind的開發人員除了把圍棋棋王過去的下棋實例輸入演算法裡,還訓練AlphaGo自己和自己對弈數百萬場。這套系統在與自己的對弈中,有機會探索新的棋路和策略,然後評估這些表現是否有改善。透過所有這些反覆試驗和錯誤,AlphaGo發現了一種新棋路,連世界一流好手也感到意外。

如果這種具備創意能力的AI,跟不同於大多數企業在應用機器學習時,最後會使用的聊天機器人和預測模型不一樣,那是因為,它們真的不同。AlphaGo之類的競賽系統,不是用歷史數據去產出預測的機器學習,而是使用「強化學習」(reinforcement learning),這是一種成熟的機器學習技術,擅長...