人工智慧和人類推薦,你信任誰?

When Do We Trust AI's Recommendations More than People's?
基亞拉.隆戈尼 Chiara Longoni , 路卡.齊安 Luca Cian
瀏覽人數:1426
愈來愈多企業使用人工智慧的建議,來改善顧客的消費體驗,但人工智慧的建議,在某些情況下不見得有幫助,關鍵在於,消費者聚焦在產品的功能與實用層面(效用價值),還是產品的體驗與感官層面(享樂價值)。若是前者,消費者傾向相信人工智慧的建議,若是後者,就比較相信人類。組織可以透過多種方式設計顧客體驗,以擁有競爭優勢。

愈來愈多企業正在善用機器學習、自然語言處理,以及其他形式人工智慧的新進展,為消費者提供相關的即時建議。從亞馬遜(Amazon)、網飛(Netflix),到瑞克斯房地產(REX Real Estate),許多企業都在使用人工智慧推薦工具,來提升顧客體驗。此外,公部門也愈來愈常運用人工智慧推薦工具,指導人們取得基本服務。例如,紐約市社會服務局就使用人工智慧,提供市民有關殘障失能補助、食物援助和健康保險的建議。

不過,光是提供人工智慧協助,並不一定會帶來更多成功的交易。其實,人工智慧的建議,在某些情況下會有幫助,在其他情況下卻可能有害。消費者應該在何時信任機器的建議,何時不採納?我們的研究顯示,關鍵要素在於,消費者是聚焦在產品的功能與實用層面(效用價值),還是聚焦在產品體驗與感官層面(享樂價值)。

我們在《行銷學期刊》(Journal of Marketing)的一篇文章提供了證據,那篇文章是根據三千多人參與的十個實驗所產生的數據而寫成,支持我們所謂的「機器建議效應」(word-of-machine effect):在某些情況下,人們偏好人工智慧推薦工具,勝於人類推薦者。

機器建議效應

機器建議效應源自一個普遍的觀念:需要有關效用的性質時,人工智慧系統比人類更擅長提供建議,需要享樂的性質時,人工智慧系統的能力就不如人類。重要的是,機器建議效應的基礎,在於一個不一定符合現實情況的外行信念。其實,在評估和衡量效用性質上,人類不一定不如人工智慧。反之亦然,在評估和評價享樂性質上,人工智慧不一定比不上人類。確實如此,人工智慧幫美國花卉禮品零售商1-800-Flowers挑選鮮花布置,並為調味香料業者McCormick等食品公司創造新的風味。

不過,我們的實驗顯示,如果人們聚焦在效用與功能性質上,那麼從行銷人員的觀點來看,機器建議會比人類推薦者的建議更有效。對聚焦在體驗與感官性質的人來說,人類推薦者會比較有效。

例如,我們在一項實驗中,評估機器建議效應對人們選擇產品的傾向,以及人們的消費體驗有什麼影響。我們邀請波士頓的兩百多位路上行人,參加護髮產品的市場盲測(在新冠肺炎疫情之前進行)。我們使用傳單來解釋這項測試,請每個人從兩種護髮產品的樣品中挑選一種;其中一種由人工智慧推薦,另一種由人類推薦。正如預測結果,當要求路人只聚焦在效用與功能性質,像是實用性、客觀功效和化學成分,更多人(67%)挑選人工智慧推薦的樣品,多於人類推薦的樣品。當要求路人只聚焦在體驗與感官性質,像是享受、香氣和類似水療的氛圍,更多人(58%)挑選人類推薦的樣品,多於人工智慧推薦的樣品。

我們在義大利度假勝地科蒂納(Cortina)進行第二次實地試驗,同樣也出現機器建議效應。首先,我們引導促使人們只根據功能與實用性質,來考慮投資房地產,另一些人則只考慮情緒與感官的性質,來投資房地產。接下來,我們要求人們從兩種房屋條件選項中挑選其一:一個是由房地產仲介策畫,另一個是由人工智慧演算法策畫。當簡報重點聚焦在實用性,更多人(60%)選擇人工智慧策畫的條件清單。但在簡報重點訴求享受之類的感官特性時,就有較多參與者(76%)選擇人類策畫的條件清單。

機器建議效應甚至擴展到產品消費和口味感知。我們從美國維吉尼亞大學(University of Virginia)校園招募144位參與者,說明我們正在為當地一家烘焙坊測試巧克力蛋糕食譜。參與者有兩個選項:一個是由人工智慧巧克力師傅挑選食材製作的蛋糕,另一個是由人類巧克力師傅挑選食材製作的蛋糕。接下來,我們要求參與者試吃兩種蛋糕中的一種(這兩種蛋糕在外觀和成分上都相同),並且針對蛋糕的兩類特性評分,一類是體驗與感官性質(享受的味道與香氣,感官愉悅感),另一類是兩種效用與功能性質(有益的化學性質和健康程度)。參加者認為人工智慧推薦的蛋糕,不如人類巧克力師傅推薦的蛋糕那麼美味,但比較健康。

在效用性質最重要的情況下,機器建議效應更明顯。我們運用線上調查,請303位受訪者想像自己要購買冬天外套,並檢視外套的一份性質清單,包括實用與功能性(例如透氣性),以及體驗與感官性(例如織布類型),評估他們對這些產品特點的在意程度。參與者愈在意效用功能,就會愈偏好人工智慧購物助理,勝過人類助理;他們如果愈在意享樂特點,就會愈偏好人類購物助理,勝過人工智慧助理。

雖然消費者在搜尋實用產品時(例如,計算機和洗碗機),對人工智慧協助的信心明顯更高,但這不代表那些提供會帶來更多享樂體驗產品的公司(例如,香水、食品和葡萄酒),若使用人工智慧推薦工具,就無法達成目標。其實我們發現,只要人工智慧與人類密切合作,人們就會接受人工智慧的建議。例如,在一項實驗中,我們將人工智慧稱為「擴增」智慧(augmented intelligence),用於強化與支持人類的推薦,而非取代。即使在體驗和感官考量都很重要的情況下,人工智慧與人類混合的推薦工具,表現也跟單純人類推薦者的表現一樣好。

這些發現相當重要,因為這代表擴增智慧的第一項實證測試,聚焦在人工智慧在提升人類能力方面的「協助」角色,而不是通常認為的取代人類的角色。目前運用這種方法獲得成功的公司之一是Stitch Fix,它使用人工智慧與人類造型師合作,為顧客選擇服裝。

說服顧客姑且相信人工智慧

對於人類相較於人工智慧提供建議的能力,有些錯誤的外行信念,經理人可以如何改正這些想法?我們的研究發現,有幾種介入措施可以減少這種情況。

在一項實驗中,我們要求參與者考慮與最初對人工智慧能力看法相反的情況。我們促使他們考慮,在預期人類或人工智慧推薦工具擅長什麼之時,自己可能會有哪些錯誤想法。我們發現,若是促使人們考慮用不同觀點來思考推薦者的能力,會降低我們在先前實驗中發現的效應。換句話說,人工智慧推薦工具在享樂量表上得分較高,這表示人們即使聚焦在體驗與感官性質,也較能接受人工智慧推薦工具;而人類推薦者在效用量表上得分比較高,表示人們即使在尋求功能與實用性質時,也更願意接受人類推薦者。

現實世界中,試圖說服消費者對自己的核心信念進行反向思考,是相當困難的,因此,我們測試了一種比較實際和容易採取的介入措施,以決定消除偏誤的效果。我們邀請299名線上受訪者閱讀名為Cucina的應用程式,這個應用程式仰賴人工智慧提供食譜建議。在這個應用程式中,有一個預先設計好來協助他們的人工智慧主廚,參與者可以跟這個聊天機器人互動。聊天機器人向每位參與者打招呼,接著自我介紹(「嗨,馬克!我在此推薦食譜讓你嘗試!」)。之後,人工智慧主廚使用有趣的互動暗示,傳達「反向思考」的做法:「有些人可能認為,人工智慧主廚沒有能力提供食物建議,但這樣的判斷有錯。請暫時把你對我的期望放在一旁。在提出食物建議方面,你能否考慮一下,我可能擅長你不期望我會擅長的事情?」即使人們在考慮食譜裡有關味道與香氣等體驗和感官性質時,這項做法也能讓人對人工智慧建議,產生更有利的認知。

當前市場上由科技推動的驚人機會持續增加,對正在因應這種情勢的經理人來說,我們的研究發現深具啟發性。儘管在效用與功能性質和體驗與感官性質,以及消費者對人工智慧推薦工具的信任(或不信任)之間,存在著明顯的相關性,但組織可以透過多種方式設計顧客體驗,以善加利用機器建議效應。

舉例來說,當效用性質對人們相對較重要時(例如,當他們挑選要觀賞的紀錄片),網飛(Netflix)和YouTube這類公司便可強調以人工智慧為基礎的推薦;當享樂性質相對較重要時(例如,挑選要觀看的恐怖片),便可強調人類的推薦(「類似用戶」)。同樣地,像TripAdvisor這類旅遊業公司,在針對商務旅行服務時,可強調以人工智慧為基礎的推薦,至於休閒旅遊服務,就不要強調以人工智慧為基礎的推薦。

在對手眾多的數位市場中,企業在因應吸引顧客和留住顧客的挑戰之際,如果清楚了解在哪些情況下,消費者信任或不信任人工智慧推薦工具的「建議」,就能擁有競爭優勢。

(蘇偉信譯)



基亞拉.隆戈尼 Chiara Longoni

美國波士頓大學奎斯特羅姆商學院(Boston University's Questrom School of Business)行銷學助理教授。


路卡.齊安 Luca Cian

美國維吉尼亞大學達頓商學院(University of Virginia's Darden Business School)行銷學助理教授。


本篇文章主題行銷