使用語音介面,讓產品有更多人用

Using Voice Interfaces to Make Products More Inclusive
凱西.珀爾 Cathy Pearl
瀏覽人數:551
不同的人,需要以不同的方式利用技術。

不論你是要打造服務、實體產品或軟體,包容性設計(inclusive design)都極為重要。包容性設計,是要盡量讓最多人取得和使用那項產品。語音使用者介面(VUI)是實現這個目標的絕佳工具。

語音使用者介面成為主流已有二十多年,最早的產品是第一個互動式語音應答(Interactive Voice Response)自動電話系統。起初,這項技術的設計目的是協助企業節省資金,因為人工作業比自動化系統更昂貴。開發出自動化系統主要是為了獲利,而非幫助他人。

智慧型音箱在2014年問世,使得語音使用者介面現在處於我所謂的「第二個時代」,不僅用於自動電話系統,還用於許多其他地方,而且還包含了語音助理,像是Google Assistant、Amazon Echo、Bixby(三星)、Cortana(微軟)、Siri(蘋果)等。今日的語音使用者介面使用人工智慧驅動的多種技巧,例如改良的語音辨識和自然語言處理。起初,智慧型音箱僅提供基本功能,例如設置定時器和播放音樂。這些年來,它們已擴展到包括較複雜的互動,如啟動家電設備、協助烹飪和提供娛樂。

雖然這幾類設備讓人們獲得阻礙較少、較自然的體驗,為一般使用者帶來便利,但語音使用者介面的未來有個廣大得多的舞台:讓最需要它的人,有能力使用各種裝置。

根據估計,美國有6,200萬人罹患運動神經損傷或行動障礙病症。語音使用者介面現在可用於數億個裝置,包括智慧型音箱、耳機和手錶等,而且已被用來協助人們管理通訊(如電子郵件、手機簡訊),以及控制各種家用設備。它們甚至可幫助患有肌肉萎縮症的人,夜間自行以聲音調整床舖,以避免褥瘡。

對於全球2.85億個視力受損的人來說,語音使用者介面也可讓他們擁有獨立性與尊嚴。視障人士若丟失智慧型手機,可用自己的聲音尋獲手機,若要聽音樂,也不必在立體音響系統中一片又一片嘗試CD,還可以知道計時器剩多少時間。我們都是技術專家,經常只考慮大事(幫助人們穿衣服、吃飽喝足、四處走動等),但往往會忘記我們認為理所當然的小事,比如說電視頻道轉台。語音使用者介面,可協助人們去做會讓他們覺得生活更有意思的事。

然而,受益的不僅是身體有損傷的人。對失智的人來說,語音助理會用不加評判的方式提醒他們服用藥物,而且會一再回答相同問題,他們就不必去詢問可能在情緒上已經感到很疲累的照顧者。

對於不使用(或不愛用)智慧型手機或筆記型電腦的年長人士來說,語音使用者介面也是可用來上網,並和家人保持聯繫的很棒方式。FrontPorch在加州卡爾斯巴德市(Carlsbad)的一個焦點小組,在一家有看護人員輔助的養老院安裝了智慧型音箱,結果獲得許多住戶熱情回應,因為他們能夠發送簡訊給家人、玩遊戲、聆聽喜歡的音樂,甚至互傳簡訊。正如一位使用者所說:

「最有趣的是,和兩位也剛剛開始使用這個神奇裝置的朋友建立通訊管道。沒錯,我們可以等到在大廳碰面才聊天,也可以互打電話。但是,使用(這個)可以傳達一些很個人、私人且好玩的事情。我們小時候會在兩個錫罐之間串起一條線,玩「打電話」遊戲,之後我就不曾覺得這樣好玩過。」

語音使用者介面也有助於克服低識字率的問題。《華爾街日報》的一篇文章〈不必打字:未來十億個行動裝置新使用者將可使用視訊和語音〉(The End of Typing: The Next Billion Mobile Users Will Rely on Video and Voice),作者提到有個人擁有智慧型手機,但識字能力差,因此無法使用手機的許多功能。現在他使用語音操作,能取得火車時刻表等重要資訊,並播放他最喜歡的歌曲等等。語音還能讓人們以自在的方式探索,建立使用網際網路的信心。

這項技術的另一面,是要協助喪失說話能力的人,或是言語模式異於常人的人。這些人無法一直使用語音使用者介面,因為語音模式是根據較標準的話語來訓練的。有兩種方法可以解決這些問題。首先,對於因生病而逐漸喪失說話能力的人,例如肌萎縮脊椎側索硬化症(ALS)等,可以錄下他們的聲音,然後以文字轉語音技術(TTS)把它們轉為語音。一旦他們無法再說話,就可使用TTS的語音來溝通。至於第二個問題,美國和歐洲有超過一億人的說話模式,可能不適用於今日的語音使用者介面,可能原因之一是他們有口吃或中風,所說的話讓人難以聽懂。解決方法是建立更多可處理這些差異的語音模型。

然而,語音技術的好處和包容性設計,對每個人都有助益。許多人都經歷過暫時的障礙,例如,拿著日用雜貨或抱著嬰兒的人,暫時無法使用雙手,或在得到重感冒或流行性感冒期間,言語能力受損的人,都可以由語音啟動的人工智慧來協助。即使是忘記戴老花眼鏡這樣簡單的事,也會讓你無法查看手機;在這類情況下使用語音,真的會有幫助。

雖然語音人工智慧,可能有助於改善提供給代表性不足群體的產品和服務,但我們還必須考慮到語音辨識模型本身。標準的辨識模型用在有些人身上時表現不佳,而我們的目標是確保訓練資料涵蓋形形色色的使用者群,以便提高對每個人的語音辨識品質。我們在最近的Google網路開發者大會(Google I / O)上強調的一個例子,顯示我們如何運用人工智慧來改善言語障礙人士使用的產品。我強烈建議企業思考,包容性設計可為他們的眾多顧客帶來什麼好處。語音技術真的能夠協助我們每一個人。

(侯秀琴譯)



凱西.珀爾 Cathy Pearl

Google的對話設計外展服務(conversation design outreach)主管,著有《設計語音使用者介面》(Designing Voice User Interfaces),由歐萊禮集團(O'Reilly)出版。二十年來她打造的語音使用者介面,曾參與美國航太總署(NASA)直升機飛行員模擬器編寫程式工作,以及開發一個對話應用程式,內容是《君子雜誌》(Esquire)的服飾專欄作家建議在首次約會時如何穿著。


本篇文章主題技術