封面故事
萬物聯網下的新互動介面 迎接對話智慧的未來
2019 08月 94
前往目錄
根據研究,在企業 IoT 和智慧家庭驅動下,物聯網持續快速發展,預計 2020 年全球物聯網總數將超過 300 億台,達到萬物連網的新境界

環顧四周,連網的設備已從傳統的電腦、手機擴及到各式各樣的裝置,汽車要連網, 電視、音箱要連網,連電源控制插座也要連網。
1根據 Strategy Analytics 研究,在企業 IoT 和智 慧家庭驅動下,物聯網 (The Internet of Things) 持續快速發展,預計 2020 年全球物聯網總數將超過 300 億台,達到萬物連網的新境界,而其中既有的連接裝置及 PC 僅占總市場 5%。

這意味著人們和裝置間的互動方式將出現根本性改變,不再是單一鍵盤或滑鼠的輸入,觸控應用也早已隨著手機和平板的普及,深入日常 的各個角落。

但除此之外呢?五、六年級生應該對八十年代的影集「霹靂遊俠」不陌生!劇中那部人性化萬能電腦車─「夥計」,擁有衛星導航、車用視訊、自動駕駛、人工智能對話、手錶式通訊裝置⋯⋯等尖端科技的智慧結晶,除了在主角的緊急呼喚中立馬出動突圍外,還能跟「老 哥」─李麥克抬抬槓耍耍嘴皮子,這種透過語音的對話及互動,對大部分的人來說是最習慣且直覺的方式。

01.1

在 Gartner 所公布的 2019 年十大策略性科 技趨勢之一的「沉浸式體驗」(Immersive Experience) 中更預估 2022 年 70% 的企業將嘗試使用沉浸式技術進行消費和企業使用, 25% 將部署到生產中,到 2028 年對話平台將改變用戶與世界互動方式,結合各類虛擬實境 (VR/AR/MR) 及形狀感知、用戶追蹤及偵測等技術將帶來身歷其境的體驗。

01.2未來對話平台,從虛擬個人助理到聊天機器 人,將結合及擴展感官辨識,使平台能根據面部表情偵測情緒,在互動中具有更深層的對話能力。

3另從圖 2 的調查報告亦可看出人與人之間的溝通互動和對話,除了面對面之外,幾乎全都透過訊息平台來完成。

‧ 自 2 015 Q3,4 大通訊軟體的每月活躍使用者已超過社群軟體上。

‧ 72 % 的人每天平均使用 7 款 App,而花在訊息和社群平台的時間約 69%。

‧ 18∼55 歲的美國人會使用對話機器人 (chatbot)。

‧ 46% 的使用者傾向使用訊息平台取代 e-mail 進行商務聯繫。

01.5

對話平台的架構和基本元素應包含哪些呢?在 未來萬物連網的使用情境下,平台的互動對象將不局限於人類 (human),也擴及各類物聯裝置 (thing),如圖3 所示,以下簡介幾個重要元 素:

使用介面

和各類使用介面整合以提供對話的能力。

● 網頁瀏覽器:可與網頁整合,內嵌於各式設備裝置。

● 訊息平台:能支援多訊息管道 (Facebook Messenger、WeChat、Line 及 Slack 等),並提供如影像、卡片等非文字訊息的豐富介面、支援群組對話模式,另外可解析對話歷程,以利掌握對話脈絡,深入參與互動。

● 語音:對話平台需具備語音處理的能力。

‧純語音互動:如智慧音箱。
‧特殊語音支援:能偵測語言並支援特別方言、腔調或用語或多國語言夾雜的情境,如:中日英夾雜、台灣國語、日式英文。
‧語音辨別:在多人或吵雜情境能避免環境干擾並識別發話對象。
‧擬人語音:可依語氣、節奏、音調等聲音樣式情緒分析,提供擬人化的語音輸出。

對話機器人分級模型

● 多模態性:除語音外,其他型態的對話方式,透過相機或其他感測裝置,來進行手勢、 人臉辨識、情緒偵測或生物特徵辨識來提升整體的準確度和使用經驗。 

處理能力

對話平台的關鍵核心,用來理解輸入的內容, 如:對話平台需能聽得懂用台語說:「我中午要騎歐兜賣去 Seven 買披薩和泡麵。」

‧自然語言處理 (Natural LanguageProcessing):如上述所提,針對各語言多樣性的處理外,尚包括情緒分析(Sentiment Analytics)、內部知識為基底的語意豐富 化(Semantic Enrichment)和領域特殊性 (Domain Specificity) 等。
‧ 意圖解析 (Intent Matching):理解前後文關係的語境(Contextualization)能力、多意圖辨識(Multiple Intent Recognition)與處理、 樣式辨識(Pattern Recognition)和關鍵詞萃取 (Terms Extraction)等。

情境感知 (Contextual Awareness) 能力: 利用對情境的感知能力非常重要,能讓對話平台意圖解析更完善。情境來源包括對話歷史、使用者環境資訊 (User Context)、 喜好 (Preferences)、其他使用者資料 (如: CRM 資料)、使用者屬性和行為預測 (Behavior Prediction) 等。

因應 (Handling):用來決定如何回應輸入的內容,最常使用包括決策樹、支援多輪對話的訊息槽填充 (Slot Filling)、搜尋與摘要能力 (Search and Summarization)、知識地圖 (Knowledge Mapping) 及常見問答的知識存取 (Knowledge Extraction)。
回應生成 (Response Generation):將處理結果回應生成給使用端,包括複合式回應、文字轉語音 (Text to Speech)、具個性 (Personality) 特徵的個人化 (Personalization) 回應等。

01.6

影集霹靂遊俠或上述對話平台的解決方案,描繪未來的理想境界,如暫不考量語音等複雜使用介面訊息來源的處理,僅針對整合於訊息平台,如 Line、Messenger 上的企業對話機器人 (chatbot),是否能有較實際且合宜的方式來評估對話平台 或智慧助理 (AI Assistant) 對話能力成熟度?以下介紹 AI 開源軟體供應商 Rasa 聯合創始人暨執行長 Alex Weidauer 所提出的分級模型,並用一個汽車定期維修保養的案例來解 釋4:

等級1. 通知助理:對話機器人基本上是傳統的通知助理,僅能單向發送訊息。
例:通知助理會在你的愛車免費保固到期或定期保養將屆時, 主動發送簡訊到你的手機或社群媒體帳號,你無法和他對話互動。

等級2. 常見問答助理:對話機器人可回答一 些常見問題,或透過簡單的步驟進行互動。
例:汽車服務對話機器人可利用預設 Q & A 資料庫提供簡易協 助,但無法回應較深入的特定服務要求。

等級3. 語境式助理:對話機器人可根據前後
對話內容,進行彈性且深入的互動,並知道如何回應非預期中的使用者提問。

等級5. 自治組織助理:最終,企業內會有各種機器人,包括行銷、業務、人資及財務等,他們充分知曉客戶個人喜好並提供適切服務,而彼此間又能協同運作以滿足企業的營運需求。
例:汽車銷售服務公司除前台客戶服務智慧化外,在整體企業資源管理亦需引進人工智慧,達到有效管控庫存和零件備品,及監控服務效率,並整合車貸產險、道路救援等業者,主動提供舒適安全愉悅的用車體驗。

對於人工智慧或機器人,我們一直處在某種矛盾,一邊期盼它能帶來更多改變,一邊又擔心被取代。但如同連續劇中的台詞「回不去了!」人工智慧等科技巨輪只會不斷滾動向前,企業和個人若無法因應和駕馭,終將為其所傾壓。


資料來源
1. Smart Home Will Drive Internet of Things To 50 Billion Devices, Says Strategy Analytics
2. Gartner Top 10 Strategic Technology Trends for 2019
3. 10 graphs that show why your business should be available
through messaging apps
4. Conversational AI: Your Guide to Five Levels of AI Assistants
in Enterprise