叡揚資訊

GSS 技術部落格

在這個園地裡我們將從技術、專案管理、客戶對談面和大家分享我們多年的經驗，希望大家不管是喜歡或是有意見，都可以回饋給我們，讓我們有機會和大家對話並一起成長！
若有任何問題請來信：gss_crm@gss.com.tw

字體大小: + –

列印

如何用 C.ai 打造發票掃描 AI 機器人

Jaquan Lin (林哲寬)

2025/06/18, 週三

712 點擊

3 評論

大量發票單據要逐筆輸入進系統讓人困擾，AI能解決嗎?

你是否曾經想過，把發票掃描、自動辨識、送出審核這整個流程做成一個機器人？今天就來分享我是如何透過叡揚自家平台 C.ai 打造一個「發票掃描機器人」的經驗，步驟簡單、效果驚人ლ(╹◡╹ლ)

C.ai 是什麼？ AI 聊天機器人輕鬆製作的平台

C.ai 是叡揚資訊自家開發的對話服務平台，強調彈性、Low Code，讓開發機器人變得超簡單：

透過圖形化介面，快速建立並管理機器人流程。
可串接企業內部系統（API / DB）與 NLP 模型（雲端或地端皆可）。
一鍵發佈，支援多種 IM 頻道（如 iota、LINE、Teams 等）。
支援卡片顯示、資料編輯、API 推送等功能，適合打造企業專屬流程機器人。

C.ai 的應用非常多元，像是 RAG 查詢、客服助理、HR 工具、待辦提醒、問題回報，甚至是今天的主角- 發票掃描機器人！

AI Chatbot 處理發票掃描流程

我們先來看一下整體流程：

[1. 傳入發票圖檔]
↓
[2. AOAI OCR 轉換圖片為文字（LLM 處理）]
↓
[3. 程式對文字進行標準化處理]
↓
[4. 使用 C.ai 卡片顯示標準化後內容並提供預覽與編輯]

第一步：提示使用者功能並導引上傳圖片

一開始先透過 調適型卡片 向終端使用者說明功能，並引導上傳發票圖檔。

C.ai 支援圖片上傳，還能掛載在 iota 或其他 IM 上，使用者可以直接拍照上傳發票。

C.ai 支援圖片上傳，還能掛載在 iota 或其他 IM 上，使用者可以直接拍照上傳發票

第二步：AOAI OCR + LLM 轉文字（並處理幻覺問題）

將圖片交由 AOAI OCR 模組處理，轉換為文字。這時會搭配 LLM 處理語意與結構，但這裡會遇到一個常見問題 —— 幻覺（Hallucination）。

也就是說，LLM 產出的 JSON 格式可能不穩定，難以直接對接 C.ai 的卡片。

解法一、定義 Prompt 輸出格式

在 prompt 中加入明確的 Output Schema，要求模型回傳固定欄位格式。

在 prompt 中加入明確的 Output Schema處理幻覺問題

解法二：用 C.ai 的資料處理節點標準化

C.ai 本身支援 JavaScript 資料處理節點，可以在這裡進行文字標準化與欄位校驗。

建議這兩種方法同時使用，能大幅降低幻覺帶來的風險。

C.ai 本身支援 JavaScript 資料處理節點，可以在這裡進行文字標準化與欄位校驗

第三步：顯示預覽卡片

接著，我們使用平台的「明細卡片」來顯示 OCR 後的欄位資料，讓使用者進行確認與審閱。

如果前面資料未經標準化處理，這裡的卡片就會無法正確顯示。

明細卡片來顯示 OCR 後的欄位資料，讓使用者進行確認與審閱

第四步：提供人工編輯功能

OCR 雖然強大，但辨識錯誤難以完全避免。因此，我們提供 調適型卡片 或 表單卡片，讓使用者可以自行編輯內容。

這不僅讓使用者更安心，也提升辨識流程的準確度。

使用者可以自行編輯內容。這不僅讓使用者更安心，也提升辨識流程的準確度。

第五步：送出資料進行審核

修改完成後，只要透過 C.ai 的 API 卡片 就能將資料送出，像是推送到 ERP、會計審核平台，或是寫入 Google Sheet 測試用。

C.ai 內建 API 輸出卡片，設定好 API URL 與 key-value，即可一鍵送出。

API 卡片就能將資料送出，像是推送到 ERP、會計審核平台

寫入 Google Sheet 測試用

登登登登~ 成功了！

打造發票掃描 AI 機器人總結

從圖片上傳 ➝ OCR ➝ 標準化 ➝ 預覽 ➝ 編輯 ➝ API 發送，整個流程完全可以在 C.ai 上完成。重點是：

Low Code，快速開發
高度整合企業內部流程
支援使用者互動與人工修正

如果你也在開發企業流程機器人，不妨來試試看 C.ai，真的會讓你愛不釋手！

最後附上我家的貓，可愛吧

你覺得這篇文章怎麽樣？

標籤:

2025部落格徵稿活動 C.ai AI 工作流程設計

關於作者

Jaquan Lin (林哲寬)

評論 3

Rainmaker Ho (何金鎮) 於 2025/06/23, 週一 08:13

請問是手寫發票嗎?
品項的部份是不是要多筆?

1 回覆

Jaquan Lin (林哲寬) 於 2025/06/23, 週一 09:55

1.目前使用 LLM 的多模態OCR 進行辨識，能夠辨識手寫文字，但準確度相對較低，未來考慮可接入公司的地端 OCR 提升穩定性。

2.發票品項支援單筆與多筆的結構，目前都能處理。

可以額外分享的是，目前尚未實作多張發票同時處理的功能，目前仍在設計中。
一方面是LLM的OCR處理效果有限，當我們在一輪 Prompt 中要求模型做太多事時，注意力會被拉散，結果每件事都做得不夠精準。
另外是還在構想「預覽」與「編輯」的呈現方式，一張發票的狀況下很簡易的就可以處理，但多張發票仍在評估如何提供良好的使用者體驗與畫面設計。

0 回覆

Rainmaker Ho (何金鎮) 於 2025/07/31, 週四 09:47

嗯，手寫發票直接用多模態的LLM 辨識效果不好，例如數字 9 跟 7 就有可能常會辨識錯誤。
最近使用 Azure AI Content Understanding 來辨識，目前看起來在數字方面都是準確的。
如果你們有這種需求可以考量先透過 Azure AI Content Understanding 來辨識，再由 LLM 來整理出我們需要的 JSON 哦~
詳細可以參考以下的 url ,

https://www.gss.com.tw/blog/%E7%B5%90%E5%90%88-dify-%E8%88%87-azure-ai-content-understanding%EF%BC%8C%E8%BE%A8%E8%AD%98%E6%89%8B%E5%AF%AB%E7%99%BC%E7%A5%A8%E4%B8%A6%E8%BC%B8%E5%87%BA-json-%E7%B5%90%E6%A7%8B

0 回覆

如何用 C.ai 打造發票掃描 AI 機器人

C.ai 是什麼？ AI 聊天機器人輕鬆製作的平台

C.ai 的應用非常多元，像是 RAG 查詢、客服助理、HR 工具、待辦提醒、問題回報，甚至是今天的主角- 發票掃描機器人！

第一步：提示使用者功能並導引上傳圖片

第二步：AOAI OCR + LLM 轉文字（並處理幻覺問題）

解法一、定義 Prompt 輸出格式

解法二：用 C.ai 的資料處理節點標準化

第三步：顯示預覽卡片

第四步：提供人工編輯功能

第五步：送出資料進行審核

打造發票掃描 AI 機器人總結

最後附上我家的貓，可愛吧

關於作者

Jaquan Lin (林哲寬)

相關文章

高併發壓力來襲，你的服務是彈性伸縮，還是直接斷線？

解決 Azure AD 登入時出現需要管理員核准的方法

用 Kernel Memory 搭配 MSSQL 快速打造 RAG 系統｜DB 結構與操作深度解析

用 Dify 打造你的專屬 AI 客服機器人：從知識庫開始的智慧對話設計

用 Dify Agent 智能辨識高鐵票，分批上傳圖片，最後再匯出 Excel

評論 3