特別企劃
AI 提升財報解析效率  叡揚開發 Deep OCR
叡揚資訊是台灣知名的軟體業者,近年來積極投入 AI 領域的研發,並已取得不錯的成果。除了對話服務平台外,叡揚也開發出深度光學字元辨識(Deep OCR)的 AI 演算法,協助金融業者提升處理財務報表的效率。

人工智慧(AI)浪潮下,軟體業者持續開發應用新商機。叡揚資訊表示,除了對話服務平台外,其也開發出深度光學字元辨識(Deep OCR)的 AI 演算法,協助金融業者提升處理財務報表的效率,目前已有兩家公股行庫使用。
叡揚資訊創辦人暨董事長張培鏞曾表示,2013 年起即投入 AI 相關研發,小組成員約達 20 人。團隊數年前即開發出 AI 對話機器人產生器 iota C.ai 對話服務平台,近期整合微軟(MicrosoftAzure OpenAI 服務,管理者可上傳不同格式的文件,讓 AI 學習文件內容,針對提問自動生成相應答案,減少企業建置對話式服務的成本。近期 ChatGPT 似乎逐漸退燒,但他認為不見得是壞事,客戶應會更加務實地看待 AI 應用。除了對話式服務平台,叡揚也為銀行客戶開發出辨識財報資料的 AI 演算法。其金融業客戶比重近年顯著提升,2021 年上半金融業

客戶佔其營收 40.7%,2023 年上半的比重增至 46.1%。符文藻解釋,銀行使用傳統 OCR 辨識財報已行之有年,掃描器會將財報資料化為一堆圖檔,而叡揚的 Deep OCR 技術讓 AI 模型讀取掃描後結果,將非結構化資料轉為結構化資料,資料可快速匯入銀行的徵授信系統,行員便可加速核貸的流程。

開發契機是,過去幾年協助智慧財產局進行商標辨識,後續開發文字及表格辨識,接下來也可能應用到訂單、發票辨識等場景。他認為,這樣的技術有一定門檻,台灣同業不一定能夠複製。

在訓練 AI 模型的過程中,開發人員使用公開財報給 AI 模型辨識學習,但也遇到不少挑戰,因每家公司的財報格式不盡相同,例如列有會計科目代碼與否、篇幅換行換頁、印章浮水印影響文字辨識等,皆需額外處理。

針對許多企業對導入 AI 躍躍欲試,他建議,企業在考慮導入 AI 時,應考量安全(Security)、痛點(Pain)、應用範圍(Application)、算力(Computing power)、升級(Enhance and expense)、簡稱為 SPACE 的五大面向。企業應釐清希望使用 AI 解決什麼痛點,是不是既有資訊系統無法解決者;用來訓練AI的資料是否「乾淨」,例如文件分類確實與否,也會影響模型成效。為客戶導入 AI 前,團隊通常會先進行為期一個月的概念性驗證(PoC),搜集小範圍資料應用測試,確認符合需求。

在算力部分,符文藻觀察,目前客戶中已採購 AI 伺服器的比例不太高,因 AI 伺服器可能只有在訓練 AI、建立模型的幾個月之間較常使用,多數會選擇租用雲端資源、按需付費。他也談到,AI 並非像套裝軟體一樣,買來放著就好,而是每過一兩年就得定期升級演算法,團隊也會幫客戶多建立一個成效管理的模型。隨著企業組織和業務變化,AI 可能也得重新建模或進行增量學習(Incremental learning)。若無持續升級,AI 演算法準確率可能下降。這一點是較少企業注重到的面向。

1703041645350

 叡 揚 副 總 符 文 藻 指 出,ChatGPT 爆紅後,也受惠於這波熱潮,許多客戶詢問,既有服務範圍內能否增加 AI 相關應用。