AI 競賽台灣不缺席,繁中 TAIDE 模型結合產學研推多元應用

作者 | 發布日期 2024 年 05 月 03 日 11:46 | 分類 AI 人工智慧 , 科技政策 line share follow us in feedly line share
AI 競賽台灣不缺席,繁中 TAIDE 模型結合產學研推多元應用


國科會自 2023 年初整合產學研力量,發展支援繁體中文、具台灣特色的「可信賴 AI 對話引擎」(Trustworthy AI Dialog Engine,TAIDE)。歷經一年,TAIDE 團隊不僅開發出以 Llama 2 為基礎的 TAIDE LX-7B、TAIDE LX-13B 模型,更在 Llama 3 公開後迅速跟進,釋出 Llama 3-TAIDE-LX-8B-Chat-Alpha1 模型。

國科會主委吳政忠指 TAIDE 是「台灣製造的 AI 引擎」,在寫文章、寫信、摘要、英翻中、中翻英五大任務表現優異,具備多輪對話且阻絕產生不恰當回應的能力。

為了讓外界自由運用 TAIDE 打造符合自身需求的系統,TAIDE 團隊 4 月 15 日釋出 TAIDE LX-7B 系列模型,不到半個月已有超過 6,000 人次下載,凸顯各界對於可信任、具有台灣特色的繁體中文基礎模型有強烈需求。不只如此,Meta 4 月 19 日公開全新 Llama 3,TAIDE 團隊僅用 4 天時間即完成 Llama 3-TAIDE-LX-8B-Chat-Alpha1 模型,並在 4 月 29 日釋出。

▲ TAIDE 模型釋出現況。(Source:國科會)

TAIDE 團隊這一年來積極與產學研合作夥伴發展多元應用,例如陽明交大的台客語 TAIDE 模型加上語音 AI 介面,具華台客英語的聽說讀寫、翻譯、口譯(譯成英語、日語、印尼語、越南語等多國語言)能力,也能進行即時對話。群聯獨家研發的 aiDAPTIV+ 平台與 TAIDE 模型完美驗證整合,並攜手 10 家以上的國際電腦大廠推出平民化的生成式 AI 地端運算平台。叡揚資訊在不同產品整合 TAIDE 模型,讓使用者可用直白語句查詢知識庫,公文系統也提供自動例稿生成。

吳政忠表示,政府和學界擁有的開發資源與 OpenAI 等指標性公司相比有一定差距,認為產學一定要合作,而且不只運用在科技業,各行各業都有機會運用如聊天機器人等 AI 深化應用。此外,研議 TAIDE 計畫再進行一年,持續讓 TAIDE 模型與時俱進,成為台灣指標性的基礎模型。

出席 TAIDE 發表會的中央研究院院士孔祥重表示,在這各國 AI 競逐的世界裡台灣不能缺席,需要掌握屬於台灣的大型語言模型。Google 傑出科學家紀懷新分析,繁體中文和簡體中文不只字體不同,更顯示文化差異,台灣積極開發繁體中文基礎模型下,未來如能加入台語、客語及更多本土文化和知識,可讓此一模型應用更多元,滿足民眾更多使用需求。

NVIDIA 執行長黃仁勳曾表示,每個國家都有必要建立自己的 AI 基礎設施,不僅善用 AI 的經濟潛力,並兼顧保護自身文化。台灣以本土團隊開發的 TAIDE 模型奠定基礎,並持續與產學研合作推出更多應用。

(首圖為國科會主委吳政忠,首圖來源:科技新報)

延伸閱讀: