Meta在4月19日正式發表Llama 3大語言模型(LLM),原本基於Llama 2的TAIDE模型在正式發表後不到半個月時間,也快速升級到Llama 3。國科會於29日釋出基於Llama 3的Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,這是以Meta Llama-3-8B為基礎進行訓練,並已完成基本測試的大型繁體中文模型,國科會吳政忠主委對於TAIDE團隊僅用4天即完成模型訓練,並能馬上開放可商用版本供產學研界使用,表示高度肯定。
Meta於年4月19日公開釋出Llama 3新一代的大型語言模型,在各項評比中表現大幅超越前一代Llama 2,再次引爆LLM界的熱潮。為了盡快將具有台灣文化的TAIDE繁體中文模型升級到Llama 3,TAIDE團隊第一時間以過去一年開發TAIDE模型所掌握的經驗,加上累積整理的繁體中文資料集,基於Release early, release often的開發思維,僅以4天時間投入訓練,經過基本測試,釋出Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,團隊後續也將收集各界回饋意見並滾動調整,持續精進TAIDE系列繁體中文大型語言模型。
自4月15日公開釋出以Meta提供的開放模型Llama2為基礎的TAIDE-LX-7B台灣繁體中文可商用大型語言模型,目前在開放社群平台上,許多高手已提供不少安裝與使用指南,亦有十餘家廠商及多個學研團隊及公部門開始導入TAIDE模型開發相關應用系統。
國科會預定在5月3日為TAIDE模型舉辦正式成果發表會,為TAIDE團隊第一階段的工作畫下句點。但從該團隊快速發表Llama 3-TAIDE-LX-8B-Chat-Alpha1模型來看,TAIDE團隊已經展開第二階段工作,接下來TAIDE會端出哪些新的開發成果,值得期待。目前Llama 3-TAIDE-LX-8B-Chat-Alpha1模型的量化版本已經上傳到Huggingface上,所有使用者都可以自由下載體驗。