TAIDE團隊催落去 台灣大語言模型4天升級Llama 3

作者: 黃繼寬
2024 年 04 月 29 日

Meta在4月19日正式發表Llama 3大語言模型(LLM),原本基於Llama 2的TAIDE模型在正式發表後不到半個月時間,也快速升級到Llama 3。國科會於29日釋出基於Llama 3的Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,這是以Meta Llama-3-8B為基礎進行訓練,並已完成基本測試的大型繁體中文模型,國科會吳政忠主委對於TAIDE團隊僅用4天即完成模型訓練,並能馬上開放可商用版本供產學研界使用,表示高度肯定。

Meta於年4月19日公開釋出Llama 3新一代的大型語言模型,在各項評比中表現大幅超越前一代Llama 2,再次引爆LLM界的熱潮。為了盡快將具有台灣文化的TAIDE繁體中文模型升級到Llama 3,TAIDE團隊第一時間以過去一年開發TAIDE模型所掌握的經驗,加上累積整理的繁體中文資料集,基於Release early, release often的開發思維,僅以4天時間投入訓練,經過基本測試,釋出Llama 3-TAIDE-LX-8B-Chat-Alpha1模型,團隊後續也將收集各界回饋意見並滾動調整,持續精進TAIDE系列繁體中文大型語言模型。

自4月15日公開釋出以Meta提供的開放模型Llama2為基礎的TAIDE-LX-7B台灣繁體中文可商用大型語言模型,目前在開放社群平台上,許多高手已提供不少安裝與使用指南,亦有十餘家廠商及多個學研團隊及公部門開始導入TAIDE模型開發相關應用系統。

國科會預定在5月3日為TAIDE模型舉辦正式成果發表會,為TAIDE團隊第一階段的工作畫下句點。但從該團隊快速發表Llama 3-TAIDE-LX-8B-Chat-Alpha1模型來看,TAIDE團隊已經展開第二階段工作,接下來TAIDE會端出哪些新的開發成果,值得期待。目前Llama 3-TAIDE-LX-8B-Chat-Alpha1模型的量化版本已經上傳到Huggingface上,所有使用者都可以自由下載體驗。

》想看更多內容?快來【免費加入會員】【登入會員】,享受更多閱讀文章的權限喔!
標籤
相關文章

台灣本土大語言模型TAIDE公開亮相

2024 年 04 月 15 日

Meta推出新一代Llama 3模型 AWS/NVIDIA旋即力挺

2024 年 04 月 19 日

國科會團隊打造本土LLM 百工百業擁抱生成式AI(2)

2024 年 05 月 24 日

搶攻LLM市場 Ampere攜手高通推雲端AI加速器

2024 年 05 月 20 日

國科會團隊打造本土LLM 百工百業擁抱生成式AI(1)

2024 年 05 月 24 日

美光發表LPCAMM2產品 記憶體模組進入新世代

2024 年 01 月 19 日
前一篇
羅姆旗下SiCrystal與ST擴大SiC晶圓供貨協議
下一篇
芯鼎科技總經理許英偉:深耕AI/車用客製化平台