更懂台灣、口音更親切 繁中強化AI多模態語言模型全面開源

目前全球熱門AI大語言模型(LLM)大多較「擅長」英文或簡體中文,台灣晶片設計大廠聯發科技旗下的聯發創新基地(MediaTek Research)在2月中正式發表並全面開源其最新的多模態基礎模型群——MediaTek...
2025 年 02 月 26 日

Epoch AI:大語言模型訓練算力需求每年成長4~5倍

根據研究機構Epoch AI所彙整的資料,過去十年來,用於訓練最先進AI模型的計算資源大幅增加,並促使模型的通用性和性能得到巨大提升。在過去十年中,根據Epoch AI的估計,語言模型性能提升中約有三分之二是由於模型規模的增加所致。...
2024 年 09 月 12 日

搶食邊緣AI商機 小語言模型有大用(1)

大語言模型掀起生成式AI浪潮,但大語言模型會占用大量記憶體,對處理器的運算能力要求也不低,使得大語言模型要部署在智慧型手機、NB等用戶端裝置上,會遇到許多障礙。為克服此一挑戰,輕量化的小語言模型遂應運而生。...
2024 年 05 月 30 日

搶食邊緣AI商機 小語言模型有大用(2)

大語言模型掀起生成式AI浪潮,但大語言模型會占用大量記憶體,對處理器的運算能力要求也不低,使得大語言模型要部署在智慧型手機、NB等用戶端裝置上,會遇到許多障礙。為克服此一挑戰,輕量化的小語言模型遂應運而生。...
2024 年 05 月 30 日

國科會團隊打造本土LLM 百工百業擁抱生成式AI(1)

為避免繁體中文在大語言模型浪潮中消失,在國科會主導下,TAIDE團隊耗時一年,完成本土大語言模型的開發。TAIDE模型不僅將繁體中文所代表的文化保存在大語言模型中,也為使用繁體中文的台灣一般使用者與企業,奠定了導入生成式AI的基礎。...
2024 年 05 月 24 日

國科會團隊打造本土LLM 百工百業擁抱生成式AI(2)

為避免繁體中文在大語言模型浪潮中消失,在國科會主導下,TAIDE團隊耗時一年,完成本土大語言模型的開發。TAIDE模型不僅將繁體中文所代表的文化保存在大語言模型中,也為使用繁體中文的台灣一般使用者與企業,奠定了導入生成式AI的基礎。...
2024 年 05 月 24 日

TAIDE團隊催落去 台灣大語言模型4天升級Llama 3

Meta在4月19日正式發表Llama 3大語言模型(LLM),原本基於Llama 2的TAIDE模型在正式發表後不到半個月時間,也快速升級到Llama 3。國科會於29日釋出基於Llama 3的Llama...
2024 年 04 月 29 日

群雄逐鹿生成式AI 抽乾NVIDIA護城河談何容易(1)

生成式AI無疑是當前科技業最熱門的話題,同時也是含金量最高的應用市場。為搶奪商機,英特爾跟超微都已將NVIDIA視為頭號對手,並推出針對性的產品方案。但AI是NVIDIA苦心經營十多年的戰場,要抽乾NVIDIA的護城河,談何容易?...
2024 年 04 月 23 日

Meta推出新一代Llama 3模型 AWS/NVIDIA旋即力挺

Meta宣布釋出第一波Llama 3大語言模型,包含8B(80億)與70B(700億)兩個版本。除了兩個不同參數規模的預訓練模型外,亦提供經過指令微調的模型版本,可支援更多元的使用情境。新一代Llama在多項產業指標上展現了卓越的成效,並提供許多新的功能,包括更精準的推理能力,是目前同業中最佳的開源模型。此外,延續Meta長期以來的開放創新模式,Llama...
2024 年 04 月 19 日

台灣本土大語言模型TAIDE公開亮相

生成式AI浪潮席捲科技業,除了晶片業者聯發科也開始跨界布局大語言模型技術跟服務,推出達哥DaVinci平台服務外,國科會亦於15日正式推出利用台灣繁體中文文本訓練出來的TAIDE模型。與聯發科的達哥平台聚焦企業、學校等法人生態系建構不同,在國家預算挹注下而誕生的TAIDE,是所有人皆可下載使用、甚至進一步微調(Fine-tune)的LLM。...
2024 年 04 月 15 日