AI結合光學/運算技術 OCR文字辨識準確無礙

「回字有四種寫法,你知道嗎?」這是魯迅小說《孔乙己》中,最為人津津樂道的橋段之一。然而,許多人難以想像的是,《孔乙己》百年後的現在,「回字的四種寫法」竟然成為了讓眾多科學家、學者與技術專家頭痛的問題。這一切,得從光學字元辨識(Optical...
2022 年 04 月 28 日

ML實現中文古籍數位化 達摩院研發OCR識別系統

近日一批珍藏於美國加州大學柏克萊分校的中文古籍善本利用光學字元辨識(Optical character recognition, OCR)技術數位化,透過漢典重光平台提供古籍內容翻閱、檢索及調用功能。漢典重光由阿里巴巴公益基金會、中國四川大學、加州大學柏克萊分校、中國國家圖書館及浙江圖書館等單位共同合作,旨在尋覓流散海外的中國古籍將其數位化與公共化,協助一般大眾古籍研究者使用古籍資料。...
2021 年 05 月 25 日