發布古籍整理數字資源45億字 規模最大線上整理本古籍資源庫成立十周年
日前,中華書局古聯公司成立十周年暨古籍智能化建設與應用高端論壇在京舉行,來自全國高等院校、圖書館、出版機構的百余位專家學者出席。會上介紹了古籍數字化的多項成果,目前古聯公司發布的數據庫產品資源規模已達45億字,構成國內規模最大的線上整理本古籍資源庫。
據介紹,十年來,古聯古籍數字化產品矩陣以專業整理本古籍為核心,同時陸續推出了“中華石刻數據庫”“歷代進士登科數據庫”“木版年畫數據庫”“殷墟甲骨文數據庫”“小學文獻數據庫”等專題數據庫,共涵蓋專業古籍整理出版資源27.5億字,學術資源2.8億字,普及資源3億字,石刻文獻7萬余篇,文史工具資源150余萬條,歷代登科人物10萬余條,甲骨文卜辭14萬余條,木版年畫18000余幅,書法作品10000余種,其他專題性典籍資源3億字,資源類型與規模均居行業首位,為用戶提供了高質量的內容和豐富的選擇空間。此外,古聯公司還發布有近代報刊文獻資源7.4億字,口述史視頻1300分鐘,檔案60000余幅,為近現代研究提供了有效支持。古聯公司古籍大數據中心對上述數據資源均進行了精細化加工與結構化標引,并基于機器深度學習技術推出古籍智能整理平臺,實現了文字錄入、斷句標點、繁簡轉換、專名識別、文白翻譯全流程自動化,將古籍出版從“人工點?!鄙壷痢叭藱C協同”新階段。
中華書局總經理助理、古聯公司總經理洪濤說,以前的“古聯”代表著匯聚古籍資源的“古籍聯合”,未來的“古聯”要實現“聚古聯今”,讓古籍內容融合現代生活。


