AI驅動古籍數字化:讓機器重復勞動,人做創造性工作
“中華書局古聯公司成立十周年暨古籍智能化建設與應用高端論壇”近日在北京中國國際出版交流中心舉行。本次論壇主題為“古聯十載數典論道,人文智能共譜新篇”,來自全國高校、圖書館、出版機構的百余位專家學者參會,圍繞古籍數字化成果、智能化技術應用與未來發展方向進行了深入研討。
從基礎建設到智能化探索
古聯公司自2015年成立以來,已建設古籍數據庫資源規模達40億字以上,上線“籍合網”平臺,并開展了古籍數據大模型研發等工作。
中國出版集團有限公司副總經理張宏介紹,古聯公司十年間構建了百億余字的古籍大數據中心,研發了國家級古籍整理數字化平臺,制定了行業標準,培養了專業人才。
中華書局總經理助理、古聯公司總經理洪濤在《十年筑基 智啟未來》報告中透露,古聯正對“籍合網”進行智能化改造,未來用戶可用白話文搜索古籍內容;同時打造“先賢數字人”智能體,探索構建沉浸式數字閱讀空間。
中國人民大學國家一級教授馮惠玲在《蓬勃發展的中國數字人文》報告中強調,AI技術正全方位融入數字人文,未來需打破壁壘,推動學科健康發展。
北京大學中國語言文學系教授劉玉才提出“人機協同新范式”,通過實例說明如何利用AI技術實現智能校勘、將注釋轉化為可計算的知識體系。他認為新技術是“超級放大鏡”和“超高速處理器”,旨在賦能而非取代傳統研究。
清華大學人文學院副教授唐宸演示了其團隊研發的“全球漢籍資源聚合平臺”,該平臺通過AI智能體技術,實現了對全球500余個古籍數據庫、60多萬部資源的動態聚合與多語言對齊。他指出,傳統古籍檢索依賴關鍵詞匹配,而AI技術能實現語義級關聯檢索。
例如,用戶輸入“唐代邊塞詩中的自然意象”,系統可自動關聯相關詩作、地理信息及歷史背景,并生成可視化分析圖譜。更值得關注的是,平臺通過AI智能體實現了24小時動態監控,可以自動捕捉全球新增古籍資源,并完成版本鑒定、元數據提取等工作流程。
唐宸繼而強調,這一技術不僅解決了資源孤島問題,更使學者能專注于學術發現而非資料搜集,“讓機器做重復勞動,讓人做創造性工作”。
技術賦能與學科重構的路徑探索
在下午的專題研討中,三場論壇分別從技術應用、資源重構和學科建設角度,深入探討了古籍智能化面臨的現實挑戰與創新路徑。
技術前沿論壇聚焦人工智能對研究范式的革新。北京古籍出版社原總編輯楊璐結合沈從文“叢帖整理”項目,指出AI草書識別技術能將學者經驗與機器效率結合,實現“一輩子做兩輩子事”的突破。天津師范大學姚伯岳教授提出“大古籍保護”理念,倡導通過智能編目實現版本自動比對,將學者從繁瑣勞動解放至學術判斷。國家民委全國少數民族古籍整理研究室楊碩副主任則以西夏文數字化工程為例,強調AI對傳承“絕學”的緊迫性——亟需用技術保存老一輩學者的研究智慧。
圖書館論壇圍繞智能轉型展開激烈討論。山東大學趙興勝館長直言圖書館必須從“資源倉庫”轉向“創新引擎”,他開發的“經濟學知識庫”正是將學術資源深度融入教學科研的實踐。廣州圖書館劉平清副館長關注到數字鴻溝問題,指出公共圖書館需在青少年紙質閱讀與老年人數字素養培訓間尋求平衡。海南師范大學史振卿館長提出“四性”建設標準,通過讓師生參與選書、推動課堂與圖書館聯動等具體措施,重塑圖書館在高校生態中的價值。
新文科建設論壇呈現出學科融合的多元探索。南京大學王濤教授指出,當AI使知識獲取極易時,教育重心應轉向培養“想象力與創造力”。上海師范大學吳夏平教授展示了數字人文本碩博貫通培養體系的實際成效——古代文學碩士憑借編程能力入職科技公司,印證了復合型人才競爭優勢。中南大學易龍副教授提醒,在推進工程化方法時需堅守人文內核,避免陷入“技術至上”誤區。北京師范大學胡韌奮副教授則呼吁學者主動填補知識普及真空,對抗以養生課為幌子的偽傳統文化傳播。
論壇閉幕環節,中華書局黨委書記肖啟明致辭時表示,古聯公司十年發展成果表明,“技術不僅能夠保護好古籍,而且能夠讓它活起來、用起來”。


