在數字文明中點亮文學的精神燈塔 ——就“中國文學地圖”相關情況訪浙江省作協黨組書記葉彤
在日前舉行的第三十一屆北京國際圖書博覽會現場,中國新時代文學大數據中心研發的“中國文學地圖”正式發布。本報記者就相關情況對浙江省作協黨組書記葉彤進行了專訪。
積極展示文學數字化前沿成果
記 者:請您介紹一下讀者和觀眾對“中國文學地圖”有哪些有趣的互動和反饋?這帶來了怎樣的啟示?
葉 彤:在圖博會現場,“中國文學地圖”包括“文學西湖”數字化展項受到了許多觀眾的關注,大家感覺到特別震撼,非常驚喜。我們注意到不同類型觀眾的反應和關注點也是不同的。比如來自學術研究領域的人士,可能此前了解過我們的文化數字化案例,親身體驗“中國文學地圖”依然倍感驚喜,認為這種文學的數字化應用未來有很大潛力。又如俄羅斯漢學家、圣彼得堡國立大學教授阿列克謝·羅季奧諾夫特別喜愛“中國文學地圖”,詳細詢問了“每個點位是否都能查看詳情”,得到肯定答復后稱贊“真的很棒”。中科院地理資源所研究員樓惠新到現場詳細了解了地圖開發制作的全過程,表示“文學+地理”的應用模式可以融入地理科普,使產品內容更豐富。來自出版界的同仁大多希望學習借鑒、尋求合作,而大眾游客則認為趣味互動有意思,樂在其中。大家的反應證明了“中國文學地圖”在文化價值、技術應用與用戶體驗上的綜合實力,是文化數字化“既叫好又叫座”的成功實踐。
這次亮相圖博會帶給我們最重要的啟發就是要更大膽地“走出來”,在更多優秀平臺上展示文學數字化成果,與專家、同仁和觀眾進行交流,廣泛聽取各方意見,博采眾長,努力把我們的文學數字化產品開發得更好,更受用戶歡迎。
記 者:“中國文學地圖”以標準中國地圖為底圖,將文學地標作為切入點,將作家、作品、文學活動等海量文學數據在中國地圖上呈現,便于用戶從地域視角在一屏之內縱覽古今文學。“中國文學地圖”這個創想最初是怎樣誕生的?實施過程中有怎樣的挑戰?將文學有關的數據整合在一張數字地圖之中,便于用戶隨時隨地使用,對文學傳播會有怎樣的作用?對于建構與數字化相適應的文學發展格局有何啟示?
葉 彤:這兩年,在建設中國新時代文學大數據中心的過程中,浙江省作協始終按照中國作協提出的要求,在浙江省委宣傳部的有力指導下,堅持高站位通盤謀劃建設項目。我們對工作專班的要求是一定要有全局意識,要放眼全國乃至全世界。引用陸機《文賦》中“觀古今于須臾,撫四海于一瞬”作為大數據中心的品牌理念,就是這個緣由。項目建設之初,工作專班到北京、陜西、天津、上海、江蘇、內蒙古等地做了深入調研和學習,了解到了全國各地文學場館之間存在著差異,也掌握了大家的需求。我們做了認真的研判,認為在數據庫建設的基礎上,通過將各地文學地標進行數字化集成的方式,由一個地標關聯到作家、作品以及人文地理,由點及面地構建起中國文學的盛大圖景是可行的。2024年1月,中國作協黨組書記張宏森到浙江文學館調研時提出了用數據展示“正在發生的文學”的要求,為我們指明了建設方向。由此,我們很快確定了“利用大數據進入中國文學現場,多維度展現當下中國文學全景”的建設理念,在開發過程中,除了集成文學地標,我們同時注重采集文學活動、核心文學期刊、新書出版、海外傳播、文學熱點事件等數據,使當下正在發生的文學動態與文學地圖有效融合,從而產生了現在大家看到的活態的“中國文學地圖”。
“中國文學地圖”面臨的最大挑戰不是開發和實施,而是下一步的傳播和使用。圖博會結束后,“中國文學地圖”受到的關注度大大提升,各界對于它的數據開源、應用落地、地標子展項開發等呼聲很高。我們相信,這個產品對于提升大眾對文學的關注度,增強文學場館的公共服務能力,探討人工智能時代文學數字化發展方向是有積極推動作用的。接下來,我們希望在中國作協的指導下,通過全國文學館聯盟和中國現代文學館的引領,讓各地、各館都參與到內容的細化、數據的流通、子展項的開發中來,使之真正成為一張融通的、有用的、好玩的文學地圖。這需要大家形成共識,協同推進。與此同時,我們也將本著“文化+科技”“文化+旅游”“文化+地理”的融合發展思路,進一步強化AI賦能,讓它可以更便捷地為每一位受眾服務。
為更多文學數字化產品“打樣”
記 者:“中國文學地圖”的數據在持續不斷匯總和更新,具有鮮明的生長性。其中文學數據的篩選標準是怎樣的?這與今年4月發布的《文學數據管理與應用總體要求》團體標準有怎樣的關系?
葉 彤:“中國文學地圖”是《文學數據管理與應用總體要求》團體標準發布后第一個嚴格按照這一標準執行的文學數字化產品,它給其他的產品“打了個樣”。也就是說,如果全國各地的文學場館都像“中國文學地圖”一樣對數據進行采集、存儲、交換、分析和開發應用,那么大家各自開發的成果最后是可以無縫銜接的,數據是可以自由流動的,不會成為一個個“孤島”。
以“文學西湖”數字化展項為例。我們把1148個地標分成了館、景、跡三大類,然后針對“西湖”這個歸類為“景”的地標開發了“文學西湖”數字化展項,采集了從古至今與西湖相關的200多位文學家的數據、11000多首古詩詞以及現當代文學作品的數據,根據西湖的每一個景點相關的朝代、文學家的游線等進行了分析和歸類,最后制作成可互動的應用。在此過程中,我們設定了數據條目、數據類型、互動方式等,都是可復制的。最后,這個應用使用了標準接口,它可以落地到使用同樣接口的任何場館。
在這里必須重點強調的是,“中國文學地圖”上的每一個地標都可以像“文學西湖”數字化展項一樣,單獨拓寬為“文學+地理”“文學+旅游”的全景式數字化展項,然后掛載到一起,形成一個龐大的展示中國文學全景的動態地圖,它的延展空間是巨大的,具有無限的想象空間。
《文學數據管理與應用總體要求》團體標準相當于給文學數字化鋪了第一條“高速公路”。“中國文學地圖”體現了標準的“全過程”要求,即“從數據采集到應用”形成閉環;展示了標準的“實操性”要求,在數據管理上明確重點文學數據采集方向和內容,規范格式、便于交互;突出了標準的“引領性”要求,能夠推動文學數據應用場景落地,增強文學場館活力。如果沒有團體標準這條“高速公路”,大家有的跑國道,有的跑省道,有的跑山路,各自跑各自的,就難以形成一種標準化產品。
推動全國文學資源整合與有效利用
記 者:“中國文學地圖”是基于中國新時代文學大數據中心的框架體系,秉持共建、共融、共享的發展理念研究推出的中國文學數字化產品。在創建過程中,它是如何體現標準、數據、平臺、應用、安全五大體系協同推進的?未來如何實現其可持續發展?
葉 彤:中國新時代文學大數據中心的標準、數據、平臺、應用、安全五大體系,是互相關聯、互相依存同時又互相推進的:標準是規范,數據是基礎,平臺是保障,應用是目的,安全是前提。以“中國文學地圖”為例,它首先是基于中國新時代文學大數據中心開發的“全國基礎文學數據庫”,在這個數據庫中有相關的文學地標、古詩詞等可以使用,我們在開發具體應用的時候,其實只要根據需求來考慮讓這些數據流向何方,然后如何進行管理。所以,五大體系可以為所有數字化應用的開發和運維提供支撐,并推動全國文學資源的整合和有效使用。
“中國文學地圖”和全國首個文學智能體、“館際通”平臺一樣,是在中國新時代文學大數據中心上“生長”出來的成果。所有這些應用的可持續發展,均依賴于中心的可持續發展,現在中心的整體框架已經搭建好了,基礎設施已基本完善,下一步準備做好以下幾個方面的工作:
一是夯實基礎、發揮優勢。不斷提升優化數據庫和綜合服務平臺,特別是強化AI賦能,持續增強平臺的服務能力和應用開發水平。充分發揮已有的平臺和技術優勢,在建設開發中更加聚焦“正在發生的文學”,進一步凸顯中心在呈現文學現場上的作用;更加聚焦文學數據活化利用,用好用足“中國文學地圖”等成果。二是理順機制、融通數據。依托全國文學館聯盟,持續完善文學數據流入機制、數據版權保護機制、應用成果分享機制等,在現有成果的基礎上實現全國文學場館的“一鍵融通”,加快構建“數字共同體”。三是協同推進、合作共建。我們期望在中國作協的指導下,結合國內文學場館的合作共建需求,在中國現代文學館和浙江文學館合作基礎上,適時組建中國新時代文學大數據中心的分中心,逐步形成東西南北中的格局,合力推動各項建設成果在全國層面的普及應用,更好地服務全國的文學愛好者和社會公眾。
眾人拾柴火焰高,唯有大家都參與進來,中國新時代文學大數據中心才能越發彰顯出它的價值。
多方共建,協同培育新質生產力
記 者:結合這一系列實踐經驗,您認為“文化+科技”“文學+人工智能”“文學+大數據”如何切實有效推動新時代文學事業在數字化浪潮中蓬勃發展?這給培育文學新質生產力帶來哪些新的課題?
葉 彤:在風起云涌的數字化浪潮中,我們所做的文學數字化工作只是微小的嘗試。但是,總體方向是明確的,我們的步伐也是堅定的。在數字化時代,文學如果不擁抱變化,不擁抱人工智能等新技術,很難想象它將如何滿足新時代讀者、觀眾的需求。推進中國新時代文學大數據中心建設過程中,取得了一定的成效,也形成了幾方面的共識:
一是必須緊緊圍繞“文學”這個核心。從元宇宙到人工智能,從AR/VR到大模型,技術手段和應用方式迭代更新很快,但是一旦偏離了文學和文字,所有應用就成了空中樓閣。所以,無論是數字體驗廳的建設,還是大模型的開發,我們都立足于作家作品,立足于文學史,圍繞文學本身去開發應用、設置互動,讓文學成為大數據中心的“魂”。
二是必須緊緊圍繞“數據”這個基礎。隨著大模型和人工智能的不斷進化,數據的重要性越來越凸顯,高質量、高純度的文學數據尤其顯現出它的獨特價值,對將來的文學研究、輔助創作、語義生成等將起到至關重要的作用。兩年來中心不遺余力地推進文學數據的標準編制,積極建設一系列小而美、小而精的文學數據庫,并持續訓練文學垂類大模型,就是為了構建起一個能支撐中心可持續發展的文學底座。
三是必須緊緊圍繞“服務”這個目的。我們所有的數字化項目都強調要讓數據活起來、跑起來,在開發應用的過程中要求各個系統之間數據要融通,最終都指向要讓數據服務于作家、服務于受眾,讓文學以更直接、更便捷的方式與老百姓產生關聯,從而賦能全民文學素養的提升。同時,數字化應用打破了地域限制,從而有效提高文學作品的傳播效率和覆蓋面,甚至可以促使中國文學作品更便捷地走向世界,促進中外文學交流。
中國新時代文學大數據中心的實踐表明,“文學+科技”不是簡單的技術疊加,而是通過數據要素激活文學價值、通過智能工具拓展創作邊界、通過數字場景重構文化體驗的深刻變革。在文學新質生產力的培育方面,它可以延伸和拓展的面非常多,尤其是在輔助創作與創意激發、智能化文學教育、文學研究批評、跨媒介文學表達和展示、文學數據產業化等領域都將帶來新的課題,值得深入探討和研究。核心在于把握三對關系:人機協同中堅守人文主體性,避免文學淪為算法的附庸;技術應用與倫理約束并重,讓創新行進在正確軌道上;此外還要注意數據開放與版權保護的平衡。
記 者:您認為,在數字化浪潮中,文學界應當在哪些方面增強主動性,積極推進實施國家文化數字化戰略?
葉 彤:接下來,我們還將繼續秉持“共建、共融、共享”理念,在中國作協和浙江省委宣傳部的指導下,以標準為基、技術為翼、內容為核,聯動各級文學領域相關單位,持續推進文學數字化工作。一是構建標準化數據體系,破除“孤島效應”。通過推廣標準,推動文學資源跨平臺互通,同時篩選適用性強、技術引領的核心標準,加速團體標準向國家標準、行業標準轉化。二是打造智能化平臺生態,賦能全鏈條服務。推廣“館際通”模式,實現數據所有權與使用權分離,支持跨地域資源共享,降低數字化建設成本,開發更多沉浸式體驗場景。三是革新創作與傳播機制,培育新質生產力。推動人機協同創作、構建IP全產業鏈開發體系、拓展國際傳播路徑等領域的創新。四是完善保障機制,夯實可持續發展基礎。特別是強化技術支撐與人才培育,構建安全與倫理治理框架。在數據安全與倫理約束下,通過產學研協同培育新質生產力。唯有如此,方能在數字文明中點亮文學的精神燈塔。