《儒藏》的命運正迎來它的關(guān)鍵節(jié)點。
二十一世紀(jì)初,前所未有的古籍整理項目開始了——《儒藏》,力求收錄整理存世的、海內(nèi)外較有價值的儒家經(jīng)典文獻并進行點校,提供最完善的、方便現(xiàn)代人閱讀的文本。粗略統(tǒng)計,存世儒家典籍文獻約有1.5萬至1.8萬種,足見這一文化工程之浩大與艱巨。在三代“儒藏人”的共同努力下,2022年,《儒藏》“精華編”中國部分510種、282冊全部整理完成并出版,近兩億字。
“沒人想到,這件事(精華編)一做就是20年。”現(xiàn)任《儒藏》首席專家、北京大學(xué)副校長王博稱。
接下來,《儒藏》工程轉(zhuǎn)入新的階段——《儒藏》全本,計劃收書3000余種(含“精華編”),將以中國豐富的儒學(xué)典籍文獻為基礎(chǔ),基本囊括中、韓、日、越四國歷史上有價值的儒學(xué)文獻。
對古籍整理來說,速度和質(zhì)量往往難以兼顧。對《儒藏》來說,質(zhì)量就是生命。若按照原有的速度,這項工程將長途跋涉、遙遙無期。
在人工智能技術(shù)的輔助下,提速的現(xiàn)實正在發(fā)生。王博說,全本《儒藏》的編纂具有更加有利的社會環(huán)境、學(xué)術(shù)積累、人才儲備和技術(shù)支撐?!跋乱徊焦ぷ鲗⒊浞掷脭?shù)字人文的最新成果,推進古籍?dāng)?shù)字化,工作將大大提速?!?/p>
“儒藏人”正在期待全新的古籍整理圖景,那將是一場超出想象的畫面?!傲鞒坛墒熘螅A(yù)計第一年是啟動期(50種);第二年預(yù)計出150種,后續(xù)預(yù)計每年出300種,大概是之前4倍或者8倍的速度?!弊R典古籍產(chǎn)品負(fù)責(zé)人王宇說。
“識典古籍”是字節(jié)跳動聯(lián)手北京大學(xué)共同打造的古籍?dāng)?shù)字化平臺,已具有版式識別、自動標(biāo)點、結(jié)構(gòu)整理、??钡壬婕肮偶淼娜鞒陶砉δ?,它將支持開展《儒藏》數(shù)字化工程,后續(xù)成果也將在識典古籍上線,對公眾開放。
《儒藏》,前無古人
未名湖邊坐落著四棟仿明清風(fēng)格建筑,由西向東數(shù)去第二棟,是《儒藏》編纂與研究中心所在的才齋。每天8點,沙志利走入辦公室,在電腦上打開自己常用的古籍?dāng)?shù)據(jù)庫,桌面則堆著一摞摞書稿,比坐著的人還高。有時桌面擺不下,書稿就蔓延到地板上,“那已經(jīng)不能稱之為地板了”——《儒藏》中心幾乎是書稿的王國,他和同事只能在稿子的留白處行動。大家都埋著頭,過一會起來揉揉眼睛,實在累了下樓抽根煙,再上來繼續(xù)干。
這是沙志利在《儒藏》中心的第十九年。2005年,畢業(yè)于北京大學(xué)古典文獻專業(yè)的博士生沙志利加入《儒藏》中心,成為一名助理研究員。何為《儒藏》?我國的佛教、道教皆存集大成之《大藏經(jīng)》和《道藏》,但儒學(xué)典籍卻沒人做類似的整理工作。20世紀(jì)90年代,北京大學(xué)哲學(xué)系教授、國學(xué)大師湯一介呼吁,這件前無古人的事需要有人做起來。2002年底,由北京大學(xué)分管文科的吳志攀副校長牽頭,開了不下五次研討會討論《儒藏》的必要性、可行性、價值及意義。2003年,《儒藏》項目立項,是新中國成立以來最大規(guī)模地系統(tǒng)整理海內(nèi)外儒學(xué)典籍的一項基礎(chǔ)性文化建設(shè)工程。編纂分兩步進行:第一步是《儒藏》“精華編”,第二步再進行《儒藏》“大全編”。2004年,北京大學(xué)《儒藏》編纂與研究中心成立,負(fù)責(zé)組織實施編纂工作,工程正式啟動。
著名哲學(xué)家湯一介教授擔(dān)任《儒藏》總編撰和首席專家,負(fù)責(zé)總體規(guī)劃與實施。他牽頭全國各地,乃至日本、韓國、越南等國的海外學(xué)者共同加入《儒藏》工作組。僅國內(nèi),《儒藏》就有25家合作單位,組織了近 50 所高校、研究機構(gòu),還有近 400 位專家負(fù)責(zé)上游的點校任務(wù)?!度宀亍分行某袚?dān)中間樞紐的角色,負(fù)責(zé)統(tǒng)籌工作及把控校點質(zhì)量,下游的北京大學(xué)出版社則負(fù)責(zé)編輯、校對,嚴(yán)格落實“三審三?!保匾獣r甚至達到“五審五?!保嗟拦ば蛐纬蓢?yán)密的閉環(huán)。
湯一介晚年在工作中
這樣龐大的工程,初期必然面臨著人才與資金不足的困境。2005年,湯一介這樣概括《儒藏》編纂出版的“三大難題”:經(jīng)費籌措難、人才招徠難、組織協(xié)調(diào)難。起初,他經(jīng)常到各地去講座“化緣”,募集資金?!笆虏槐茈y,義不逃責(zé)”,這既是湯一介的家訓(xùn),也是他在《儒藏》項目中一以貫之的原則,他幾乎將晚年的所有時光都耗在《儒藏》上。
2014年6月底,《儒藏》精華編前100冊編纂完成,發(fā)布會上,身負(fù)重病的湯一介坐著輪椅,在家人的攙扶下出席,聲音顫抖但堅定地表達,“只要我活著一天,我就愿意為這個(《儒藏》編纂)工程來盡我的力……我必須繼續(xù)努力,來把全本完成?!蓖?月,湯先生去世,《儒藏》項目成為他未完成的夙愿。
師承湯一介、現(xiàn)任北京大學(xué)副校長的王博接任《儒藏》首席專家和項目負(fù)責(zé)人,繼續(xù)推進《儒藏》“精華編”的工作。2022年5月,《儒藏》“精華編”中國部分282冊全部由北京大學(xué)出版社出版,全本《儒藏》編纂工作正式啟動。
“我們的心情是如臨深淵、如履薄冰?!薄度宀亍房偩幾?、北京大學(xué)中文系教授孫欽善在工程啟動后經(jīng)常重復(fù)這句話。工程立項之初,編纂團隊幾乎在各個方面都遇到了不同程度的阻力。外界曾有質(zhì)疑,認(rèn)為《四庫全書》已經(jīng)包含大部分儒家文獻,無勞師動眾的必要。對此,首席總編纂季羨林當(dāng)時就指出,質(zhì)量才是這套《儒藏》傳世的根本。2007年,季羨林還特地給《儒藏》中心寫過一封信,強調(diào)“寧可慢一點,也要保證質(zhì)量”“質(zhì)量是生命”。
沙志利回憶道,湯一介先生身體還好時,每周都會來《儒藏》中心,他事無巨細,常在開會時拿出一張列得密密麻麻的小紙條。大家想,哪有這么多事?一看,很多其實是關(guān)系到工作人員自身的小事,有時特地注明他要親自給出版社的主編打電話,“對方也是老先生,我來打比較合適”。此外,湯先生也十分重視編撰的質(zhì)量,經(jīng)常為一個細節(jié)討論很久,“因為一個標(biāo)點錯誤就是一個硬傷,”為此,儒藏中心的會經(jīng)常一開就是一整天,湯一介就和其他研究員一塊待在會議室里吃盒飯。
古籍整理,從選目開始,每一步都要無比細致,要確認(rèn)參校的版本,源流選得對不對、合不合適。與此同時,《儒藏》編纂的規(guī)模又格外龐大,預(yù)計總字?jǐn)?shù)將達到10億至12億,《儒藏》精華編便是在精細的工序中來回反復(fù)修改,力求達到差錯率低于萬分之一的出版標(biāo)準(zhǔn)。
《儒藏》整理手稿
“最早精華編計劃5年完成,發(fā)現(xiàn)時間不夠,又計劃用10年,最后用了20年時間,”在沙志利印象里,2007年底《儒藏》進入大規(guī)模編輯階段后,有兩三年時間,從點校人那匯總到中心的書稿堆積如山,責(zé)任編委們每人每年的工作量至少要達到七八百萬字。
入職十九年,沙志利如今已是《儒藏》精華編及全本的責(zé)任編委,負(fù)責(zé)整體??辟|(zhì)量,《儒藏》全本的選目工作要在如今存世的近20萬種古籍并50萬個版本中挑選,既要考慮到實用性,又要考慮到理論的自洽剔除重復(fù),并有序地編排——很多書他們自己沒看過,只能到處詢問可能知道的專家學(xué)者,或是找到存于各個圖書館的文獻親自翻看。全本的選目工作經(jīng)歷了前后幾輪,最終確認(rèn)近三千種書目。
回顧這漫長的二十年,沙志利提起一部講述編纂辭典故事的電影《編舟記》。電影曾用“編舟”形容辭典編纂工作,“人類就是通過辭海這葉小舟,在浩瀚的海洋上找到最能表達心情的語言”,而《儒藏》中心恰是《儒藏》項目涉渡古籍之河的縮影,辦公室里成摞的書稿中,他們每天都要沉潛其中,花費巨量的人力校對每一個字形。
“古籍的整理出版工作就如同河流”,編輯室主任馬辛民曾做過這樣形象的比喻,從選目、確定體例、標(biāo)點、校勘到編輯出版,《儒藏》的編纂歷程漫長而艱難。在這條“河流”的上、中、下游,海內(nèi)外的儒藏人們花費巨量時間、精力,力求打造閱讀儒家經(jīng)典文獻的舟楫,建立現(xiàn)代人與古籍之間的聯(lián)結(jié),讓曾隱沒在古書堆中的文字,再次進入現(xiàn)代人的生活。
用一生做一件很慢的事
“我國做《二十四史》的老先生都已經(jīng)故去,將來會出現(xiàn)人才斷層。”倡導(dǎo)發(fā)起《儒藏》項目時,湯一介已經(jīng)考慮到,系統(tǒng)編纂整理儒家典籍除了在現(xiàn)代“激活”儒家經(jīng)典之外,也能夠“搶救”人才。
《儒藏》總編纂安平秋教授曾指出,部分古籍整理者基本功不牢,也欠缺從事相關(guān)工作的經(jīng)驗,難以確保古籍整理的質(zhì)量。初稿校點人員所交書稿約有60%以上需要退改,還有些書稿在中途更換了校點者。這些都大大拖延了工程進度。立項初期,湯一介、龐樸、孫欽善、安平秋、李中華、魏常海等人每年都會走訪各個合作單位,與部類主編和校點者交換意見,及時解決校點過程中存在的問題,他們幾乎跑遍了祖國大江南北,更涉足韓國、日本、越南等地。
實踐證明,《儒藏》很好地回應(yīng)了文史哲人才的“斷層之殤”:2004年,牽頭單位北京大學(xué)開始為《儒藏》編纂工程專門招生,首批招收碩博研究生共6名,截止到2022年,《儒藏》編纂與研究中心累計已招收120余名博士研究生。如今,這些年輕學(xué)者已經(jīng)逐漸成長為既能從事學(xué)術(shù)研究、又能從事古籍整理的復(fù)合型人才。
“我們也是慢慢成長過來的,”沙志利說道。古籍整理確是枯燥、重復(fù)的工作,而且成果不容易被看見,“挑錯還是很難的,只不過大家會覺得是理所當(dāng)然”,為了校對一個錯字,他們經(jīng)常要比較多個版本。同時,這件工作還給沙志利帶來一定的成就焦慮。包括他在內(nèi)的九位《儒藏》中心的責(zé)任編委,加入《儒藏》時都是剛從北大古典文獻或古代哲學(xué)專業(yè)畢業(yè)的碩博生,懷揣著各自的學(xué)術(shù)追求和野心,卻常年扎在書稿中,沒有時間從事其他學(xué)術(shù)工作。
在科研評價體系中,古籍整理工作相對得不到重視,相較學(xué)術(shù)論文得分很低,這使得從事古籍整理的學(xué)者們成就感薄弱。入職以來,沙志利算過,自己平均下來一年最多寫一篇論文,“天天被拴到稿子上,事實上是不適合做研究的。”有朋友在他情緒低落時,開玩笑地安慰道,“你們?nèi)宀厝耸窃谮H'原罪’?!?/p>
那么,到底是什么讓他堅持下去?其關(guān)鍵驅(qū)動力是前輩的敬業(yè)精神。沙志利曾聽自己的導(dǎo)師安平秋教授講過一件軼事,有次安先生翻看自己點校出版的一本《古文觀止》,忽然發(fā)現(xiàn)一個錯字,當(dāng)下驚出一身汗,“怎么會有一個錯字呢?”安先生說起自己點校失誤的那種惶恐,至今令沙志利記憶深刻。
馬辛民則憶及已故的老編審、語言學(xué)者胡雙寶先生,“胡老師不善言辭,卻是編審中的'第一快’,干起活又快又好。年逾八十,還保持著年輕人的工作狀態(tài),為保證復(fù)審、終審的質(zhì)量,幾乎每周都騎車到學(xué)校圖書館查閱資料。哪怕在青光眼手術(shù)后,仍然加班加點,全身心投入工作?!?/p>
從過去擔(dān)任總編纂的湯一介先生、龐樸先生、安平秋先生、孫欽善先生,到以李中華老師、魏常海老師、王博老師為代表的編委們,再到更年輕的一輩學(xué)人,無不殫精竭慮,全心投入。馬辛民笑言,應(yīng)當(dāng)把二十年來的點滴匯成一本《儒藏編纂志》,“當(dāng)時畢業(yè)參加工作的青年學(xué)生,一轉(zhuǎn)眼已經(jīng)人到中年……對每個人來說,編纂《儒藏》都是太難忘的經(jīng)歷。”
《儒藏》總編纂合影
今年47歲的沙志利回憶自己從助理研究員到責(zé)任編委的工作歷程,偶爾也有成就時刻。儒藏《精華編》出版后,沙志利的朋友曾向他轉(zhuǎn)達一名海外漢學(xué)家的稱贊,指出他負(fù)責(zé)點校的那幾本文獻“整理得真好!”
馬上要迎來艱巨的全本編撰工作,沙志利感慨道,“可能這輩子也學(xué)不會新的本事了……但我的下半生已經(jīng)有著落了。”朝經(jīng)暮史,鉛黃殆遍,“儒藏人”正是如此年復(fù)一年地?zé)o言踐行著內(nèi)心的文化信念與責(zé)任意識,堅實推進著這項前無古人、惠澤后世的事業(yè)。
“4倍、8倍的加速度”
原本,儒藏人將迎來的是一場艱辛的“長途跋涉”?!度宀亍肪A編收錄文獻510種,耗時20年,按照這一速度,選書達三千種的《儒藏》全本要耗費的時間難以計數(shù)。但ocr文本識別技術(shù)的輔助將改變這一切——全本編纂時間有望大大縮短。
北京字節(jié)跳動公益基金會理事長張羽表示,“《儒藏》工程中的很多工作是可以在人工智能技術(shù)的輔助下被解決和提效的?!弊止?jié)跳動公司將向北京大學(xué)教育基金會捐贈人民幣2500萬元,用于資助北京大學(xué)《儒藏》數(shù)字化編纂相關(guān)工作,同時提供公益性質(zhì)支持,識典古籍?dāng)?shù)字化整理平臺將助力《儒藏》推進相關(guān)工作。
過去的古籍整理工作,前期的整理、校勘階段都以紙稿形式進行,一直到出版社階段才會形成文稿的電子版,而且需要真正的人力一個字一個字輸入電腦,尤其古籍中生僻字多,單單由書稿轉(zhuǎn)電子版就非常費力。
“如今通過ocr文本識別,能夠從初始階段就將書稿轉(zhuǎn)為電子版?!蓖跤罱榻B道,經(jīng)過兩年多的發(fā)展,識典古籍已經(jīng)具有版式識別、自動標(biāo)點、結(jié)構(gòu)整理、??钡壬婕肮偶淼娜鞒陶砉δ?,其ocr文本自動識別功能,準(zhǔn)確率達到95%以上。
《儒藏》的整理者將相關(guān)文獻的影像上傳平臺后,由人工智能進行初步整理,專業(yè)人員進行校對及做出更有深度的學(xué)術(shù)判斷,這樣可以大大減少專家在基礎(chǔ)性工作上投入的精力?!白屨嬲拇竽X去做更重要的事?!蓖跤钫f。
“人工智能把特別繁瑣重復(fù)的事干了,讓校點者去干更需要判斷力的事?!鄙持纠f自己特別期待這一天。
此外,平臺還開發(fā)了自動校本比對技術(shù),“識典古籍”已經(jīng)完成文本化的1萬種古籍后續(xù)也可選做校本進行比對。沙志利表示,不同版本的??闭枪偶砉ぷ髦凶詈馁M人工的環(huán)節(jié),“有時候看了兩萬字的稿子,才寫了三條校對筆記?!薄度宀亍讽椖啃?睍r需要對比的文獻版本較多,目前的平臺功能尚未足以滿足。不過,《儒藏》全本工程的開展將全面從紙面轉(zhuǎn)為電子化。
“識典古籍”平臺已上線古籍1萬部,并免費對公眾開放
沙志利指出,數(shù)字化的另一優(yōu)勢在于節(jié)省協(xié)作時間。在“精華編”編纂過程中,由于每位編委往往同時處理多部書稿,且進度并不統(tǒng)一,點校人的工作也可能受到科研、教學(xué)乃至其他事件的干擾,審校流程經(jīng)?!暗葋淼热ァ?,互相干擾。如今,識典古籍平臺開發(fā)了協(xié)作整理功能,支持以團隊的形式開展工作,點校人在平臺上點校,審校人可以同步進行審核,隨時給予反饋,這極大跨越了《儒藏》從點校人到責(zé)任編委審核環(huán)節(jié)的時空限制。
以前,要是遇到校點者個人有點事,工作就停滯了,拖個一年半載。但現(xiàn)在,校點者剛點出來兩卷,審稿人就可以介入了?!霸瓉淼臅r間銜接單位是100萬字,現(xiàn)在可以變成5萬字、2萬字……”
速度的變化是倍數(shù)級別的。王宇稱,《儒藏》“精華編”的整理速度大概一年36種,而等數(shù)字化流程成熟之后,“預(yù)計第一年是啟動期(50種);第二年預(yù)計出150種,后續(xù)預(yù)計每年出300種,大概是之前4倍或者8倍的速度?!?/p>
湯先生曾講到《儒藏》與《四庫全書》的重要區(qū)別,“《四庫全書》沒有標(biāo)點。現(xiàn)在的人用起來非常不方便,并且能看到的也都是影印本。而《儒藏》要做的,不是影印本,而是標(biāo)點排印本,有??庇洠€可以做成光碟,便于大家檢索和普及利用?!?022年出版的《儒藏》“精華編”便依據(jù)起初的設(shè)想,立足現(xiàn)代,知難而進,采取繁體豎排,現(xiàn)代標(biāo)點附校勘記的形式,整理出完足可靠、可資閱讀使用的文本,既大大方便現(xiàn)代讀者閱讀,也為今后與數(shù)字化接軌提供必要的基礎(chǔ)。
《論語》在“識典古籍”的閱讀展示
未來,《儒藏》的相關(guān)成果也將陸續(xù)在“識典古籍”閱讀端上線,實現(xiàn)全民共享,讓中國傳統(tǒng)文化、儒家文化,能夠被更多人以更方便的方式去檢索和閱讀。
“每一代人都要面對歷史,這不僅是個人的歷史,也包括一個民族、一個國家的歷史,同時也是一個文明的歷史。”王博指出,《儒藏》編纂正是這樣一個懷有對歷史的敬意、朝向未來的文化工程。