浩如煙海的典籍文獻(xiàn)是中華文明特有的存留。“讓書寫在古籍里的文字活起來”,實(shí)現(xiàn)中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性發(fā)展,是當(dāng)代古籍出版業(yè)面臨的新挑戰(zhàn)。
日前,中華書局總編輯、古聯(lián)數(shù)字傳媒科技有限公司董事長顧青在接受本報(bào)記者專訪時(shí)表示,中華書局的數(shù)字化戰(zhàn)略,將根據(jù)國家規(guī)劃,著力打造中華傳統(tǒng)文化大數(shù)據(jù)中心和國家級古籍整理出版資源平臺,使中華書局成為國內(nèi)領(lǐng)先的優(yōu)質(zhì)傳統(tǒng)文化數(shù)字資源的內(nèi)容提供商和知識服務(wù)商,再造一個(gè)“線上中華”。
中華經(jīng)典古籍庫:以最高質(zhì)量匯聚優(yōu)秀古籍
“處理古籍,我們要應(yīng)對的是幾千年留下來的各種形體漢字。越是大數(shù)據(jù)時(shí)代,古籍?dāng)?shù)據(jù)來源的可靠性、準(zhǔn)確性、規(guī)范性就越是重要。這些漢字呈現(xiàn)要準(zhǔn)確,而且能夠被檢索。”2014年,中華書局“中華經(jīng)典古籍庫”發(fā)布,4年來已從初期的2億字?jǐn)U展至10億字,從單一的局域網(wǎng)版擴(kuò)展到在線版和微信版。“我們經(jīng)過多年積累,建立了11余萬字的字庫,解決了絕大部分古籍生僻字、異體字和字符集外字等用字難題,滿足了古籍文獻(xiàn)全文本數(shù)字化加工要求。”顧青說。
面對目前市面上良莠不齊的古籍資源庫,顧青用“自來水”和“純凈水”的差別來比喻其質(zhì)量的差異。“目前網(wǎng)絡(luò)上各類古籍?dāng)?shù)據(jù)庫不少,數(shù)量大、版本多,但是存在兩個(gè)大問題,一是沒有版權(quán),二是差錯(cuò)率高,不能被直接引用。中國幾千年的文獻(xiàn)流傳,尤其一些經(jīng)典文獻(xiàn)歷經(jīng)各代抄、刻、刪改,如不進(jìn)行認(rèn)真整理,會出很多問題。中華書局是代表國家做這個(gè)項(xiàng)目,我們的數(shù)據(jù)庫必須是以古籍整理為基礎(chǔ),因此‘中華經(jīng)典古籍庫’的特點(diǎn)是:基于古籍整理成果和規(guī)范的海量合法數(shù)據(jù),最高質(zhì)量,可供征引。”
除了質(zhì)量過硬,“中華經(jīng)典古籍庫”還實(shí)現(xiàn)了多功能服務(wù),不僅能瀏覽、閱讀、定制資源,在線編輯、下載、寫作,還可以全文檢索、深度檢索和個(gè)性化檢索。
“中華經(jīng)典古籍庫”發(fā)布后,銷量持續(xù)增長,并在美、日、德、英等國實(shí)現(xiàn)了海外銷售。2015年銷售收入400萬元,2017年升至 1500萬元,今年預(yù)計(jì)可達(dá)2800萬-3000萬元。
顧青表示,加速發(fā)展的同時(shí),也要解決產(chǎn)品面臨的“痛點(diǎn)”。“一是版權(quán)問題。我們是代表國家形象,必須嚴(yán)謹(jǐn),所有書的版權(quán)我們都是一家家出版社去簽合同。二是制作問題。新中國成立以來很多古籍的數(shù)據(jù)是不能用的,有的全是鉛排,要重新錄入、制作。因此,數(shù)據(jù)庫只能以每年3億-4億字的速度增加,每1億字意味著500萬-1000萬的資金投入。”
“未來還要將新中國成立以來整理好的優(yōu)秀古籍全部融匯進(jìn)去,‘十三五’的目標(biāo)是30億字,5000種整理本古籍。我經(jīng)常鼓勵員工,當(dāng)數(shù)據(jù)量達(dá)到一定程度時(shí),我們質(zhì)量優(yōu)勢就能充分體現(xiàn)了。”顧青說。
產(chǎn)業(yè)升級,開創(chuàng)古籍整理出版3.0時(shí)代
今年4月,國家級古籍整理出版資源平臺“籍合網(wǎng)”上線,這是一個(gè)基于古籍整理與數(shù)字化的綜合性知識服務(wù)平臺,由中華書局旗下的古聯(lián)公司負(fù)責(zé)建設(shè)和運(yùn)營。
“籍合網(wǎng)”的一個(gè)令人矚目的功能,是推出了“古籍整理工作與發(fā)布平臺”這一在線應(yīng)用系統(tǒng),可通過發(fā)放整理任務(wù)、自主申領(lǐng)選擇的“眾包”形式,實(shí)現(xiàn)古籍的線上協(xié)作整理。同時(shí),平臺還提供校勘、標(biāo)點(diǎn)、注釋等一系列在線工具,“籍合網(wǎng)”的數(shù)據(jù)庫也可供整理者利用,使古籍整理的質(zhì)量更有保證。整理工作完成后,成果可直接在“籍合網(wǎng)”上發(fā)布,實(shí)現(xiàn)全流程數(shù)字出版。
“越是大型項(xiàng)目,這一平臺越有優(yōu)勢,例如‘中華大藏經(jīng)續(xù)編’多達(dá)兩億字規(guī)模,利用線上整理和全媒體出版,可減少重復(fù)勞動,提升質(zhì)量,使古籍整理的生產(chǎn)能力成倍增加。”顧青說,“古籍整理出版從‘紙—紙’的1.0時(shí)代,發(fā)展到‘電子—紙’的2.0時(shí)代,現(xiàn)在又進(jìn)入了‘電子—電子’的3.0時(shí)代。‘籍合網(wǎng)’是對古籍整理出版產(chǎn)業(yè)鏈進(jìn)行重組的一次大膽嘗試,通過線上線下聯(lián)動,充分發(fā)揮網(wǎng)絡(luò)技術(shù)和新科技的優(yōu)勢推動古籍整理工作,這將徹底改變古籍整理出版的生態(tài)。”
顧青還透露,為了實(shí)現(xiàn)古籍的知識服務(wù),目前,中華書局正準(zhǔn)備做“中華傳統(tǒng)文化大數(shù)據(jù)中心”,將涵蓋中國傳世古籍的主要品種,基本滿足學(xué)術(shù)界和全社會對優(yōu)質(zhì)傳統(tǒng)古籍的需要。計(jì)劃三年時(shí)間完成150億字,2萬種古籍的整理工作,其中50億字(自有版權(quán))要完成??迸c標(biāo)點(diǎn),成為可供閱讀引用的標(biāo)準(zhǔn)文獻(xiàn)。
“‘中華傳統(tǒng)文化大數(shù)據(jù)中心’的基礎(chǔ)是已經(jīng)過深度標(biāo)引的知識化、結(jié)構(gòu)化的數(shù)據(jù),這是中華書局?jǐn)?shù)字古籍的核心競爭力。這是中華書局的未來,更是中華優(yōu)秀傳統(tǒng)文化和古籍整理出版的未來。”顧青表示。(李揚(yáng))
原標(biāo)題:打造“線上中華”,讓古籍煥新生
轉(zhuǎn)自:文匯報(bào)
【版權(quán)及免責(zé)聲明】凡本網(wǎng)所屬版權(quán)作品,轉(zhuǎn)載時(shí)須獲得授權(quán)并注明來源“中國產(chǎn)業(yè)經(jīng)濟(jì)信息網(wǎng)”,違者本網(wǎng)將保留追究其相關(guān)法律責(zé)任的權(quán)力。凡轉(zhuǎn)載文章及企業(yè)宣傳資訊,僅代表作者個(gè)人觀點(diǎn),不代表本網(wǎng)觀點(diǎn)和立場。版權(quán)事宜請聯(lián)系:010-65363056。
延伸閱讀