激活数字服务平台 , 给“养在深闺”的古籍注入新的生命力
古籍 , 即1912年之前经过刻印、抄写等方式所生产出版的图书和文献 , 用来传承文明、普及教育以及记载历史 , 承载厚重的历史和文化 。 相关统计数据显示 , 我们已完成普查的270多万部古籍中 , 仅有7万多部可供线上阅读 , 更多海量古籍文化资源亟待数字化 , 这也是当下古籍保护、传承与开放的重要课题之一 。 目前上海古籍出版社推出的“汇典·古籍数字服务平台”引起业界关注 , 该平台聚合上海、长三角乃至更广泛地区出版社的优质古籍资源 , 利用最新光学文字识别(OCR)、自然语言处理、大规模语料库和机器学习标点等古籍智能算法技术 , 建设面向传统文化与古籍行业的知识服务平台 。
“北方有中华书局‘籍合网’ , 南方有上海古籍出版社‘汇典’ 。 ”复旦大学图书馆副馆长、中华古籍保护研究院常务副院长杨光辉表示 , 古籍数字化对于中华古代文明的传承、保护和利用有着积极的促进作用 , 这一平台一方面可以把上海古籍出版社多年积累起来的古籍文化资源通过数字化的方式向大众普及 , 另一方面也可以加速古籍数字转化和出版的流程 , 推动相应出版产业领域的数字化发展 。
经历数十年发展的古籍数字化之路任重道远
从“将纸质书变为电子扫描版”的“采集侧”到“将电子扫描版变为文字版”的“生产侧” , 再到“将文字版变为古籍研学系统”的“应用侧” , 古籍数字化流程并不复杂 。 在数十年历史发展中 , 有两个分水岭 。 其一是上世纪80年代 , 美国华裔学者陈炳藻提出用计算机统计《红楼梦》的字词 , 计算机技术和人文研究逐渐开始结合 。 其二是1999年 , 被誉为“大型中文电子出版工程的典范书”文渊阁《四库全书》电子版问世 。
【激活数字服务平台,给古籍注入新的生命力】在数十年的发展中 , 我国的古籍数字化取得一定成效——国家图书馆的“中华古籍资源库”已在线发布超过3.3万部古籍影像;中华书局的“中华经典古籍库”已发布3000多种、15亿字的点校本古籍;爱如生公司的“中国基本古籍库”收书1万种 , 既有可供检索的全文 , 又有古籍原版图像 。 但与此同时 , 古籍数字化推进之路也铺满荆棘 。 究其原因 , 一方面源于古籍成本 , 据上海古籍出版社数字出版中心负责人侯君明透露:“大多古籍获取成本不菲 , 此外制作、版权、平台开发以及版权保护技术研发等方面费用高昂 。 相对而言古籍数字化回报周期却又比较漫长 。 ”另一方面 , 根据全国古籍普查工作要求 , 要对全部古籍鉴定编目 , 具体包括书名、卷数、作者、版本、存卷、册次、藏印等项目 , 须逐一厘清 , 工作量巨大 , 对编目鉴定者的业务水平要求颇高 。
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
