资深互联网观察家,长期致力于中国互联网产业和企业研究。
有些东西已经消失了,有些东西正在消失,有些东西消失了又找出来了。
没错,我说的就是文化这“东西”。
经历各种大风大浪的中华民族,绵延5000年而文明不绝,就是因为有文化这“东西”。
一般来说,文化传承、文明传承有两个重要载体,一是实物,二是文字,当然很多时候文字也是实物。
《典籍里的中国》都看过吧,央视近期最火的一档类目。这档节目,说的就是文字典籍传承文明的故事。正如中国传媒大学新闻传播学部学部长高晓虹所总结:以《尚书》为代表的中华典籍,见证了民本思想的发端,构建了古老文明的体系;以《天工开物》为代表的科技典籍,记载了古代良工巧匠的奇思妙想,铭刻了先贤经世致用的实学思想……这些瑰丽的文化密码,讲述着我们中国人从何而生,为何而来,又该去向何方。
通过《典籍里的中国》,我们了解到像《尚书》这种文著经历了一次次动荡,尽管有伏生等人舍命护书,但因为各种风波诸多内容已经丢失,今天我们看到的其实是一个《尚书》残本。
事实上,历史上典籍丢失、损毁的事情远比《典籍里的中国》呈现的更为让人伤心落泪。从焚书坑儒到《四库全书》藏书阁被毁,再到敦煌藏书倒卖海外,这样的事情数不胜数,每每提及总让我们扼腕叹息。
据相关统计,近代以来散居海外的中国古籍超过40万部、400万册,包括甲骨简牍、敦煌遗书、宋元善本、明清精椠、拓本舆图、少数民族文献等。
上学时,我经常听到老人和老师说“这本书已经没有了” “某某典籍流失海外了” “某某文献再也看不到了”,伴随的往往是摇头叹息。
这些东西真的再也没有了、再也看不到了吗?
未必!
今天要说的重点要来了:几年前,阿里巴巴&阿里云&达摩院、四川大学、美国加州大学伯克利分校达成合作,计划用AI识别中国古籍的方式,将存放于海外的中国古籍,以数字化的形式接回故土,放置于阿里云平台,向所有人免费开放。
我们都知道,现代文字用AI识别难度不大,可是古籍文字用AI识别靠谱吗?老实说,我对此期待不大,因为古籍记载用的不是标准化的文字,我很担心到时候出来的是一个无法检索的影印版、文字图片版,那样的话意义就大打折扣了。
没想到,用了两年多时间,阿里真出成果了。前段时间,阿里达摩院宣布完成了20万页中文古籍的数字化,识别准确率达到97.5%,最终沉淀为覆盖3万多字的古籍字典,落地「汉典重光古籍平台」。这些散落海外近百年的古籍善本,终于以数字化方式回归故土。
首批数字化的20万页古籍中,包含40余种珍贵宋元刻本、写本;明清至民国时期著名学者钱谦益、翁方纲、王韬的抄本、稿本;著名藏书楼嘉业堂、密韵楼的抄本,还有清文澜阁《四库全书》零本等。
我试着输入“李白”“文天祥”“水龙吟”“为天地立心”等词汇,皆能定点查询、锁定,极为方便。
免费开放这一点很重要!可能很多人不知道,即便在典籍还没失传的古代,也只有很小一部分能才有机会阅读、学习经典。在古时候,书某种程度上来说就是一件奢侈品。而在今天,任何人有一台能上网的设备,就可以免费阅读到这20万册经典典籍,这其中有很多是我认为已经失传的超级经典。
可以毫不夸张的讲,阿里巴巴&阿里云做的事情,就是将文化、文明重见天日的事情。
北宋大儒张载说,圣人有四大不朽“为天地立心,为生民立命,为往圣继绝学,为万世开太平”。阿里巴巴&阿里云助力20万页古籍以数字化的形式回归,人人可查可观可学习,你们说阿里是不是做了一件“为往圣继绝学”的事情,这件事情是不是最最最最功德无量。
前段时间,B站网友说阿里巴巴是万恶的资本家,把马云骂了个狗血喷头。现在了解到阿里另外一面的年轻人,是不是应该重新把阿里供奉起来,对着马云虔诚默念“阿弥陀佛,马菩萨”。
写在最后:差点忘记说了,这个项目通过百度居然无法查询到网址(百度抓取部门的工程师该打屁股了),所以我手工把网址打出来。汉典重光 https://wenyuan.aliyun.com/home,也可以阅读原文直接访问。
丁道师
2005年首次提出“自由媒体人”概念,随后简称为自媒体,影响至今。
2011年,丁道师加盟速途网络,先后担任速途专栏主编,速途执行总编辑兼速途研究院院长等职。
2014年丁道师作为自媒体代表,牵头起草《中国自媒体的自律规范》,并在网信办座谈会上分享,引发广泛关注。
现在是企鹅号、一点资讯、百度百家、今日头条、艾瑞专栏、人民网(603000,股吧)专栏等主流科技媒体和新闻客户端的专栏作家。
本文首发于微信公众号:丁道师。文章内容属作者个人观点,不代表和讯网立场。投资者据此操作,风险请自担。