《2024字节跳动企业社会责任报告》发布,报告中展示了数字化平台“识典古籍”如何助力古籍整理,据专家介绍,该平台通过智能技术提高了古籍整理的效率和准确性,使整理效率提升了五倍,此举对于保护和传承传统文化具有重要意义。

《2024字节跳动企业社会责任报告(中国)》正式发布,这份报告以“科技让生活更美好”为主题,详细介绍了字节跳动在过去一年里运用科技力量连接社会、传递善意的实践成果,特别值得关注的是字节跳动在推动古籍数字化方面的持续努力。 中华文明拥有数千年的悠久历史,典籍作为传承中华文明的重要载体,不仅是中国古典学研究的基础,也是社会大众继承和发扬传统文化的重要资源,同时还是世界了解中华文明的重要途径。 国际著名图书馆学家钱存训先生曾判断,中国的书籍产量在十五世纪末之前已极为丰富,通过“中华古籍保护计划”的普查,初步估算出中华典籍文化遗产总量约为传世古籍20万种、50万个版本,自1999年“文渊阁四库全书”数据库发布以来,古籍数据库已成为中国古典研究不可或缺的基础设施,尽管大多数重要典籍已数字化,但由于商业古籍数据库的限制和人力校对的成本上升,古籍数字化的成果并未得到充分利用。 为了解决这个问题,字节跳动公益在2022年10月推出了识典古籍平台——一个完全公益的古籍智能阅读和整理平台,该平台充分应用人工智能等新技术于古籍数字化,创建了大字符集解决方案,利用OCR技术识别古籍图像文本,并通过人工校对持续扩容古籍图文库,识典古籍已免费公开1.6万余部古籍,每月访问量超过240万用户,预计至2026年底,该平台发布的古籍品种数量将达到甚至超过目前所有商业和公益古籍图文库的总和,为社会公众及海内外学者利用古籍提供了极大便利。 识典古籍的建设速度得益于人工智能等科技的力量和大众的参与。“众筹建设”是公益古籍数字化项目的重要路径之一,识典古籍通过动员爱好者力量,联合国内多家古籍研究机构和全国百余所高校,发起了“我是校书官”活动,吸引了大量学生和公众参与,识典古籍还充分利用自动标点、自动分段、自动校勘、自动结构整理等AI技术,成为古籍整理和研究的数字人文平台,据专家测算,引入数字整理平台后,至少可以提高五倍效率,极大加快了古籍整理工作的进程。 除了古籍数字化,字节跳动在焕发文化活力方面也有不少作为,在非遗传承和文物保护与活化方面,字节跳动通过抖音等平台普及非遗和文物知识,让更多年轻人了解和参与到传统文化的保护中,教育部等九部门发布的《关于加快推进教育数字化的意见》也指出了数字化在扩大优质教育资源受益面、促进人工智能助力教育变革方面的重要性。 识典古籍作为数字化平台在古籍整理方面的应用,不仅有助于解决古籍数字化成果的应用问题,更是对传统文化创造性转化的一种极佳尝试,从游戏“黑神话悟空”到动画电影“哪吒2”,都是传统文化与现代科技相结合的极佳案例,如何更好地利用丰富的典籍文化遗产,等待我们给出令时代满意的答卷。 (文章来源:《2024字节跳动企业社会责任报告》,专家评论:中国科学院自然科学史研究员 孙显斌)