我国数字经济发展进入数据驱动新阶段******
1月4日,中国信息通信研究院在“第五届数据资产管理大会”发布的《大数据白皮书》(以下简称《白皮书》)显示,我国大数据技术产业整体水平大幅提升,已形成数据存储与计算、数据管理、数据流通、数据应用、数据安全五大核心领域。
从《白皮书》披露的数据看,我国大数据发展环境持续向好,创新能力不断增强,生态体系持续优化,市场前景广受认可。
从创新能力看,2021年我国发表大数据领域论文量占全球31%,大数据相关专利受理总数占全球超50%,均位居第一;从生态体系看,2021年我国大数据市场主体总量超18万家,形成了大企业引领、中小企业协同、创新企业不断涌现的发展格局;从市场前景看,2021年我国大数据相关企业获投总金额超过800亿元,创历史新高。
“2022年,我国在政策、人才、资金等方面持续加码,为大数据后续发展注入强劲动力。”中国信息通信研究院院长余晓晖特别指出,《关于构建数据基础制度更好发挥数据要素作用的意见》(以下简称《数据二十条》)的印发,是我国探索数据要素价值释放、做强做优做大数字经济迈出重要一步。
尽管我国数据生产要素制度建设再获关键政策支撑,但未来发展,还要看大数据技术产业,即五大核心领域如何应对挑战。
针对《白皮书》罗列的各项挑战,中国信息通信研究院云计算与大数据研究所所长何宝宏以数据流通领域为例指出,数据流通技术提供了“数据可用不可见”“数据可控可计量”的数据服务新范式,数据流通市场逐渐从“以数据产品为主”向市场驱动的“以数据需求为主”转变,挑战也越发凸显,比如,数据权属界定的场景与问题复杂,对参与数据流通的主体权利关系,理论、制度和产业实践层面均尚未形成共识;数据的估值定价尚缺乏科学、标准的评价方法;数据流通的准入、竞争等行为约束没有清晰的法律界定,配套规则不完善;隐私计算等数据流通关键技术应用不成熟。
谈及被列为首位挑战的数据权属界定,北京大成律师事务所合伙人张建民说:“从土地到石油,生产要素的产权界定是牵一发而动全身的大事,数据确权也是数据基础制度体系最为核心的问题,是数据要素市场化的逻辑起点和法律前提。《数据二十条》将弥合此前关于数据确权的各种分歧,引导各方将力量集中到更为细致的制度研究和设计上。”
数据流通的重要前提是数据开放,它所带来的安全挑战来自何处首先需要廓清,《白皮书》给予明确:数据安全责任体系构建尚不成熟,数据安全的主体责任边界模糊;具体业务场景下的技术落地仍然缺乏实践指引,数据安全管理与技术易脱钩;传统网络安全防护思路与措施无法满足当下的数据安全防护需求。
“对数据开放中的安全性、合规性、权益分配等方面的考量,在一定程度上阻碍了数据的互联互通与价值实现,市场因而呈现‘数据需要开放,却又难以开放’的困境。”中国电子数据治理工程指挥部技术部主任国丽认为,解决这一矛盾需要扎实的安全技术支撑,需建立覆盖产权、流通、分配、治理的一体化的数据安全与数据要素化工程体系。
以《数据二十条》出台为标志,我国数字经济发展从技术引领进入到数据驱动的新阶段,中国电子信息行业联合会秘书长高素梅强调,目前我国数据管理的水平仍然处于初步发展阶段,数据管理的科学性、规范性、实用性仍然影响数据要素市场的进一步培育与开拓。(刘艳)
古籍如何兼顾“藏”与“用”******
古籍如何兼顾“藏”与“用”
——来自古籍数字资源联合发布会的专家观点
光明日报记者 陈雪
“古籍具有特殊性,作为文物必须保护,作为文献必须为读者所用,二者存在矛盾。”——解决“藏”与“用”之间的矛盾一直是古籍工作的重点,山东大学文学院院长、教授杜泽逊说:“数字化是目前最好的办法”。
1月4日,国家图书馆(国家古籍保护中心)、天津图书馆、南京图书馆、云南省图书馆、苏州图书馆、中山大学图书馆等6家单位,在线召开了古籍数字资源联合发布会,发布了6786部(件)古籍资源,可在线免费阅览全文影像。会上,多位古籍专家学者围绕古籍数字资源建设进行了深入讨论。
古籍数字化有何迫切性?未来趋势是什么?专家学者展开了深入探讨。
数字化平衡“文物性”与“文献性”
20世纪90年代初,上海图书馆把内部使用的古籍目录卡片摆在图书馆的走廊里,为了完成“四库全书存目丛书”的版本调查,杜泽逊跑到上图,查阅了十几天卡片。夏天高温,他就到馆外买一根绿豆冰糕含在嘴里,再回到馆内查卡片——为查阅古籍文献,要出差到各地,克服各种困难,这是一代古籍研究者的集体记忆。
“从内部使用到目录卡片放在走廊,再到数字资源挂在网上,这个进步是非常快的。”杜泽逊说,国家图书馆为首的几十家图书馆把古籍数字资源放在网上,读者不必直接使用古籍原件,这是很重要的一条保护措施。此外,在线阅览不知道节省了多少人的时间、体力、财力,对推进新时代古籍工作有重大贡献。
兼顾“藏”与“用”,古籍数字化刻不容缓。“国家图书馆从2000年起开始有计划地将古籍进行数字化,并陆续建成数字方志、碑帖精华等专题库,面向社会公众发布。”国家古籍保护中心办公室负责人王红蕾介绍了古籍数字资源发布的整体情况。2016年,国家图书馆搭建“中华古籍资源库”平台,发布了国图馆藏善本和普通古籍、甲骨、敦煌文献、碑帖拓片、家谱、老照片等数字资源,以及天津图书馆、哈佛燕京图书馆等许多馆外古籍和海外征集古籍资源。2021年疫情期间,读者远程访问需求增长,为回应读者的“急难愁盼”,“中华古籍资源库”实现了免登录阅览。资源库上线、免登录阅览被学者称为惠及学林的两个重要节点。
2007年以来,随着“中华古籍保护计划”的深入开展,各地图书馆陆续投入人力物力,大力推进古籍数字化。苏州图书馆党委书记、馆长接晔介绍,截至目前,苏州图书馆已完成数字化古籍1496部,容量达16.12TB。
据了解,国家图书馆(国家古籍保护中心)先后联合39家单位发布古籍资源2.8万部(件),此次是第七次联合发布,6家收藏单位新增发布古籍资源6786部(件),不仅有明清版刻、稿抄本古籍,还有碑帖拓本等特色资源:新增国家图书馆藏古籍数字资源1075部19.2万叶,主要为年谱类、目录类古籍;天津图书馆发布馆藏稿抄本文献165种655册;南京图书馆发布了“清人文集数据库”,共收录清人文集399种,以全本彩色扫描的方式制作成数字影像;云南省图书馆发布馆藏善本63部381册,图像50604拍;苏州图书馆发布馆藏古籍数字资源888部;中山大学图书馆发布了一批颇具该馆特色的碑帖文献数字资源。
本次资源发布后,全国累计发布古籍及特藏文献影像资源达到13万部(件),其中,国图建设的“中华古籍资源库”发布超过10.2万部(件)。王红蕾说,“中华古籍资源库”已成为全国古籍资源类型和品种最多、体量最大的综合性资源共享发布平台。
北京大学中文系古典文献学教研室主任、教授杨海峥感叹,从2016年到现在,陆续推出了13万部(件)古籍数字资源,对于学者来说是非常重要的一件事情。在线查阅免去了往返奔波各家图书馆的时间,缓解了古籍“藏”和“用”之间的矛盾,平衡了古籍的文物性与文献性。
古籍资源既要“用得上”,还要“用得好”
2022年10月,全国古籍整理出版规划领导小组印发实施《2021—2035年国家古籍工作规划》,“国家古籍数字化工程”正是四项重点实施工程之一。近年来,全国古籍登记工作让3000万册件古籍有了“身份证”,未来,让更多古籍“上线”与读者见面,将是我国古籍工作的一大重点。
“古籍数字化资源的制作与发布,其实是回归到古籍作为书籍文献本来的性质。”清华大学科学技术史暨古文献研究所研究员刘蔷说,以往,人们说学术的繁荣与学术资料的新发现有关,这种说法是忽视了存世的大量古籍,存世古籍是一个巨大的资源库。可以预见,连续的古籍资源发布,将带来宏阔的学术气象。
古籍数字化平衡了“藏”与“用”的矛盾,让古籍资源“用得上”,未来,更要“用得好”。学者们对古籍数字资源的深度利用提出了许多有益建议。
浙江大学图书馆研究馆员黄晨认为,古籍数字资源联合发布可以更好地呈现资源的利用价值,接下来,可以进一步就已发布的资源进行深度揭示,进一步打通资源和发布平台,提供一站式检索,将资源聚合起来,这样的利用效果会更好。刘蔷也表示,期待能有一个与古籍数字化资源相匹配的古籍数字目录,以便实现一站式检索。
杨海峥认为,目前古籍数字化发展迅速,百花齐放,各类数据库和古籍数字化平台纷纷涌现,多样化的发展一方面带来了很大便利,另一方面也应进行协调统一,建立更加规范的数据规范标准,使得古籍数字化的资源有保证,达到方便使用的学术水准。杨海峥说,2022年中办、国办印发的《关于推进新时代古籍工作的意见》,专门强调要“加强古籍数据流通和协同管理,实现古籍数字化资源汇聚共享”,国图联合全国古籍存藏单位把古籍数字资源进行统一与整合,形成公益性平台,奠定了非常好的基础,是未来古籍数字化的发展趋势。
汇聚、开放、共享,古籍数字化的步伐不断加快。杜泽逊说,“期待发布更多的数字资源,最终达到除少数特殊情况外,全部数字化。”
《光明日报》( 2023年01月06日 09版)