新华社2026年5月9日
瞭望丨释放AI人文社科研究潜力
释放AI在人文社会科学研究潜力,一方面需建设高质量领域数据集、推动标准与伦理共识,为研究赋能;另一方面,应创新交叉学科培养模式,提升研究者的批判性思维培养,并在学术评价中突出研究者的核心贡献,为判断留位,实现人与机器各展所长、协同共生
传统人工方式为1个甲骨碎片做图像比对需2~3天,运用实验室独立研发的甲骨碎片智能缀合系统,在10000个甲骨碎片图像的数据集中,搜集1个甲骨碎片的匹配图像仅需2~3小时,为后续历史阐释工作提供数据基础
文|《瞭望》新闻周刊记者钱沛杉 袁月明
当AI遇上文科实验室,是怎样的图景?
步入安阳师范学院甲骨文信息处理教育部重点实验室,一侧用玻璃门隔开的阅览室中,几位年轻学者在藏书柜间静心翻阅古籍;另一侧的开放办公区内,学生们借助数字化工具,校对标注经AI缀合的甲骨文拓片。在这里,古老的研究对象与前沿的研究工具相互交织,共同探索知识边界。
近年来,生成式人工智能快速融入千行百业,其中“AI赋能知识生产”备受关注。在自然科学界,AI正推动“人工智能驱动的科学研究”(AI4S)范式变革;人文社会科学领域,相关讨论也逐渐兴起。
有学者认为,AI可促进人文社科提升研究确定性、客观性与预测性,大幅推进其科学化进程;也有学者持审慎态度,认为AI能提升研究效率,却难以统一研究范式,不足以驱动整体变革。
《瞭望》新闻周刊记者梳理发现,在人文社科研究中,AI能提供工具辅助与独特视角,开辟知识生成的新路径。但因AI自身缺乏生命体验,在认知层面无法理解意义,在价值层面不能做出判断,在方法上可能固化既有偏见,在创新层面也难以突破传统范式,因而短期内难以成为人文社科研究创新核心主体。
释放AI在人文社会科学研究领域潜力,一方面需建设高质量领域数据集、推动标准与伦理共识,为研究赋能;另一方面,应创新交叉学科培养模式,提升研究者思维素养,并在学术评价中突出研究者的核心贡献,为判断留位,实现人与机器各展所长、协同共生。
提供强大辅助
AI正深度融入人文社会科学研究,成为提升科研效能的重要辅助。中国人民大学吴玉章讲席教授刘永谋说,AI功能发挥于知识生产环节,体现在对海量资料数字化处理,夯实研究数据基础;构建社会模拟环境,提供推演预测方法;挖掘潜在模式与辅助表达,拓展分析阐释边界。
受访者认为,AI能增强研究者在信息处理、方案推演和知识发现等方面的能力,为人文社会科学注入新的工具潜能。
高效处理数据提升研究效率。在数据收集、资料整理和初步归纳环节,AI处理海量、多模态数据的能力,能提升科研效率,减少科研工作者重复劳动负担。
以甲骨文研究为例,郑州大学文学院副院长、中华汉字文明研究中心副主任齐航福介绍,AI能提取甲骨图像特征自动校重(查找重复甲骨片),并综合断裂形态、文字连续性等信息智能推荐缀合(拼合碎片)方案,将学者从海量搜索中解放出来,提升研究效率。
安阳师范学院甲骨文信息处理教育部重点实验室负责人介绍,传统人工方式为1个甲骨碎片做图像比对需2~3天,运用实验室独立研发的甲骨碎片智能缀合系统,在10000个甲骨碎片图像的数据集中,搜集1个甲骨碎片的匹配图像仅需2~3小时,为后续历史阐释工作提供数据基础。
清华大学社会科学学院长聘教授、计算社会科学与国家治理实验室副主任孟天广认为,AI赋能社会科学研究探索人机协同新范式,使社会科学研究普惠化,让有创意的研究者,特别是年轻学者,以更低成本、更高效率验证新理论、新想法,提升整体研究效率。
模拟实验创新研究方法。孟天广说,传统社科研究多侧重于解释已发生事件,而智能体建模(ABM)等AI辅助模拟技术,使预测性和推演性研究成为可能。
具体来说,该方法利用大模型能力创建出海量行为拟人的数字个体(即智能体),并为它们设定交互规则与社会情境。通过观察这些数字个体在虚拟环境中的长期互动,研究者可以模拟出复杂的社会动态与群体效应,理解社会运行机制,提升预测准确性。
在社会科学领域,硅基样本(即虚拟数据)可作为真实人类样本的补充,被应用于大规模社会调查或基于智能体(ABM)的社会模拟,使研究者可以观测社会行为,推演社会运行,探索传统方法难以触及的新议题。在传播学领域,AI能快速分析网络舆情,识别公众情绪,辅助进行社会情绪监测和危机应对,使研究分析过程更快、更可追溯、更易理解。
内容生成辅助分析表达。超越数据整理与模拟预测,AI开始尝试介入更核心的解读阐释领域,基于计算与关联的研究新视角,为人文社科研究提供新证据、新线索、新表达。
在历史考古领域,郑州大学团队应用微痕增强技术,凸显甲骨碎片上肉眼难以看清的笔迹、裂纹,为研究提供新证据;安阳师范学院甲骨文信息处理教育部重点实验室副主任焦清局团队则构建甲骨文字形与语境复杂网络,用算法筛选出最可能被破译的字,并成功推断出“佑”字的可能含义,在数据库中为孤字找到被忽视的关联。
焦清局形容AI的用武之地在于“捡传统研究模式的漏洞,做之前看不到、总结不了或被遗忘的内容”。这种“推理性考释”并非最终定论,却能为学者提供有力的新线索。
此外,AI可帮助学者将想法、分析和数据,以高效多样的形式表达出来,辅助完成内容阐释、文章撰写。在政策模拟中,AI可结合传统经济模型,将复杂结果转化为易懂的图表和叙述性报告,帮助理解政策影响。
除了应用于知识生产环节内,AI在人文社科领域还可用于人文社科评审评价、公共政策制定和社会治理等活动。“这些功能的发挥方兴未艾,各个领域尚有大量潜力可挖掘,如将AI应用于论文和期刊评审等。”刘永谋说。
并非发现主体
尽管人工智能展现出强大的辅助潜能,但在人文社科研究的核心环节,其作为“工具”而非“发现主体”的边界同样清晰。刘永谋认为,AI赋能研究可作为多元进路之一,但研究者需时刻清醒认识其固有局限。
他认为,这一模式的根本局限在于,AI所直接处理的并非真实世界,而是对世界的“数据化”表征,这与充满意义、价值与复杂语境的人类社会存在本质距离。
无法理解意义与语境。受访者认为,当前AI的核心能力是识别和组合数据模式,而非理解意义。
例如,在甲骨文研究中,AI在缀合、校重等环节能显著提升效率,但在核心“考释”环节,其能力依然有限。受访者坦言,目前,AI难以直接考释出结果,只能提供参考答案。“考释一个字,不仅需要字形分析,更需要结合历史背景、文献互证和古代语法习惯综合推断,这种对‘意义’的生成与判定超越了当前AI的能力范围。”受访者说。
孟天广表示,人文社科研究的初衷源于人对社会意义的追寻,这植根于人的“具身体验”,而AI没有生命和意义经验,无法替代人类产生意义和价值。在历史、文学研究中,AI或许能总结既有的学术观点,但难以判断某一历史事件在当代的启示价值,也难以体会诗歌中复杂幽微的情感寄托。
缺乏价值判断与伦理思辨。人文社会科学研究的功能之一在于探讨公平、正义等命题,这需要研究者基于伦理原则和社会责任感进行权衡。
在公共政策评估、文化遗产保护排序等议题上,AI可模拟不同方案的结果,但“哪个方案更公平”“哪些价值更值得优先保护”的判断仍需由人来完成。
在古文字研究中,即便有研究通过复杂网络分析推断出某个甲骨文字的可能含义,这类“推理性考释”与学界要求的、具备完整证据链条的“可考证的考释”仍有距离。
焦清局说,这类“可考证的考释”需要资深学者完成严谨的字形演变链条梳理与历史语境论证。而这样的断言与认证过程,正是学术共同体价值标准与严谨性的体现,仍须由人类学者完成。
存在强化偏见与失真风险。业内人士认为,AI结论的可靠性高度依赖于训练数据的质量与代表性。
在古文字领域,有时用前沿的大语言模型处理结构简单的甲骨文字,效果反而不如传统算法。焦清局说,“复杂模型会‘过量抽取特征’,可能将噪声误认为规律”。郑州大学文学院副教授王晓玉也提到,用于显隐字迹的微痕增强技术,可能创造出原本不存在的笔画,增强后的图像仍须交由专家结合实物进行甄别。
在社会科学领域,这一问题更为凸显。孟天广说,尽管“硅基样本”(即虚拟数据)仿真度不断提升,但在宏观上仍难以完全反映真实人类的复杂性,在微观上也没法完美“保真”人类的情感与意义。因此,将这类样本应用于社会科学研究时要充分考虑其引发失真风险的局限性。
有研究表明,基于网络大数据训练的社会预测模型,可能放大数据中固有的地域、群体或意识形态偏见;在模拟公众舆论时,智能体也容易表现出过度理性或态度趋同,与真实社会中多元、矛盾甚至非理性的舆论场存在差距。
在被问到“AI能否最终破译甲骨文”这一问题时,学者们普遍持谨慎态度。有受访者认为,AI要在考释等核心任务上达到专家直接使用的程度,“起码需要3到5年用于数据标注,之后再用3到5年实现智能技术突破”。
受访专家普遍认为,AI在可见的未来仍将是辅助角色,“理论创新往往源于对旧范式的批判、深刻的直觉洞察或对新价值的倡导,这与研究者自身生命体验、历史意识和社会关怀紧密相连,是当前基于概率统计的AI难以涉足的领域。”
刘永谋说,AI可完成某些规范性工作,但由于缺乏“具身性”,在人文社科领域“永远存在AI不能完成的创新”。
潜力发挥受制
记者在调研中发现,释放AI在人文社科研究中的应用潜力,在现实中仍面临高质量数据和复合型人才稀缺制约。
高质量数据稀缺,共享存壁垒。当前,高质量数据的稀缺与流通不畅,制约了AI在人文社科领域的应用深度。
一方面,部分领域数据本身存量有限、数字化与结构化成本较高。“数据量小是技术模型面临的核心难题。”业内人士说,甲骨文碎片估算约16万片,总量有限,且多为不规整的手写体,进行高精度数字化和语义标注仍高度依赖领域专家,耗时耗力。此外,数字化的高质量参考文献稀缺,天然存在“数据荒”。
另一方面,数据共享存在现实壁垒。腾讯可持续社会价值事业部数字文化实验室首席架构师王朝阳在合作中发现,一些文化机构或专家对将数据拿出来“共创”心存顾虑,基础数据不牢、互通不畅,使上层智能应用如同无源之水。受访者分析,专家顾虑背后是产权、投入、质量与规范等多重因素交织。
首先,数据作为核心资产,共享动力不足。齐航福说,当前科研评价体系下,长期积累的数据是研究机构与学者个人的重要学术资产,数据共享涉及现实利益,跨团队、跨学校共享“很难”。“现有组织模式下,各团队独立建设数据库,促进了数据采集,也引发了重复劳动和团队间的数据壁垒。”这种数据保护意识,源于对学术优先权、项目竞争力、成果转化力等方面的现实考量。
其次,数据标注成本高昂,可持续回报机制待完善。业内人士反映,将原始文献、文物转化为AI可用的高质量数据,需要领域专家投入精力进行鉴别、校勘和结构化标注。这种隐形投入在缺乏有效补偿和知识产权保护机制下,先行者获得对等回报有限,其开放数据的积极性易受影响。
再次,统一录入规范与可信平台有待建立。业内人士认为,数据共享需要统一的数据标准、著录规范和法律协议。目前,人文社科领域部分学科专业尚未建立起公认、可持续运营的公共数据平台,数据贡献、访问与授权机制尚不完善。齐航福提到,“即便在古文字学界内部,数据采集标准也尚未统一,更别说数据库开发了”。
复合型人才稀缺,制约工具深度应用创新。王朝阳说,当前,懂技术的研发人员往往不熟悉人文社科领域的真问题,领域专家又难以掌握技术原理,双方沟通急需具备“翻译”能力的复合型人才。齐航福说,当前研究多集中在较初级的缀合、校重,存在同质化。实现更深层的排谱与语义分析,须先由古文字学者做好扎实准确的基础数据工作。在此基础上,古文字专家需与AI人才进行深度有机的融合。目前,能够兼顾这两个层面的复合型人才稀缺。
在人才培养端,矛盾已经显现。齐航福担忧,“如果学生过度依赖AI,缺乏原始积累,将难以实现学科积淀。”如何改革教学模式,在夯实学生学科功底的同时培养其善用技术工具的能力,成为新的教育课题。郑州大学文学院副教授武亚帅则认为工具普及将促使评价标准“水涨船高”,在引导学生合理利用AI工具辅助学习的同时,还应保持批判思维和创新精神。当下,能够开展深层次“AI+人文社科”交叉研究、推动人机协同新范式的创新人才,仍是稀缺资源。
迈向有效协同
面对AI赋能人文社科的现状与挑战,释放其潜力需聚焦关键瓶颈,在数据基础、评价导向与人才培养上寻求突破,构建良性发展生态。
探索建立激励相容的共享机制,破解数据荒、数据孤岛瓶颈。王朝阳认为,AI发展在数据侧已不能仅依赖互联网公开语料的堆量,需转向汲取各细分领域的高质量数据与专家的隐性知识。
受访者建议,由国家基础科研机构牵头,联合顶尖学术团队与技术企业,在甲骨文、历史档案等数字化基础较好的领域,遴选已完结重大项目的非涉密核心数据集,明确数据使用协议与贡献者权益,面向认证学者有限开放,逐步化解产权与信任顾虑。
强化学者提问力与判断力,明确人类学者的学术贡献。王朝阳认为,最终的判断力、对问题的定义权、核心的阐释和叙事,依然在人。他说,“你强他就强”,研究者对领域理解越深,就越能提出好问题,AI带来的启发也越大。
受访者建议,可在项目评审与人才评价中,试点引入研究者贡献指标,要求学者表明其在问题提出、价值权衡、理论综合等核心环节的独创性贡献,与AI承担的基础性、程序性工作区隔开来。
在人才培养层面,郑州大学文学院已将数字人文技能培养纳入教学体系,为本科生开设《汉语史数字资源及其检索》课程,为研究生开设《语料库与语言文字研究》课程。王晓玉介绍,这两门课程旨在使学生具备运用语料库技术开展语言文字资源检索、研究的能力,为学术研究和专业发展奠定基础。同时,应鼓励教学方法的创新,提升教学效果。
鼓励采用多元化技术方案,并培养善用工具的人才。孟天广说,其团队正在探索开发智能社会科学(AI4SS)实验研究装置,为社会科学研究者提供低代码或无代码编程环境,创新人工智能赋能社会科学研究的方法工具,降低社科研究者的技术门槛。类似的实践已见成效,腾讯与安阳师范学院合作研发的甲骨文智能体“殷契行止”,将大模型与专业数据库结合,使学者能够通过自然语言直接查询、比对甲骨文资料,将技术能力封装为易用的“研究伙伴”,降低了专业技术使用的复杂性。
同时,技术应用更应注重适配性,选择或开发适配具体问题的技术路径,比单纯追求模型复杂度更为重要。培育能驾驭这种选择、并能在人机间顺畅“翻译”的复合型人才至关重要。王朝阳认为,未来研究者需具备提出好问题的能力、善用AI工具的品味,以及思考如何让文化特质塑造技术发展的使命感。
(《瞭望》2026年第19期)
媒体链接:
https://h.xinhuaxmt.com/vh512/share/13093381?docid=13093381&newstype=1001&d=135269c&channel=weixin&time=1778290954656