期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

数字人文视野下的古汉语实体歧义研究被引量：10

Research on Ancient Chinese Entity Ambiguity in Digital Humanities

下载PDF

导出

摘要实体知识的自动识别是古文智能处理的重要内容,也是古文数字人文研究的技术支撑。以实体知识为基础的数字人文研究若不考虑古籍中普遍存在的实体歧义,将难以得到准确可靠的数据和结论。文章以《春秋经传引得》为文本语料,考察了语料中同名异指和异名同指两大类人名实体歧义,根据古文实体歧义消解的特殊性,提出两类歧义的消解方法和思路。研究基于实体语境和时间知识,构建了消歧规则并以先秦古汉语为实例进行了验证。上述方法在其他古汉语语料中的适用性值得进一步探究,基于消歧后的语料,文章呈现了先秦人物的基本全貌,表明了本研究的价值所在。 In Ancient Chinese Information Processing,the extraction of entity knowledge is one of the most important studies.Study of digital humanities with entity knowledge should concern more about entity ambiguity for more precise results.The article presents two rule-based methods on entity disambiguation with the ancient Chinese corpus.Two types of entity ambiguity were deeply discussed and two methods with examples of entities in Chunqiu Jingzhuan Yinde were presented.Further research on more ancient Chinese corpus would have shown better understanding of the methods presented above.A visualization study with the data of disambiguated entities was carried out at last and thus showed the value of this study.

作者刘浏王东波黄水清苏新宁 Liu Liu;Wang Dongbo;Huang Shuiqing

机构地区南京农业大学信息管理学院江苏省数据工程与知识服务重点实验室(南京大学) 南京大学信息管理学院

出处《图书与情报》 CSSCI 北大核心 2020年第5期115-124,共10页 Library & Information

基金国家社科基金重大项目“基于《汉学引得丛刊》的典籍知识库构建及人文计算研究”(项目编号:15ZDB127) 国家自科基金面上项目“基于典籍引得的句法级汉英平行语料库构建及人文计算研究”(项目编号:71673143) 江苏省社科基金青年项目“人文计算视角下的先秦人物知识获取及分析研究”(项目编号:19TQC003)研究成果之一。

关键词古文信息处理实体歧义古文智能处理古文数字人文 ancient Chinese information processing entity ambiguity intelligent processing ancient Chinese digital humanities

分类号 TP393.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1欧阳剑.面向数字人文研究的大规模古籍文本可视化分析与挖掘[J].中国图书馆学报,2016,42(2):66-80. 被引量：108
2欧阳剑.大规模古籍文本在中国史定量研究中的应用探索[J].大学图书馆学报,2016,34(3):5-15. 被引量：16
3范佳.“数字人文”内涵与古籍数字化的深度开发[J].图书馆学研究,2013(3):29-32. 被引量：73
4王东波,高瑞卿,沈思,李斌.面向先秦典籍的历史事件基本实体构件自动识别研究[J].国家图书馆学刊,2018,27(1):65-77. 被引量：24
5线岩团,余正涛,洪旭东,张磊,郭剑毅.基于特征加权重叠度的中文实体协同消歧方法[J].中文信息学报,2017,31(2):36-41. 被引量：6

二级参考文献76

1赵文润.论武则天的功过[J].社会科学战线,1999(6):133-140. 被引量：4
2李必忠,陈贤华.有关武则天评价的几个问题[J].四川大学学报（哲学社会科学版）,1982(2):73-83. 被引量：2
3王双怀.历代对武则天的评价[J].人文杂志,1996(3):69-74. 被引量：7
4余传明.基于GIS的数字图书馆:原理及应用[J].情报理论与实践,2004,27(6):651-653. 被引量：21
5罗志田.走向国学与史学的“赛先生”——五四前后中国人心目中的“科学”一例[J].近代史研究,2000(3):59-94. 被引量：49
6王燕.浅谈数字图书馆中的图形化查询技术——GIS在北京大学古文献资源库中的应用[J].大学图书馆学报,2006,24(1):58-62. 被引量：6
7徐清,石向实,王唯.古籍数字化资源的深度开发[J].图书情报工作,2007,51(3):95-97. 被引量：37
8罗德里克·弗拉德.计量史学方法导论[M].上海:上海译文出版社,1997.
9方一新.20世纪近代汉语研究概说.浙江大学汉语史研究中心简报,2001,(01).
10太田辰夫.汉语史通考[M].重庆:重庆出版社,1991..

共引文献192

1陈琳.基于知识图谱的国内数字人文研究现状分析[J].图书馆学刊,2020,0(1):89-94. 被引量：1
2陈慧,南梦洁.数字人文视域下大型体育赛事档案资源整合模式研究[J].山西档案,2022(1):27-39. 被引量：10
3黄水清,刘浏,王东波.国内外数字人文研究进展[J].情报学进展,2022(1):50-84. 被引量：11
4刘阳.我国信息资源管理领域数字人文研究的内容及特征识别[J].情报科学,2023,41(11):170-175. 被引量：1
5曾立宇.从供给侧改革视角探析公共图书馆古籍保护与利用[J].传媒论坛,2020,0(6):103-104. 被引量：4
6唐振贵,向姝恒,罗锦坤,胡蓉.中国历史计时本体构建——以回归历史语境的日内计时为基点[J].数字人文研究,2021,1(2):51-62.
7高巍,万廷彬.甜菜碱对商品产蛋鸡生产性能的影响[J].中国禽业导刊,2000,17(6):16-17. 被引量：1
8朱成林,袁曦临.中国古籍的数字化导读研究[J].图书馆建设,2014(11):50-55. 被引量：16
9周茜.面向数字人文的高校图书馆服务创新[J].图书馆学刊,2015,37(6):92-94. 被引量：17
10董政娥,陈惠兰.数字人文资源调查与发展对策探讨[J].情报资料工作,2015,36(5):103-109. 被引量：8

同被引文献194

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2孟建,胡学峰.数字人文研究:超学科方法论的一种认知与阐释[J].现代传播（中国传媒大学学报）,2020,42(2):13-17. 被引量：12
3曹立波.“文史互证”何以可能——以百年红学为例的考察[J].文学评论,2021(2):34-41. 被引量：8
4徐中舒.论《战国策》的编写及有关苏秦诸问题[J].历史研究,1964(1):133-150. 被引量：26
5頡刚.戰国策之古本与今本[J].历史研究,1957(9):32-32. 被引量：2
6王阳.“文史互证”的极限[J].文史哲,1999(5):5-11. 被引量：4
7霍旭东.宋元时期整理《战国策》的巨大成就——兼对鲍彪整理《战国策》再评价[J].烟台大学学报（哲学社会科学版）,1989,2(2):57-64. 被引量：5
8张德芳.激发和活化凝固在文献中的知识——论图书馆改革[J].四川图书馆学报,1988(6):1-7. 被引量：9
9刘迅.知识工程——未来图书馆学情报学教育内容变化的学科归宿[J].情报科学,1985,6(5):1-6. 被引量：14
10B.C.Brookes,王崇德,邓亚桥,刘继刚.情报学的基础(一)[J].情报科学,1983,4(4):84-94. 被引量：45

引证文献10

1胡静,雷琴,魏丽敏.比较视野下图书情报领域数字人文研究——基于CNKI和WoS收录文献的探析[J].国家图书馆学刊,2021,30(3):75-87. 被引量：5
2赵英,何燕.图书馆数字人文馆员培养策略研究[J].大学图书情报学刊,2021,39(6):77-82. 被引量：4
3林立涛,王东波,刘江峰,李斌,冯敏萱.数字人文视域下典籍动物命名实体识别研究——以SikuBERT预训练模型为例[J].图书馆论坛,2022,42(10):42-50. 被引量：10
4谢靖,刘江峰,王东波.古代中国医学文献的命名实体识别研究——以Flat-lattice增强的SikuBERT预训练模型为例[J].图书馆论坛,2022,42(10):51-60. 被引量：14
5魏志鹏,赵悦言,杨克虎,周文杰.数字人文“一手证据”循证范式研究:基于《鲍氏国策》的共词分析[J].农业图书情报学报,2022,34(11):14-25. 被引量：3
6尚宏利,张思洁,魏志鹏,杨克虎,周文杰.循证数字人文证据整合的基本框架与具体流程研究[J].农业图书情报学报,2022,34(11):38-47. 被引量：3
7文玉锋,徐姣姣,周文杰.古籍文献知识组织由静态检索向动态表征趋向的理论解析[J].图书与情报,2022(5):10-16. 被引量：3
8于蓓莉,刘蕾,周文杰.古籍文献知识组织由静态检索向动态表征趋向的实证检验[J].图书与情报,2022(5):17-23. 被引量：3
9程秀峰,曹琪,蒋开宸,周梦蝶.智慧图书馆建设过程中技术元素分析及知识图谱构建研究[J].图书情报工作,2024,68(9):123-136. 被引量：1
10张宁,李俊腾,袁勤俭.数字古籍视频中用户参与的组态效应[J].数字图书馆论坛,2024,20(7):19-28.

二级引证文献37

1杨新涯,文佩丹.图书馆的数字人文角色及其发展思路[J].数字图书馆论坛,2021(7):43-47. 被引量：11
2陈志涵.国外社区警务研究的现状、脉络及趋势——基于CiteSpace的文献计量分析[J].法制与经济,2021(6):27-32.
3吕星月,袁曦临.国际数字人文中心的组织架构与建设路径[J].图书馆论坛,2022,42(2):99-108. 被引量：6
4王雅丽.图书馆员数字素养构成要素与培育策略[J].图书馆学刊,2022,44(8):19-23. 被引量：5
5常青,李慧.面向数据服务的高校图书馆员能力培养策略[J].中华医学图书情报杂志,2022,31(6):60-68.
6林立涛,王东波.古籍文本挖掘技术综述[J].科技情报研究,2023,5(1):78-91. 被引量：7
7张朦,刘忠宝.数字人文环境下融入多特征的词命名实体识别[J].计算机系统应用,2023,32(3):300-308.
8闫慧,贾诗威.信息资源管理学科与国家战略的关系探究——基于学术话语与政策文本的关联分析[J].情报资料工作,2023,44(2):5-13. 被引量：5
9周文杰.自主知识体系构建视域下的图情档年度学术热点透析[J].情报资料工作,2023,44(2):14-20. 被引量：4
10李晓,曲建升,寇蕾蕾.众包在证据合成中的实践应用研究——以Cochrane Crowd公民科学项目中的众包应用为例[J].农业图书情报学报,2023,35(2):95-104. 被引量：1

1赵鹏辉.寻求当代书画的坐标——《书画史记·当代名家访谈录第一辑》编审侧记[J].艺术品,2020(8):115-115.
2刘晓潇.统一战线视阈下政治共识向政治信仰的递进研究[J].山西社会主义学院学报,2020(1):52-56.
3包茜.3D打印把人工智能梦想照进现实[J].中国新通信,2020,22(20):106-107.
4李超.大学英语教学中思辨能力培养模式探究[J].内蒙古财经大学学报,2020,18(6):60-62. 被引量：3
5刘悦怡,宫齐.现代汉语歧义类型的再讨论[J].暨南学报（哲学社会科学版）,2020,42(5):24-32. 被引量：4
6叶素英.人文视野下的高职基础英语教学实践探索——以浙江邮电职业技术学院为例[J].江西电力职业技术学院学报,2020,33(7):74-75.
7黄靖雯,姜玲.轻动词句法理论下“again/又”附加语的歧义研究[J].外文研究,2020,8(3):53-57.
8任娜,张楠,崔妍,张融雪,庞新富.面向无人机电力巡检的语义实体构建及航迹控制方法[J].计算机应用,2020,40(10):3095-3100. 被引量：2
9李蓝玉.人文教育视野下的高校英语专业课程体系建设[J].天津外国语大学学报,2020,27(6):113-121. 被引量：7

图书与情报

2020年第5期

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...

;

使用帮助返回顶部