英语军事新闻文本中实体分布特征研究

A Study on the Distribution of Entities in English Military News

导出

摘要在已有的词分布特征测量方法基础上,本文提出了实体分布的主要测量指标与方法,并借助通用语料库和自建的美国陆军英语新闻语料库,对实体进行统计测量和对比分析,结果显示实体分布在英语军事新闻和通用英语中存在显著差异,显示出实体在区分不同语言变体上的独特能力,为观察和测量语言分布特征提供了新视角,并可为文本分类、语义挖掘等应用提供新的特征支持。 Entity is a special language unit,which has explicit external reference,stable structure and single meaning. We filter and process the Wikipedia entries,and obtain a large set of entities,which covers a wide range of fields and includes rich entity types. Based on the entity set,the present study proposes entity recognition algorithm and realizes the automatic recognition of entities. We investigate the distribution of the military entities and the findings are as follows. Compared to the distribution in general English,entities in military English corpus are more intensive and concentrated in a relatively closed set. Although the number of generic domain entities in general English is large,the distribution is widely dispersed. The entity collocations show close semantic relationship among the related entities,which provides valuable perspective for further text mining and information processing.

作者邢富坤 XING Fu-kun

机构地区青岛大学外语学院

出处《解放军外国语学院学报》 CSSCI 北大核心 2020年第3期74-81,F0003,共9页 Journal of PLA University of Foreign Languages

基金国家社会科学基金项目“汉英小句级对齐语料库的研制与应用研究”(19BYY081) 国家社会科学基金重点项目“语料库语言学意义发现理论建模研究”(16AYY008) 山东省高等学校青创科技计划“多语言大数据创新团队项目”(2019RWC014)。

关键词军事新闻实体分布特征语料库

分类号 H313 [语言文字—英语]

引文网络
相关文献

参考文献2

1邢富坤.基于维基百科的领域实体发现研究[J].计算机应用研究,2015,32(2):347-350. 被引量：5
2刘浏,王东波.命名实体识别研究综述[J].情报学报,2018,37(3):329-340. 被引量：145

二级参考文献36

1张晓艳,王挺,陈火旺.命名实体识别研究[J].计算机科学,2005,32(4):44-48. 被引量：66
2孙茂松,黄昌宁,高海燕,方捷.中文姓名的自动辨识[J].中文信息学报,1995,9(2):16-27. 被引量：87
3向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
4刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
5俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：156
6周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
7张晓艳,王挺,陈火旺.基于混合统计模型的汉语命名实体识别方法[J].计算机工程与科学,2006,28(6):135-139. 被引量：19
8MILNE D N, WITTEN L H, NICHOLS D M. A knowledge-based search engine powered by Wikipedia[ C ]//Pro of the 16th ACM Con- ference on Information and Knowledge Management. New York:ACM Press, 2007.
9TORAL A, MUNOZ R. A proposal to automatically build and main- tain gazetteers for named entity recognition by using Wikipedia [ C ]// Proc of the 11 th Conference on the European Chapter of the Associa- tion for Computational Linguistics. 2006 : 102-109.
10KAZAMA J, TORISAWA K. Exploiting Wikipedia as external knowl- edge for named entity recognition [ C ]// Proe of Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning. 2007:698-707.

共引文献148

1陈业明,戴齐,刘捷.融合字位置特征的铁路事故命名实体识别[J].计算机系统应用,2022,31(12):211-219. 被引量：3
2刘新亮,张梦琪,谷情,任延昭,何东彬,高万林.基于BERT-CRF模型的生鲜蛋供应链命名实体识别[J].农业机械学报,2021,52(S01):519-525. 被引量：11
3张坤丽,赵旭,关同峰,尚柏羽,李羽蒙,昝红英.面向医疗文本的实体及关系标注平台的构建及应用[J].中文信息学报,2020,34(6):36-44. 被引量：12
4熊奥,高畅,赵明辉,张玲玲.基于知识图谱的核电设备健康管理知识建模与分析[J].科技促进发展,2021,17(4):640-649. 被引量：10
5顾佼佼,翟一琛,姬嗣愚,宗富强.基于BERT和知识蒸馏的航空维修领域命名实体识别[J].电子测量技术,2023,46(3):19-24. 被引量：3
6李娜.基于条件随机场的方志古籍别名自动抽取模型构建[J].中文信息学报,2018,32(11):41-48. 被引量：28
7高俊平,张晖,赵旭剑,杨春明,李波.基于特征词的Web领域知识分类研究[J].软件导刊,2016,15(2):9-11.
8刘汉清,朱敏,苏亚博,唐彬彬.一种考虑用户兴趣转移特征的协同预测模型[J].四川大学学报（自然科学版）,2016,53(3):548-554. 被引量：13
9宋俊,李禹恒,黄宇,陈昊,付琨.一种基于用户兴趣的微博实体链接方法[J].计算机应用研究,2016,33(7):2079-2082. 被引量：1
10冯钧,柳菁铧,孔盛球.融合多特征的中文集成实体链接方法[J].计算机与现代化,2019(1):69-74.

1非参数检验的概念[J].中外医疗,2020,39(12):9-9.
2非参数检验的概念[J].糖尿病新世界,2020,23(8):132-132.
3方小兵.从语言活力到语言韧力:语言生态评估理念的优化[J].云南师范大学学报（哲学社会科学版）,2020,52(1):22-31. 被引量：7
4余芳强.基于大数据的医院建筑智慧运维技术研究与实践[J].中国医院建筑与装备,2020,21(6):101-104. 被引量：5
5陆剑锋,郭茂祖,张昱,赵玲玲.基于时空约束密度聚类的停留点识别方法[J].智能系统学报,2020,15(1):59-66. 被引量：3
6徐莉娟.国内外高校英语新闻语料库的构建[J].辽宁科技学院学报,2020,22(3):65-66.
7孙学成.海上平台生产分离器液位控制方式优化[J].石油石化物资采购,2019,0(26):33-33.
8吕兰婷,施文凯,林夏,白飞.医院卫生技术评估的经济学评估探讨[J].中华医院管理杂志,2020,36(2):103-107. 被引量：14
9卓凯敏,危大波.半挂汽车列车横向稳定性试验与仿真分析[J].专用汽车,2020(6):80-85. 被引量：1

解放军外国语学院学报

2020年第3期

浏览历史

内容加载中请稍等...

英语军事新闻文本中实体分布特征研究

参考文献2

二级参考文献36

共引文献148

相关作者

相关机构

相关主题

浏览历史