基于条件随机场的中文文本弱定位地名识别

Chinese Text Weak Positioning Placename Recognition Based on Conditional Random Field

下载PDF

导出

摘要针对中文文本,通过引入语言学相关知识,分析了强定位地名和弱定位地名的用词特征和上下文特征,提取形式化的规则。此外,提出一种基于条件随机场的弱定位地名识别方法,将弱定位地名识别问题转化为序列标注问题。以150篇共18万字的新浪网新闻页面文本为例进行实验验证,结果表明,提出的方法能够有效识别弱定位地名,召回率为90.57%,准确率为92.36%,F值为91.46%。 By introducing linguistic knowledge,the author analyzed the word features and context features of strong and weak location names of Chinese text,and extracted formal rules.In addition,a weak location name recognition method based on conditional random field was proposed,which transformed the problem of weak location name recognition into sequence labeling problem.An experimental verification was carried out by taking 150 Sina news pages with 180000 words as an example.The results show that the proposed method can effectively identify weak location names,and the recall rate is 90.57%,the accuracy rate is 92.36%,and the F value is 91.46%.

作者于翠萍 YU Cui-ping(School of Clothing and Textile,Eastern Liaoning University,Dandong 118003,China)

机构地区辽东学院服装与纺织学院

出处《辽东学院学报（自然科学版）》 CAS 2022年第3期199-204,共6页 Journal of Eastern Liaoning University:Natural Science Edition

关键词中文文本地名识别弱定位地名条件随机场 Chinese text place name recognition weak positioning place names conditional random field

分类号 P208 [天文地球—地图制图学与地理信息工程] TP381 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1王红斌,沈强,线岩团.融合迁移学习的中文命名实体识别[J].小型微型计算机系统,2017,38(2):346-351. 被引量：24
2邬伦,刘磊,李浩然,高勇.基于条件随机场的中文地名识别方法[J].武汉大学学报（信息科学版）,2017,42(2):150-156. 被引量：45
3毛波,滕炜.基于条件随机场与规则改进的复杂中文地名识别[J].武汉大学学报（工学版）,2020,53(5):456-463. 被引量：10
4李慧林,柴玉梅,孙穆祯.面向文本命名实体识别的深层网络模型[J].小型微型计算机系统,2019,40(1):50-57. 被引量：10
5储泽祥.现代汉语的命名性处所词[J].中国语文,1997(5):326-335. 被引量：23
6张雪英,闾国年.自然语言空间关系及其在GIS中的应用研究[J].地球信息科学,2007,9(6):77-81. 被引量：25

二级参考文献33

1廖楚江,杜清运.GIS空间关系描述模型研究综述[J].测绘科学,2004,29(4):79-82. 被引量：30
2张军.汉语方位词与汉民族空间认知的文化倾向[J].榆林学院学报,2004,14(2):7-10. 被引量：5
3杜世宏,王桥,李治江.GIS中自然语言空间关系定义[J].武汉大学学报（信息科学版）,2005,30(6):533-538. 被引量：19
4刘丽虹,张积家,王惠萍.习惯的空间术语对空间认知的影响[J].心理学报,2005,37(4):469-475. 被引量：24
5乐小虬,杨崇俊,于文洋.基于空间语义角色的自然语言空间概念提取[J].武汉大学学报（信息科学版）,2005,30(12):1100-1103. 被引量：27
6龙君.汉语空间语言结构的认知分析[J].湘潭师范学院学报（社会科学版）,2006,28(2):112-114. 被引量：4
7Egenhofer M J. Multi-modal spatial querying. In: Proceedings of Seventh International Symposium on Spatial Data Handling. London: Taylor & Francis. 1996, 785 - 799.
8Mark D, Gould M. Interaction with geographic information: a commentary. Photogrammetric Engineering & Remote Sensing. 1991, (57) : 1427- 1430.
9Shariff A R B M, Egenhofer M J, Mark D M. Naturallanguage spatial relations between linear and areal ob- jects: The topology and metric of English-language terms. International Journal of Geographical Information Science, 1998, 12 (3): 215 -246.
10Frank A U. Qualitative spatial reasoning about distances and directions in geographic space. Journal of Visual Languages and Computing, 1992, 3 (4) : 343-371.

共引文献129

1陈美杉,夏晨曦.肝癌患者在线提问的命名实体识别研究:一种基于迁移学习的方法[J].数据分析与知识发现,2019,3(12):61-69. 被引量：15
2步一,薛睿,孟凡,黄文彬.知识图谱的关键技术及其在情报学中的应用[J].情报学进展,2022(1):349-384. 被引量：1
3张雪英,闾国年,叶鹏.大数据地理信息系统:框架、技术与挑战[J].现代测绘,2020(6):1-8. 被引量：8
4廖志鸿.准方位标的历时考察[J].湖南师范大学社会科学学报,2001,30(S2):161-165.
5赵卫锋,李必军.Landmark在导航系统路径引导中的应用[J].公路交通科技,2009(S1):127-131. 被引量：1
6李泰洙.古本、谚解本《老乞大》里方位词的特殊功能[J].语文研究,2000(2):30-38. 被引量：11
7方经民.地点域/方位域对立和汉语句法分析[J].语言科学,2004,3(6):27-41. 被引量：8
8储泽祥.汉语处所词的词类地位及其类型学意义[J].中国语文,2006(3):216-224. 被引量：21
9张大红,温敏.方位词“上、中、下”的分布及其认知意义(下)[J].周口师范学院学报,2008,25(1):106-109.
10张雪英,闾国年,宦建.面向汉语的自然语言路径描述方法[J].地球信息科学,2008,10(6):757-762. 被引量：12

1马文祥,廖涛,张顺香.基于BERT-BiGRU-CRF的电子简历命名实体识别[J].盐城工学院学报（自然科学版）,2022,35(3):41-47. 被引量：5
2李然,郝培男,孙逢圆.基于上下文立方匹配的双向运动估计视频帧率上转换算法[J].信阳师范学院学报（自然科学版）,2022,35(4):638-644.
3陈茜,武星.结合上下文词汇匹配和图卷积的材料数据命名实体识别[J].上海大学学报（自然科学版）,2022,28(3):372-385.
4谢斌红,李书宁,张英俊.基于层次结构感知的细粒度实体分类方法[J].计算机应用,2022,42(10):3003-3010.

辽东学院学报（自然科学版）

2022年第3期

浏览历史

内容加载中请稍等...

基于条件随机场的中文文本弱定位地名识别

参考文献6

二级参考文献33

共引文献129

相关作者

相关机构

相关主题

浏览历史