基于条件随机场的中文地址行政区划提取方法被引量：7

Extraction of administrative division of Chinese address based on conditional random fields

下载PDF

导出

摘要为了在非规范中文地址中有效的提取行政区划信息,提出了一种基于条件随机场的方法.该方法根据中文地址中行政区划的表达特点和特征,采用判别式概率模型,在观测序列已知的基础上对目标序列建模,通过构建语料训练集和建立相应的特征模板,得到行政区划的表达模型,然后使用该模型对测试集进行测试,并与标注好的测试数据进行比对,验证模型的性能.实验表明,与最大熵模型相比,条件随机场模型总的性能指标在其之上,地址信息解析的准确率能达到89.93%. To extract the information of administrative division effective1y from the non-standard Chinese ad-dress, a method based on conditiona1 random fie1ds was proposed. According to the characteristics of admin-istrative division, the mode1 of the target sequence was constructed on the basis of the observation sequence by using the discriminative probabi1ity mode1. Then, the expression mode1 of the administrative division was obtained by constructing the corpus training set and the corresponding feature temp1ate. Fina11y, the perfor-mance of the mode1 was verified by testing the test set and comparing its resu1ts with the marked test data. Experimenta1 resu1ts show that the performance of the mode1 is better than that of the maximum entropy mode1, and the accuracy rate of ana1ysis of address information reaches 89.93%.

作者段艳会李晓林黄爽

机构地区智能机器人湖北省重点实验室(武汉工程大学) 武汉工程大学计算机科学与工程学院

出处《武汉工程大学学报》 CAS 2015年第11期47-51,共5页 Journal of Wuhan Institute of Technology

基金国家863项目(2013AA12A202) 武汉工程大学研究生教育创新基金项目(CX2014090)

关键词位置信息解析条件随机场训练语料 location information parsing,condition random fields,training corpus

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1周鑫.半监督算法在自然语言处理中应用的研究[D].哈尔滨工业大学2014
2朱俊.中文标准地址库构建关键技术研究[D].南京师范大学2013
3SUN XiaoLiang1,2, JIA LiMin1, DONG HongHui1, QIN Yong1 & GUO Min3 1State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044, China,2School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China,3Beijing Traffic Management Bureau, Beijing 100044, China.Urban expressway traffic state forecasting based on multimode maximum entropy model[J].Science China(Technological Sciences),2010,53(10):2808-2816. 被引量：6
4Rabiner L R.A tutorial on hidden markov models and selected application in speech recognition. Proceedings of Tricomm . 1989
5Pearl J.Probabilistic reasoning in intelligent systems: networks of plausible inference. . 1988
6Lafferty J,McCallum A,Pereira F.Conditional random fields: probabilistic models for segmenting and labeling sequence data. Proceedings of the Eighteenth International Conference on Machine Learning . 2001
7Thompson JD,Higgins DG,Gibson TJ.CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice. Nucleic Acids Research . 1994
8MCCALLUM A,FREITAG D,PEREIRA F.Maximum Entropy Markov Models for Information Extraction and Segmentation. Proc Jc ML . 2000
9JIAYI Zhao,XIPENG Qiu,SHU Zhang.Part-of-Speech Tagging for Chinese-English Mixed Texts with Dynamic Features. Journal of Computational Information Systems (JCIS) . 2012

二级参考文献15

1Jia L M,Qin Y,Dong H H,et al.Beijing Regional Traffic State and Level of Service Evaluation Indices and System Report. Beijing Jiaotong University and Beijing Traffic Management Bureau Report . 2008
2Kamarianakis Y,Prastacos P.Space-time modeling of traffic flow. Comp Geotec . 2005
3Dong H H,Jia L M,Sun X L,et al.Road traffic state prediction with a maximum entropy method. 5th International Joint Conference on INC,IMS and IDC . 2009
4Han Chao,Su Song.A review of some main models for traffic flow forecasting. Intelligent Transportation Systems 2003 Proceedings .
5Wang Yibing,Papageorgiou M,Messmer A.Real-time freeway traffic state estimation based on ex-tended Kalman filter:a case study. TransprtationScience . 2007
6Wanli Min,Laura Wynter,Yasuo Amemiya.Road Traffic Prediction with Spatio-Temporal Correlations. IBM Research Report . 2007
7Brian L Smith,Michael J Demetsky.Short Term Traffic Flow Prediction: Neural Network Approach. . 1994
8Och F J,Ney H.Discriminative training and maximum entropy models for statistical machine translation. Proceedings of the40th Annual Meeting of the Association for Computational Linguistics(ACL) . 2002
9Darroch J N,Ratcliff D.Generalized iterative scaling for log-linear models. The Annals of Mathematical Statistics . 1972
10Lin W H,Lu Q,Dahlgren J.A dynamic procedurefor short-term prediction of traffic congestion. Proceedings of the 81st Transportation ResearchRecord Annual Meeting . 2002

共引文献12

1MA Ke,WANG ZhongWen,JIANG Jian,ZHU GuangXi,LI Wei.Power law and small world properties in a comparison of traffic city networks[J].Chinese Science Bulletin,2011,56(34):3731-3735. 被引量：2
2Yajie WANG,Bing YANG,Yan LUO,Jinlin HE,Hong TAN.The Application of Big data Mining in Risk Warning for Food Safety[J].Asian Agricultural Research,2015,7(8):83-86. 被引量：6
3Jicheng Yu,Liu Zhang,Qiu Liu,Xiaohui Qi,Ying Ji,Beom Seok Kim.Isolation and characterization of actinobacteria from Yalujiang coastal wetland, North China[J].Asian Pacific Journal of Tropical Biomedicine,2015,5(7):547-552.
4LI Ji Hong,QIU Rong Xu,XIONG Le,XU Jia Dong.A gravity-spatial entropy model for the measurement of urban sprawl[J].Science China Earth Sciences,2016,59(1):207-213. 被引量：2
5李继红,QIU RongXu,熊乐,徐佳栋.城市扩张度量中的重力-空间熵模型[J].中国科学：地球科学,2016,46(2):229-236. 被引量：7
6孙赫,李淑琴,吕学强,刘克会.微博城市投诉文本中的地理位置实体识别[J].山东大学学报（理学版）,2016,51(3):77-85. 被引量：2
7胡默之,姚天昉.中文微博观点句识别及评价对象抽取方法[J].山东大学学报（理学版）,2016,51(7):81-89. 被引量：3
8刘韶新,苏东兰,叱干都,王晶.基于驾驶模拟实验的快速路交织区运行风险评价[J].科学技术与工程,2021,21(2):751-757. 被引量：4
9高倩云,杨剑锋,王华庆.基于HMM及WPT-ACF的轴承早期故障模式识别[J].设备管理与维修,2015(S2):348-350.
10张欣,刘勇,李金霞,程池.中性蛋白酶生产菌种AS1.398的多相复核鉴定[J].食品与发酵工业,2015,41(5):54-58. 被引量：2

同被引文献76

1陈细谦,迟忠先,金妮.城市地理编码系统应用与研究[J].计算机工程,2004,30(23):50-52. 被引量：29
2王卫星.论南京国际安全区的成立[J].民国档案,2005(4):101-108. 被引量：7
3刘哲,夏秀峰,周福才.基于中文地址类信息的分词处理[J].沈阳航空工业学院学报,2008,25(4):63-66. 被引量：3
4郭会,宋关福,马柳青,王少华.地理编码系统设计与实现[J].计算机工程,2009,35(1):250-252. 被引量：19
5赵欢,朱红权.基于双数组Trie树中文分词研究[J].湖南大学学报（自然科学版）,2009,36(5):77-80. 被引量：16
6张雪英,闾国年,李伯秋,陈文君.基于规则的中文地址要素解析方法[J].地球信息科学,2010,12(1):9-16. 被引量：74
7孙存群,周顺平,杨林.基于分级地名库的中文地理编码[J].计算机应用,2010,30(7):1953-1955. 被引量：23
8马照亭,李志刚,孙伟,印洁.一种基于地址分词的自动地理编码算法[J].测绘通报,2011(2):59-62. 被引量：28
9程昌秀,于滨.一种基于规则的模糊中文地址分词匹配方法[J].地理与地理信息科学,2011,27(3):26-29. 被引量：48
10邵妍,刘燕兵,谭建龙,郭莉.基于概率统计模型的快递地址自动分类方法[J].计算机工程,2012,38(23):277-280. 被引量：5

引证文献7

1李晓林,黄爽,卢涛,李霖.非规范化中文地址的行政区划提取算法[J].计算机应用,2017,37(3):876-882. 被引量：7
2李晓林,张懿,周华兵,李霖.基于C-F模型的中文地址行政区划辨识方法[J].计算机工程与设计,2018,39(7):2048-2053. 被引量：3
3李晓林,张懿,李霖.基于地址语义理解的中文地址识别方法[J].计算机工程与科学,2019,41(3):551-558. 被引量：8
4刘现印,李玉琳,尹斌,田沁.融合神经网络和空间关系的中文地址解析[J].测绘科学,2021,46(8):165-171. 被引量：3
5余俊,于文年,彭艳兵.基于ELMo-BiLSTM-CRF模型的中文地址分词[J].电子设计工程,2021,29(20):72-76. 被引量：4
6赵小萱,陈刚,黄紫荆.基于条件随机场挖掘文本史料中事件信息的方法与实证研究——以《拉贝日记》数字人文研究为例[J].图书馆杂志,2024,43(3):101-108. 被引量：1
7黄威,沈耀迪,陈松龄,傅湘玲.CFGT:一种基于词典的中文地址要素解析模型[J].计算机科学,2024,51(9):233-241.

二级引证文献24

1李春霞,许键,彭艳兵.基于语义关联融合的案件识别[J].数字技术与应用,2024,42(3):155-160.
2李晓林,张懿,周华兵,李霖.基于C-F模型的中文地址行政区划辨识方法[J].计算机工程与设计,2018,39(7):2048-2053. 被引量：3
3王宇璐,张伟,贺泽宇.面向复杂中文地址关联的三维关系评估模型[J].计算机应用研究,2018,35(12):3541-3546. 被引量：1
4许也,申柏希,徐翔,李军.基于条件随机场的非规范化中文地址解析方法[J].地理与地理信息科学,2019,35(2):12-18. 被引量：13
5李晓林,张懿,李霖.基于地址语义理解的中文地址识别方法[J].计算机工程与科学,2019,41(3):551-558. 被引量：8
6徐兵,石少青,陈超.基于自然语言的中文地址匹配研究[J].电子设计工程,2020,28(16):7-10. 被引量：4
7王兴宝,雷琴辉,梅林海,张亚,邢猛.汽车语音交互技术发展趋势综述[J].汽车文摘,2021(2):9-15. 被引量：8
8孙士琦,汤鲲.基于BERT的中文地址分词方法[J].电子设计工程,2021,29(9):155-159. 被引量：3
9殷滋伟,张伟,王佳慧,马利民.面向地址数据基于ISM理论构建数据清洗规则链方法研究[J].北京信息科技大学学报（自然科学版）,2021,36(6):87-92. 被引量：1
10李鑫.基于MongoDB数据库的智能医疗分布式数据提取算法[J].微型电脑应用,2022,38(1):150-153. 被引量：1

1张水舰,王芳.自然语言实时交通信息与位置信息的融合方法[J].计算机时代,2014(2):42-44. 被引量：1
2安文娟,李丹,辛阳.基于聚类算法的实时IP流量识别技术研究[J].信息网络安全,2012(10):54-58.
3李日,李梅娥,王友序,杨根仓.铸造方法选择的专家系统研究与开发[J].西北工业大学学报,1998,16(3):353-358. 被引量：7
4孙林夫,黄岩,陈沛,方英.工程集成化CAD系统的图形系统设计[J].计算机辅助设计与制造,1995(7):10-13. 被引量：6
5李日,李梅娥,王友序,杨根仓.铸造方法选择专家系统的知识库构造的研究[J].铸造,1997,46(9):10-13. 被引量：3
6崔琳杰.日语人称代词的使用特征分析[J].中国校外教育,2013(3):122-122. 被引量：1
7王立宇.地理信息系统的综合性应用探析[J].中国管理信息化,2015,18(8):67-67.
8赛牙热.依马木,热依莱木.帕尔哈提,艾斯卡尔.艾木都拉,李志军.基于不同关键词提取算法的维吾尔文本情感辨识[J].清华大学学报（自然科学版）,2017,57(3):270-273.
9郭喜锋,高红,詹有河,秦月,韩志仁.一种基于MBD的部件装配工艺设计辅助系统[J].航空制造技术,2016,59(6):72-75. 被引量：2
10热依莱木.帕尔哈提,孟祥涛,艾斯卡尔.艾木都拉.基于区分性关键词模型的维吾尔文本情感分类[J].计算机工程,2014,40(10):132-136. 被引量：11

武汉工程大学学报

2015年第11期

浏览历史

内容加载中请稍等...

基于条件随机场的中文地址行政区划提取方法被引量：7

参考文献9

二级参考文献15

共引文献12

同被引文献76

引证文献7

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于条件随机场的中文地址行政区划提取方法 被引量：7

参考文献9

二级参考文献15

共引文献12

同被引文献76

引证文献7

二级引证文献24

相关作者

相关机构

相关主题

浏览历史

基于条件随机场的中文地址行政区划提取方法被引量：7