摘要
条件随机场模型是文本信息抽取的重要方法之一,在命名实体识别方面CRF性能要明显优于隐马尔科夫模型和最大熵模型。本文以基于字一级的条件随机场模型实现了中文命名实体识别,取得了较好的识别效果。
出处
《中国新技术新产品》
2009年第2期15-15,共1页
New Technology & New Products of China
二级参考文献12
-
1Volk Martin, Clematide Simon. Learn-filter-apply-forget mixed approaches to named entity recognition [C]. In: Proc of the 6th Int'l Workshop on Applications of Natural Language for Information Systems. Berlin: Springer, 2001. 153-163.
-
2Y Z Wu, J Zhao, B Xu. Chinese named entity based on multiple features [C]. Human Language Technology Conference and Conf on Empirical Methods in Natural Language Processing (EMNLP-2005), Vancouver, Canada, 2005.
-
3H P Zhang, Q Liu, H Zhang, et al. Automatic recognition of Chinese unknown words based on roles tagging [C]. SigHan2002 Workshop Attached with the 19th Int'l Conf on Computational Linguistics, Taipei, 2002.
-
4O Bender, F J Och, H Ney. Maximum entropy models for named entity recognition [C]. The 7th Conf on Computational Natural Language Learning (CoNLL 2003), Edmonton, Canada, 2003.
-
5H L Chieu, H T Ng. Named entity recognition with a maximum entropy approach [C]. The 7th Conf on Computational Natural Language Learning (CoNLL 2003), Edmonton, Canada, 2003.
-
6A Berger, V J Della Pietra, S A Della Pietra. A maximum entropy approach to natural language processing [J]. Computational Linguistics, 1996, 22(1): 39-71.
-
7Ramaparkhi Adwait. A simple introduction to maximum entropy models for natural language processing [R]. Institute for Research in Cognitive Science Report,.
-
8J N Darroch, D Ratcliff. Generalized iterative scaling for loglinear models [J]. The Annals of Mathematical Statistics, 1972, 43(5): 1470-1480.
-
9Y Z Wu, J Zhao, B Xu. Chinese named entity recognition combining a statistical model with human knowledge [C]. The 41st Annual Meeting of the Association for Computational Linguistics (ACL-2003), Sapporo, 2003.
-
10T H Tsai, S H Wu, C W Lee, etal. Mencius: a Chinese named entity recognizer using maximum entropy-based hybrid model [J]. Computational Linguistics & Chinese Language Processing, 2004, 9(1): 65-82.
共引文献31
-
1高原,施元磊,张蕾,曹天奕,冯筠.基于游记文本的游客游览行程重构[J].数据分析与知识发现,2020,4(2):165-172. 被引量:5
-
2刘鹏博,车海燕,陈伟.知识抽取技术综述[J].计算机应用研究,2010,27(9):3222-3226. 被引量:15
-
3滕青青,吉久明,郑荣廷,李楠.基于文献的中文命名实体识别算法适用性分析研究[J].情报杂志,2010,29(9):157-161. 被引量:9
-
4李丽双,党延忠,李丹.基于修正SVM-KNN组合算法的汉语专有名词自动抽取[J].情报学报,2011,30(6):610-617. 被引量:2
-
5张俊三,瞿有利,税仪冬,田盛丰.相关实体发现中基于Wikipedia的实体排序[J].计算机研究与发展,2014,51(6):1359-1372. 被引量:1
-
6易应萍,张志强,王强.基于自然语言处理技术的医学命名实体解析研究[J].中国数字医学,2018,13(12):20-22. 被引量:1
-
7王路路,艾山.吾买尔,买合木提.买买提,卡哈尔江.阿比的热西提,吐尔根.依布拉音.基于CRF和半监督学习的维吾尔文命名实体识别[J].中文信息学报,2018,32(11):16-26. 被引量:13
-
8林雄鹰,黄宇光.基于规则和混合统计模型的中文地名识别研究[J].高性能计算技术,2012,0(1):31-35.
-
9柏兵,侯霞,石松.基于CRF和BI-LSTM的命名实体识别方法[J].北京信息科技大学学报(自然科学版),2018,33(6):27-33. 被引量:16
-
10刘艳超,郭剑毅,余正涛,周兰江,严馨,陈秀琴.融合实体特性识别越南语复杂命名实体的混合方法[J].智能系统学报,2016,11(4):503-512. 被引量:2
同被引文献39
-
1刘桃,刘秉权,徐志明,王晓龙.领域术语自动抽取及其在文本分类中的应用[J].电子学报,2007,35(2):328-332. 被引量:31
-
2黄昌宁,赵海.中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. 被引量:249
-
3ICTCLAS简介[EB/OL].[2008-12-01].http://ictclas.org/sub_1_1.html.
-
4Klinger R, Kolarik C, Fluck J, et al. Detection of IUPAC and IUPAC - like Chemical Names [ J ]. Bioinformatics, 2008, 24 ( 13 ) : i268 - i276.
-
5Lafferty J, McCallum A, Pereira F. Conditional Random Fields: Probabilistic Models for Segmenting and Labeling Sequence Data [C]. In: Proceedings of the 18th International Conference on Machine Learning. San Francisco, CA, USA: Morgan Kaufmann Publishers Inc. , 2001 : 282 -289.
-
6Van Rijsbergen C J. Information Retrieval[M]. 2nd Edition. London: Butterworth, 1979.
-
7He Y, Kayaal P M. Biological Entity Recognition with Conditional Random Fields [ C ]. In: Proceedings of AMIA Annual Symposium. 2008 : 293 - 297.
-
8He Y, Kayaalp M. Biological entity recognition with conditional random fields. AMIA Anntt Syrup Proc,2008 : 293 -297.
-
9Church K W, Hanks P. Word association norms, mutual information and lexicography. Computational Linguistics, 1990 (3) :22 - 29.
-
10Zhao Hal, Huang Changning, et al. Effective tag set selection in Chinese word segmentation via conditional random field modeling// Proceedings of PACLIC - 20. Wuhan ,2006 : 87 - 94.
引证文献3
-
1郑荣廷,李楠,吉久明,滕青青.中文化学物质名称识别研究[J].现代图书情报技术,2010(6):48-52. 被引量:4
-
2郑荣廷,吉久明,李楠.特征值区间的有效划分对CRF识别效果的影响[J].图书情报工作,2011,55(4):114-118. 被引量:3
-
3段宇锋,朱雯晶,陈巧,刘伟,刘凤红.条件随机场与领域本体元素集相结合的未登录词识别研究[J].现代图书情报技术,2015(4):41-49. 被引量:3
二级引证文献9
-
1郑荣廷,吉久明,李楠.特征值区间的有效划分对CRF识别效果的影响[J].图书情报工作,2011,55(4):114-118. 被引量:3
-
2潘国巍,吉久明,李楠,郑荣廷.基于两类统计机器学习模型的中文化学物质名称识别研究[J].现代情报,2011,31(11):163-165. 被引量:3
-
3柯修,王惠临,于薇.基于串频统计的汉语和孟加拉语专有名词识别[J].现代图书情报技术,2011(12):31-38. 被引量:2
-
4王希杰.词位标注汉语分词中上下文有效范围定量分析[J].计算机应用,2012,32(5):1340-1342. 被引量:2
-
5段宇锋,黄思思.基于BFO构建中文植物物种多样性领域本体的研究[J].现代图书情报技术,2015(12):72-79. 被引量:3
-
6司莉,史雅莉.基于跨语言信息检索的可比语料库构建方法研究[J].国家图书馆学刊,2016,25(6):64-70. 被引量:1
-
7王晓玉,李斌.基于CRFs和词典信息的中古汉语自动分词[J].数据分析与知识发现,2017,1(5):62-70. 被引量:22
-
8徐璐璐,杨嘉乐,康乐乐.医学信息领域人工智能技术的主题漂移与未来展望——基于JCR 26本医学信息期刊文本的命名实体识别[J].现代情报,2022,42(10):163-176. 被引量:1
-
9关菁华,毛子凡,王婷,谭梦琪.基于LDA和深度模型的专利主题演化[J].数学的实践与认识,2024,54(4):68-81.
-
1敬星.基于词向量与CRF的命名实体识别研究[J].无线互联科技,2017,14(1):111-112.
-
2杨兴文.有线电视放大器防雷电路改进[J].宝鼎科技,2004(4):39-40.
-
3张宏生.使用HMM模型改进规则自动生成的命名实体识别系统性能[J].中小企业管理与科技,2010(3):170-171.
-
4陈祖德.SONY CRF-320型收音机[J].无线电,2010(9):18-19.
-
5冯冲,陈肇雄,黄河燕,王江伟.最大熵模型的树-栅格最优N解码算法[J].计算机科学,2005,32(10):167-169. 被引量:1
-
6欧特克第三次蝉联“中国杰出雇主”奖[J].广播与电视技术,2011,38(2):70-70.
-
7周雪燕,韩建敏.基于条件随机场汉语分词的语料规模量化研究[J].电脑与电信,2012(7):56-59.
-
8涂闽.瓦克化学荣膺中国杰出雇主^(TM)[J].上海化工,2010,35(1):22-22.
-
9夏舜,王为.Ⅰ期药物临床试验智能手机客户端APP的开发与应用[J].无线互联科技,2016,13(13):47-48. 被引量:1
-
10李俊,赵燕平,陈湘波.ICRF天线阻抗测量与调配系统的设计与实现[J].微计算机信息,2001,17(9):27-28. 被引量:2