一种基于SVM／RS的中文机构名称自动识别方法被引量：4

A Method of Automatic Recognition for Chinese Organization Name Based on SVM/RS

下载PDF

导出

摘要该文提出一种支持向量机(support Vector Machines,SVM)和粗糙集(Rough Set,RS)相结合的巾文机构名称短语识别方法。该方法借助词的基术语义搭配关系表示短语的构成规则,并通过粗糙集属性约简的方法自动学>J 到机构名称构成规则的无冗余集。识别时,首先寻找到与这些规则匹配的词串作为候选机构名,然后结合候选机构名以及其上下文词的语义特征,利用SVM分类器判断该候选是否是真正的机构名称。这种方法对1617万字人尾日榴语赳开卉々jIj=『Il请的F信钋剐诀到R,f16％． A method to identify Chinese organization names by utilizing SVM （Support Vector Machines） and RS （Rough Set） is provided. Forming rule of organization name is defined based on semanteme collocation relation, and then the un-redundancy set of rough forming rules can be learned by employing attribute reduction in RS automatically. A chain of words matching forming rule is selected first as candidate, then a SVM classifier discern whether a candidate is real organization name according to candidate semanteme and its contextual semanteme while recognizing. Results of open testing achieve F-measure 82.06% in 16.17 million words news based on this project separately.

作者宇缨王晓龙刘秉权

机构地区哈尔滨工业大学计算机学院

出处《电子与信息学报》 EI CSCD 北大核心 2006年第5期895-900,共6页 Journal of Electronics & Information Technology

基金国家自然科学基金(60175020) 国家863计划(2002AA117010-09)资助课题

关键词模式识别 SVM 特征选择语义粗糙集语义搭配 Pattern recognition, SVM, Feature selection, Semanteme, Rough Set（RS）, Semanteme collocation

分类号 TP391.43 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1谭红叶,郑家恒,刘开瑛.基于变换的中国地名自动识别研究(英文)[J].软件学报,2001,12(11):1608-1613. 被引量：23
2张辉,徐健.中国组织机构名自动识别系统的设计与实现[J].电脑开发与应用,2002,15(1):5-6. 被引量：7
3王宁,葛瑞芳,苑春法,黄锦辉,李文捷.中文金融新闻中公司名的识别[J].中文信息学报,2002,16(2):1-6. 被引量：47

二级参考文献3

1Tan Hongye，Proc Computational Linguistics，1999年，174页
2中国地名委员会，中国地名录，1994年
3张小衡,王玲玲.中文机构名称的识别与分析[J].中文信息学报,1997,11(4):21-32. 被引量：78

共引文献72

1张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：9
2王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
3毛姝洁,张雪虎.基于兴趣点简称的检索方法研究[J].太原理工大学学报,2008,39(S1):52-55. 被引量：1
4郑炜冬.多种方法融合的中文自动分词系统的设计与实现[J].韩山师范学院学报,2009,30(6):37-43.
5李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量：10
6车海燕,孙吉贵,荆涛,白曦.一个基于本体主题的中文知识获取方法[J].计算机科学与探索,2007,1(2):206-215. 被引量：5
7赵健,王晓龙,关毅.中文名实体识别中的特征组合与特征融合的比较[J].计算机应用,2005,25(11):2647-2649. 被引量：7
8黄德根,孙迎红.中文地名的自动识别[J].计算机工程,2006,32(3):220-222. 被引量：10
9俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：150
10高红,黄德根,杨元生.汉语自动分词中中文地名识别[J].大连理工大学学报,2006,46(4):576-581. 被引量：10

同被引文献55

1宇缨 ,Wang Xiaolong ,Liu Bingquan ,Wang Hui .Efficient SVM-based Recognition of Chinese Personal Names[J].High Technology Letters,2004,10(3):15-18. 被引量：1
2潘锋,王宣银,向桂山,梁冬泰.一种新的运动目标检测与跟踪算法[J].光电工程,2005,32(1):43-46. 被引量：18
3骆正华,樊孝忠,刘林,龚永罡.基于E-Chunk的问句实例分析系统[J].北京理工大学学报,2005,25(1):63-66. 被引量：2
4杨勇智,文远保.一种改进的快速相关跟踪算法[J].计算机应用,2005,25(12):2843-2844. 被引量：5
5冯冲,陈肇雄,黄河燕.采用主动学习策略的组织机构名识别[J].小型微型计算机系统,2006,27(4):710-714. 被引量：12
6周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：111
7张亮,王树梅,黄河燕,张孝飞.面向中文问答系统的问句句法分析[J].山东大学学报（理学版）,2006,41(3):85-88. 被引量：5
8钱晶,张杰,张涛.基于最大熵的汉语人名地名识别方法研究[J].小型微型计算机系统,2006,27(9):1761-1765. 被引量：26
9任禾,曾隽芳.一种基于信息熵的中文高频词抽取算法[J].中文信息学报,2006,20(5):40-43. 被引量：22
10郭家清,蔡东风,王智超,刘浩公.一种基于条件随机场的人名识别方法[J].通讯和计算机（中英文版）,2007,4(2):22-25. 被引量：6

引证文献4

1宇缨.支持向量机及其在自然语言处理中的应用[J].东莞理工学院学报,2007,14(1):54-62. 被引量：3
2韦向峰,张全,吴晨,袁毅.中文问答系统中机构名的处理[J].计算机工程与应用,2008,44(7):196-198. 被引量：2
3周波,蔡东风.基于条件随机场的中文组织机构名识别研究[J].沈阳航空工业学院学报,2009,26(1):49-52. 被引量：8
4侯一民,伦向敏.基于SVM与Mean-Shift的非刚性目标跟踪框架[J].系统工程与电子技术,2009,31(9):2266-2270. 被引量：3

二级引证文献16

1柳春.语音识别技术研究进展[J].甘肃科技,2008,24(9):41-43. 被引量：20
2程建明,刘亮,马海勇.SVM法研究不同冻干添加剂对黄芪多糖共晶点温度的影响[J].现代医药卫生,2010,26(2):193-194. 被引量：2
3王裴岩,张桂平,蔡东风,白宇,叶娜.一种用于专利主题词抽取的模板自动生成方法[J].沈阳航空工业学院学报,2010,27(3):46-49. 被引量：4
4滕青青,吉久明,郑荣廷,李楠.基于文献的中文命名实体识别算法适用性分析研究[J].情报杂志,2010,29(9):157-161. 被引量：9
5任志敏,蔡东风,尹宝生.一种高效的基于启发式规则和词典相结合的双语词对齐方法[J].沈阳航空工业学院学报,2010,27(5):73-77. 被引量：2
6成姣,蔡东风,季铎.基于条件随机场的日语依存分析[J].沈阳航空工业学院学报,2010,27(5):78-81.
7张五辈,白宇,王裴岩,张桂平.一种中医名词术语自动抽取方法[J].沈阳航空航天大学学报,2011,28(1):72-75. 被引量：8
8尹驰东,黄生叶,鄂智丰.寻路算法在中文金融机构名匹配中的应用[J].计算技术与自动化,2011,30(2):83-88.
9姜文志,顾佼佼,丛林虎.CRF与规则相结合的军事命名实体识别研究[J].指挥控制与仿真,2011,33(4):13-15. 被引量：16
10宋丹,赵保军,唐林波.融合角点特征与颜色特征的Mean-Shift目标跟踪算法[J].系统工程与电子技术,2012,34(1):199-203. 被引量：16

1张剑,屈丹,李真.基于词向量特征的循环神经网络语言模型[J].模式识别与人工智能,2015,28(4):299-305. 被引量：38
2王璐,张仰森,吴林.基于多知识源的语义搭配知识获取及表示方法[J].计算机工程,2012,38(20):109-112. 被引量：2
3张航,李文华,张登科.C#委托和事件及其在MIS中的应用[J].仪器仪表用户,2006,13(5):138-139.
4孙瑞娜.基于CRFs的哈萨克语名词短语自动获取[J].图书馆理论与实践,2015(8):101-105. 被引量：1
5梁文娟,郑逢斌,杜莹.汉字语法语义智能输入法搭配库的设计与实现[J].计算机工程与设计,2009,30(21):5003-5006. 被引量：1
6孙慧增,杜敏.从真名网名对比看网名的随意性[J].读与写（教育教学刊）,2007,4(1):122-122. 被引量：3
7张小衡,王玲玲.中文机构名称的识别与分析[J].中文信息学报,1997,11(4):21-32. 被引量：78
8宋微.对语义搭配的简单思考[J].科技风,2012(13):208-208.
9陈佳,罗振声.一种基于语义搭配的汉语词义消歧方法[J].微计算机信息,2008,24(3):187-188. 被引量：1
10尹继豪,樊孝忠,于江德.基于类语言模型的中文机构名称自动识别[J].计算机科学,2006,33(11):212-214. 被引量：3

电子与信息学报

2006年第5期

浏览历史

内容加载中请稍等...

一种基于SVM／RS的中文机构名称自动识别方法被引量：4

参考文献3

二级参考文献3

共引文献72

同被引文献55

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

一种基于SVM／RS的中文机构名称自动识别方法 被引量：4

参考文献3

二级参考文献3

共引文献72

同被引文献55

引证文献4

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

一种基于SVM／RS的中文机构名称自动识别方法被引量：4