-
题名SVM与规则相结合的中文地名自动识别
被引量:32
- 1
-
-
作者
李丽双
黄德根
陈春荣
杨元生
-
机构
大连理工大学计算机科学与工程系
-
出处
《中文信息学报》
CSCD
北大核心
2006年第5期51-57,共7页
-
基金
国家自然科学基金资助项目(60373095
60373096)
-
文摘
在分析中文文本中地名特点的基础上,提出了一种支持向量机(SVM)与规则相结合的中文地名自动识别方法:按字抽取特征向量的属性,然后将这些属性转换成二进制向量并建立训练集,采用多项式Kernel函数,得到SVM识别地名的机器学习模型;通过对错误识别结果的分析,构建规则库对识别结果进行后处理,弥补了机器学习模型获取知识不够全面导致召回率偏低的不足。实验表明,用SVM与规则相结合的机制识别中文文本中的地名是有效的:系统开式召回率、精确率和F-值分别达89.57%、93.52%和91.50%。
-
关键词
计算机应用
中文信息处理
中文地名识别
支持向量机
机器学习
基于规则的后处理
-
Keywords
computer application
chinese information processing
support vector machines
chinese place names recognition
machine learning
rule-based post-processing
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于实例和错误驱动的规则学习方法及其应用
被引量:1
- 2
-
-
作者
王蕾
朱巧明
李培峰
杨季文
-
机构
苏州大学计算机科学与技术学院
江苏省计算机信息处理技术重点实验室
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第1期162-164,共3页
-
文摘
提出了一种基于实例和错误驱动相结合的规则学习方法。该方法首先将提取的文本中的语法结构信息作为实例,然后采用基于转换的错误驱动学习方法找出这些实例的适用上下文环境,从而建立相应的规则库。此方法提取出的规则完全采用机器学习的方式,避免了人工提取规则的主观性缺点。可用于诸如词性标注、未登录词识别、命名实体抽取等自然语言研究课题。
-
关键词
规则学习
中文信息处理
专有名词识别
-
Keywords
rule learning chinese information processing proper noun recognition
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于小句相似度计算的专有名词识别
被引量:1
- 3
-
-
作者
朱丽丽
郑家恒
-
机构
山西大学计算机与信息技术学院
-
出处
《通讯和计算机(中英文版)》
2006年第6期18-22,35,共6页
-
基金
本文得到国家自然科学基金项目(No.60473139)和山西省自然科学基金项目(No.20051034)的资助,
-
文摘
专有名词识别是中文信息处理领域的一个难题。句子相似度计算方法在中文信息处理领域有着广泛的应用。本文探索性地使用句子相似度计算方法来解决专有名词识别问题,并针对专有名词识别的研究背景对小句相似度计算方法做了一些改进,改进的计算方法不仅考虑了公共字符,而且还加入了语义信息和结构信息。实验证明该方法是可行的。
-
关键词
中文信息处理
专有名词识别
句子相似度计算
-
Keywords
chinese information processing
proper nouns recognition (PNR)
Sentence SimilarityComputing
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-