-
题名基于模式匹配与半监督学习的评价对象抽取
被引量:4
- 1
-
-
作者
宋晖
史南胜
-
机构
东华大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
2013年第10期221-226,共6页
-
文摘
针对产品评论中评价对象的抽取问题,提出一种基于模式匹配与半监督学习的抽取方法。通过大量样本统计,获得种子规则集,以抽取有效评价句,利用句法结构组合以及词性距离相关性算法抽取评价对象,将种子规则和评价对象存入相应的模式库,并通过半监督学习方法与规则的动态替换,进行规则的学习与评价对象的扩充训练。实验结果表明,该方法的抽取效果较好,证明了方法的可行性。
-
关键词
评价对象
意见挖掘
词性搭配
词性距离相关性算法
模式匹配
有效评价句
-
Keywords
comment object
opinion mining
combination of part of speech(pos)
part of speech(pos)-distance Correlation Algorithm(PCA)
pattern matching
effective evaluation sentence
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种松耦合的生物医学命名实体识别算法
被引量:2
- 2
-
-
作者
胡俊锋
陈蓉
陈源
陈浩
于中华
-
机构
四川大学计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2007年第11期2866-2869,共4页
-
基金
国家自然科学基金资助项目(60473071)
高等学校博士学科点专项科研基金项目(20020610007)
四川大学计算机学院青年基金项目
-
文摘
生物医学命名实体识别(Bio-NER)是生物医学文献挖掘利用的基础工作。针对目前Bio-NER存在的困难和问题,提出了松耦合的Bio-NER算法LCA,该算法利用启发规则过滤器、词性模板匹配及改良的隐马尔科夫模型(HMM)识别生物医学命名实体。在GENIA corpus3.02语料库上进行的实验表明,LCA可以达到80%的准确率和89%的召回率,优于相关工作中的结果。
-
关键词
生物医学命名实体
启发规则过滤器
词性模板匹配
词根匹配
隐马尔科夫模型
松耦合算法
-
Keywords
biomedical named entity
heuristic rule filter
parts of speech (pos) pattern matching
etyma matching
Hidden Markov Model (HMM)
loose coupling algorithm
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
TP391.4
[自动化与计算机技术—计算机应用技术]
-