-
题名一种基于混合判定模型的复合概念抽取方法
被引量:3
- 1
-
-
作者
欧阳柳波
邹北骥
刘丽杰
-
机构
中南大学信息科学与工程学院
湖南大学软件学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2013年第3期488-495,共8页
-
文摘
从大规模领域语料库中抽取领域概念,现有方法不能有效识别复合概念.本文提出一种基于混合判定模型的复合概念抽取方法,首先对文本进行分词处理,为每个词条添加词条标签,并对词条集进行噪音词消除和同义词合并处理,然后统计词条的加权词频,根据词条标签值计算位置亲和度和位置匹配度,判定和筛选可组合成复合概念的原子词条,最后通过设置不同复合深度值,实现多重复合概念抽取.采用不同规模语料库进行抽取实验,实验结果表明本文方法具有更高的召回率和准确率.
-
关键词
语料库
领域概念
复合概念
加权词频
词条标签
位置亲和度
复合深度
-
Keywords
corpus
domain concept
compound concept
weighted term frequency
entry label
location affinity
compound depth
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-