期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于质子串分解的中文术语自动抽取 被引量:21
1
作者 何婷婷 张勇 《计算机工程》 EI CAS CSCD 北大核心 2006年第23期188-190,共3页
针对中文术语构成特点,提出了一种基于质子串分解的术语自动抽取方法,将词分为2类:结构简单的质词和有复杂结构的合词;使用参数F-MI抽取结构简单的质词;并在其基础上,进一步使用质子串分解方法抽取具有复杂结构的合词。实验结果显示,该... 针对中文术语构成特点,提出了一种基于质子串分解的术语自动抽取方法,将词分为2类:结构简单的质词和有复杂结构的合词;使用参数F-MI抽取结构简单的质词;并在其基础上,进一步使用质子串分解方法抽取具有复杂结构的合词。实验结果显示,该算法有效地提高了中文自动术语抽取的精确度。目前该算法已在国家网络媒体监测项目中得到了应用,并显示了良好的效果。 展开更多
关键词 质子串分解 术语自动抽取 c—value 互信息
下载PDF
一种基于改进似然比的术语自动抽取方法 被引量:1
2
作者 林磊 孙承杰 +1 位作者 张二艳 刘秉权 《广西师范大学学报(自然科学版)》 CAS 北大核心 2010年第1期153-156,共4页
术语自动抽取是信息处理领域的基础性课题,日益受到研究者的关注。似然比方法能有效抽取低频词汇,但抽取准确率偏低。为了解决这个问题,将似然比的抽取结果用C-value进行改进。实验证明,两者相结合,在保证似然比方法高召回率的前提下,... 术语自动抽取是信息处理领域的基础性课题,日益受到研究者的关注。似然比方法能有效抽取低频词汇,但抽取准确率偏低。为了解决这个问题,将似然比的抽取结果用C-value进行改进。实验证明,两者相结合,在保证似然比方法高召回率的前提下,比单纯依靠似然比方法抽取准确率提高了约8%。 展开更多
关键词 低频词 对数似然比 c—value 术语抽取
下载PDF
C-value值和unithood指标结合的中文科技术语抽取 被引量:10
3
作者 韩红旗 安小米 《图书情报工作》 CSSCI 北大核心 2012年第19期85-89,共5页
研究从科技论文文本中抽取作者关键词以外的科技术语的方法。因为标引效应问题,单纯选择论文中的关键词作为候选术语会影响术语库的数量和质量,需要考虑从论文文本中抽取术语。现有的大多数术语抽取方法重视采用termhood指标,而忽视unit... 研究从科技论文文本中抽取作者关键词以外的科技术语的方法。因为标引效应问题,单纯选择论文中的关键词作为候选术语会影响术语库的数量和质量,需要考虑从论文文本中抽取术语。现有的大多数术语抽取方法重视采用termhood指标,而忽视unithood指标,针对此问题,在C-value算法的基础上,提出用于生成候选术语的中文术语构词规则和测量术语内部结合强度的unithood指标,实现从论文文本中抽取中文科技术语。以信息资源管理领域的术语抽取为例对提出的方法进行验证,实验结果证明,提出的方法能够有效地抽取领域科技术语,抽取精度较高。 展开更多
关键词 术语抽取c—value算法 unithood科技术语
原文传递
政务领域本体术语的自动抽取 被引量:10
4
作者 翟笃风 刘柏嵩 《现代图书情报技术》 CSSCI 北大核心 2010年第4期59-65,共7页
提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影... 提出一种新的政务本体术语自动抽取的方法。首先通过中文分词技术和单字合并法提取政务文本中的词作为候选术语;通过C-value求解法和TF-IDF算法对候选术语进行过滤抽取,从而实现政务领域术语的自动抽取。通过实验比较,发现该方法在不影响领域术语抽取召回率的同时可以提高抽取术语的正确率。 展开更多
关键词 政务领域本体 术语 单字合并法 c—value TF—IDF算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部