期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
自动提取含字母词语的领域新术语的研究 被引量:3
1
作者 姜韶华 党延忠 《计算机工程》 CAS CSCD 北大核心 2007年第2期47-49,共3页
新术语的提取是中文信息处理领域的一个重要研究课题。针对现有提取方法的不足和很多专业术语表现为字母词语的特点,该文提出了一种综合统计技术和规则筛选的方法:基于长串优先和串频统计的思路进行文本切分,得到共现字符串,利用词语搭... 新术语的提取是中文信息处理领域的一个重要研究课题。针对现有提取方法的不足和很多专业术语表现为字母词语的特点,该文提出了一种综合统计技术和规则筛选的方法:基于长串优先和串频统计的思路进行文本切分,得到共现字符串,利用词语搭配规则进行过滤,经过领域词典及评价函数的筛选,提取出领域新术语。该方法可发现包含字母词语、专业术语等未登录词在内的频率大于等于2的任意长度的专指语义串、短语和词。实验表明了该方法的有效性及新术语的准确率分布特征。 展开更多
关键词 专指语义串 优先 字母词语 中文信息处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部