期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
无词典中英文混合术语抽取及算法研究 被引量:2
1
作者 姜韶华 党延忠 《情报学报》 CSSCI 北大核心 2006年第3期301-305,共5页
中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需... 中英文混合术语可作为未登录词处理、加权处理和歧义消解等的辅助信息,并有助于提高中文信息处理的质量。依据长度递减与串频统计思想,本文提出了一种中英文混合术语的抽取方法。该方法不需要词典,不需要事先进行语料库的学习,不需要建立字索引,而是依靠统计信息,抽取出支持度大于等于阈值的中英文混合术语。该算法能够有效地抽取出文本中新涌现的通用词、专业术语及专有名词。实验显示该方法不受语料限制,能够快速、准确地进行中英文混合术语的抽取。 展开更多
关键词 中英文混合术语 中文信息处理 串频 长串优先 算法 词典
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部