期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种基于生语料的领域词典生成方法 被引量:11
1
作者 孙霞 郑庆华 +1 位作者 王朝静 张素娟 《小型微型计算机系统》 CSCD 北大核心 2005年第6期1088-1092,共5页
为了实现准确分词,实用的汉语信息处理系统都需有其专用的领域词典.针对现有词典构造方法存在的不足,本文提出了一种领域词典的构造方法:利用通用词典对领域生语料进行分词处理,并提出了基于切分单元的最大匹配算法,从而得到候选词串集... 为了实现准确分词,实用的汉语信息处理系统都需有其专用的领域词典.针对现有词典构造方法存在的不足,本文提出了一种领域词典的构造方法:利用通用词典对领域生语料进行分词处理,并提出了基于切分单元的最大匹配算法,从而得到候选词串集,然后利用规则对其进行优化,最终生成领域词典.词典的生成过程基本上是自动完成的,人工干预少,易于更新;目前,本方法生成的领域词典已经应用于我们自主开发的"基于Web的智能答疑系统"中,并取得了较好的效果. 展开更多
关键词 领域词典 通用词典 词频统计 最大匹配
下载PDF
民航安全词典构建研究
2
作者 王宏伟 冯霞 +1 位作者 郇秀霞 杨春宝 《微计算机信息》 2009年第21期53-54,43,共3页
针对航空安全报告中结构化属性和非结构化属性共存、人工分析耗时耗力的现状,本文提出结合领域专家知识,采用基于切分单元的最大匹配算法得到候选集,利用互信息对其进行筛选,建立了专用的航空安全词典。为进行更进一步的数据分析、数据... 针对航空安全报告中结构化属性和非结构化属性共存、人工分析耗时耗力的现状,本文提出结合领域专家知识,采用基于切分单元的最大匹配算法得到候选集,利用互信息对其进行筛选,建立了专用的航空安全词典。为进行更进一步的数据分析、数据挖掘和识别隐藏在航空安全数据中未知的、潜在的问题、提高航空安全性能提供了基础。 展开更多
关键词 航空安全信息 领域词典 最大匹配 互信息
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部