期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于主题描述模型的相关性判断在网页信息抽取中的应用 被引量:6
1
作者 谭胜 马静 吴一占 《情报学报》 CSSCI 北大核心 2011年第2期155-159,共5页
信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节.目前的相关性判断主要采用人工筛选和文档训练的方法,这其中存在效率低、重复训练等问题,而本文尝试针对抽取任... 信息抽取是从海量网页获取有价值信息的重要方式,对目标网页内容进行主题相关性判断是提高信息抽取效率和准确性的关键环节.目前的相关性判断主要采用人工筛选和文档训练的方法,这其中存在效率低、重复训练等问题,而本文尝试针对抽取任务引入主题描述模型用于网页内容的主题相关性判断.从任务的主题描述模型的角度出发,计算模型中的关键词基于标记信息的加权频率,将网页内容进行量化表示,然后分析关键词加权频率关于任务主题描述模型的变化来判断网页内容的主题相关性.最后通过对比该方法在国防产品信息抽取中结果,实验证明该方法大大提高了网页信息抽取的效率和准确性. 展开更多
关键词 主题相关性 主题描述模型 文档频率 信息抽取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部