期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于XML和N层VSM的Web信息检索 被引量:4
1
作者 张冉 卡米力.毛依丁 《计算机技术与发展》 2006年第5期56-58,共3页
基于XML文档格式良好、层次清晰,可以方便地操纵、分析其结构的特点。文中在将Web上的HTML文档转化为XML文档的基础上,通过Java中的DOM树,分析文档的层次结构。把文档分为层次化的文本段,对传统的VSM算法进行改进,把每个文本段转换为空... 基于XML文档格式良好、层次清晰,可以方便地操纵、分析其结构的特点。文中在将Web上的HTML文档转化为XML文档的基础上,通过Java中的DOM树,分析文档的层次结构。把文档分为层次化的文本段,对传统的VSM算法进行改进,把每个文本段转换为空间向量,实现了N层VSM算法,通过试验证明,改进后算法的查全率和查准率都要优于传统的VSM算法。 展开更多
关键词 XML XHTML n层向量空间模型 查全率 查准率
下载PDF
普通文件和HTML文件及XML文件信息检索过程探析
2
作者 陈桂鸿 《科技情报开发与经济》 2009年第11期90-92,共3页
通过对普通文件(Plain Text)、HTML文件和XML文件结构的分析,以经典的VSM为例,探讨了3种文件在信息检索过程中所采用的不同处理技术。同时针对传统VSM的不足以及HTML文件和XML文件的结构特点,讨论了N-Level VSM对经典VSM的改进。
关键词 普通文件 XML文件 HTML文件 vsm 信息检索 nlevel vsm
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部