期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种编辑距离算法及其在网页搜索中的应用
被引量:
16
1
作者
薛晔伟
沈钧毅
张云
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2008年第12期1450-1454,共5页
针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个字符串,再利用改进的编辑距离计算2个字符串之间的相似性.由于...
针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个字符串,再利用改进的编辑距离计算2个字符串之间的相似性.由于在用户查询与待比较的简短网页域之间引入了查询词分布的位置、顺序和距离等,以及含有查询词修饰关系的重要信息,所以编码字符串之间的相似程度可以衡量对应的查询与简短网页域之间的相关性.经大规模真实搜索引擎实验表明,该算法较之传统的相关性排序算法,可以显著地提高网页搜索中的简短网页域相关性排序性能,尤其适用于简短域与用户查询之间的相关性比较.
展开更多
关键词
网页搜索
相关性排序
编辑距离
字符串匹配
下载PDF
职称材料
网页特征获取方法及其在网页搜索中的应用(英文)
被引量:
1
2
作者
薛晔伟
沈钧毅
+1 位作者
张云
鲍军鹏
《Journal of Southeast University(English Edition)》
EI
CAS
2008年第3期330-334,共5页
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索...
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.
展开更多
关键词
网页搜索
相关性排序
检索效率
下载PDF
职称材料
题名
一种编辑距离算法及其在网页搜索中的应用
被引量:
16
1
作者
薛晔伟
沈钧毅
张云
机构
西安交通大学电子与信息工程学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2008年第12期1450-1454,共5页
基金
国家自然科学基金资助项目(60673087)
文摘
针对传统方法不能很好地处理网页中简短域与用户查询之间的相关性排序问题,提出一种基于改进的编辑距离排序算法.将以词为单位的用户查询和简短网页域通过匹配编码转化为2个字符串,再利用改进的编辑距离计算2个字符串之间的相似性.由于在用户查询与待比较的简短网页域之间引入了查询词分布的位置、顺序和距离等,以及含有查询词修饰关系的重要信息,所以编码字符串之间的相似程度可以衡量对应的查询与简短网页域之间的相关性.经大规模真实搜索引擎实验表明,该算法较之传统的相关性排序算法,可以显著地提高网页搜索中的简短网页域相关性排序性能,尤其适用于简短域与用户查询之间的相关性比较.
关键词
网页搜索
相关性排序
编辑距离
字符串匹配
Keywords
web search
relevance ranking
edit distance
string match
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
网页特征获取方法及其在网页搜索中的应用(英文)
被引量:
1
2
作者
薛晔伟
沈钧毅
张云
鲍军鹏
机构
西安交通大学计算机科学与技术系
出处
《Journal of Southeast University(English Edition)》
EI
CAS
2008年第3期330-334,共5页
基金
The National Natural Science Foundation of China(No.60673087)
文摘
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.
关键词
网页搜索
相关性排序
检索效率
Keywords
web search
relevance ranking
retrieval effectiveness
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
一种编辑距离算法及其在网页搜索中的应用
薛晔伟
沈钧毅
张云
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2008
16
下载PDF
职称材料
2
网页特征获取方法及其在网页搜索中的应用(英文)
薛晔伟
沈钧毅
张云
鲍军鹏
《Journal of Southeast University(English Edition)》
EI
CAS
2008
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部