-
题名可支持热点查询的双索引技术
- 1
-
-
作者
丁维
周长胜
马志强
杨娜
-
机构
北京信息科技大学
-
出处
《铁路计算机应用》
2007年第6期13-15,共3页
-
基金
北京市教委资助项目(82062015)
-
文摘
介绍可支持热点查询的双索引技术,搜索引擎的构成,描述索引的结构及其采取的双索引机制,并介绍索引性能的优化及词语过滤机制,热点查询技术。
-
关键词
搜索引擎
双索引机制
热点查询
索引优化
词语过滤机制
-
Keywords
search engine
double-indexing mechanism
hot-word querying
index optimization
word-filtering mechanism
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-
-
题名搜索日志中热点查询的内容抽取
被引量:1
- 2
-
-
作者
任育伟
吕学强
李卓
徐丽萍
-
机构
北京信息科技大学网络文化与数字传播重点实验室
北京城市系统工程研究中心
-
出处
《计算机应用与软件》
CSCD
2015年第12期16-21,共6页
-
基金
国家自然科学基金项目(61271304)
北京市教委科技发展计划重点项目暨北京市自然科学基金B类重点项目(KZ201311232037)
-
文摘
搜索日志中蕴含海量的信息,利用搜索日志进行挖掘以及分析热点查询内容,对于提高搜索服务的质量有很大的价值和意义。在融合K-means聚类中心迭代优点和查询词向量长度信息的基础上,提出SKHC(类K-means层次聚类)方法,并以该方法对搜索日志聚类。然后,分析聚类后的查询用户数、查询频次、查询累计时间、查询数、统计量特征与热点查询的关系,提出基于各类热度值进行热点查询内容抽取的方法,同时融合了日志热度值和倒排日志频率统计特征。通过对抽取出的结果进行统计分析,并和日志所在月份发生的热点事件进行相关性比较,发现四川地震和北京奥运月平均热度分别达到最高的0.89和0.81,证明了该方法的有效性。
-
关键词
搜索日志
聚类
热点查询
热度
-
Keywords
Search engine logs
Clustering
Hot query
Heat
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于BLOB的图像查询系统应用研究
被引量:1
- 3
-
-
作者
王辉
李晋光
-
机构
西安工业大学计算机科学与工程学院
陕西汽车集团有限责任公司
-
出处
《电子设计工程》
2011年第16期51-54,共4页
-
文摘
随着图像信息处理方面应用领域的不断扩大,对如何有效地组织图像数据库地研究也越来越深入。本文介绍了一个集图像处理、热点查询和数据库于一体的面向图像的信息管理系统,该系统以BLOB为基础,采用扩充的关系数据库模式并引入图像数据库技术,使用多个小的图像数据表和图像数据索引表,解决了系统中图像数据的录入检索以及图像热点操作问题。结果表明,基于BLOB的图像查询系统既保证系统的安全性和数据的完整性,也满足了系统要求的速度和效率,是进行图像数据在数据库系统中处理与使用的有效方法。
-
关键词
图像处理
热点查询
信息管理系统
关系数据库
-
Keywords
image processing
hotspot
information management system
relation database
-
分类号
TP392
[自动化与计算机技术—计算机应用技术]
-
-
题名基于实时数据和历史查询分布的时空索引新方法
被引量:2
- 4
-
-
作者
孟学潮
叶少珍
-
机构
福州大学数学与计算机科学学院
福建省医疗器械与医药技术重点实验室
-
出处
《计算机应用》
CSCD
北大核心
2017年第3期860-865,共6页
-
基金
国家自然科学基金资助项目(61502106)
福建省区域重大科技专项资助项目(2014H4015)~~
-
文摘
在大数据时代,数据具有体量大、时空复杂性明显、对实时性要求较高等特点,而传统基于树形结构对大规模时空数据进行索引的方法存在存储空间浪费和查询效率较低的问题。为了解决该问题,提出了一种基于数据和历史查询记录分布建立时空索引的新方法 HDL-index。该算法一方面根据数据在空间上的分布,通过空间划分的思想建立索引网格;另一方面考虑到查询在时间上的延续性,对查询记录对象进行密度聚类后抽象出查询代表模型,然后根据模型的坐标位置和其查询粒度对整体查询区域进行分割。两部分所得到的索引网格都采用Geohash编码,最终合并得到最优的索引编码。HDL-index在考虑数据分布的同时充分考虑用户查询行为,使得频繁查询区域上的索引更加细化。在真实航空数据集上与同类方法进行比较测试的结果表明,其创建索引的效率提高了50%;同时在数据均匀分布的情况下对热点区域的查询效率可提高75%以上。
-
关键词
时空索引
大数据
GeoHash编码
密度聚类
热点区域查询
-
Keywords
spatio-temporal index
big data
GeoHash encoding
density clustering
hotspot region query
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-