期刊文献+
共找到131篇文章
< 1 2 7 >
每页显示 20 50 100
The Study on China’s Flu Prediction Model Based on Web Search Data 被引量:2
1
作者 Yan Bu Jinhong Bai +2 位作者 Zhuo Chen Mingjing Guo Fan Yang 《Journal of Data Analysis and Information Processing》 2018年第3期79-92,共14页
Influenza is a kind of infectious disease, which spreads quickly and widely. The outbreak of influenza has brought huge losses to society. In this paper, four major categories of flu keywords, “prevention phase”, “... Influenza is a kind of infectious disease, which spreads quickly and widely. The outbreak of influenza has brought huge losses to society. In this paper, four major categories of flu keywords, “prevention phase”, “symptom phase”, “treatment phase”, and “commonly-used phrase” were set. Python web crawler was used to obtain relevant influenza data from the National Influenza Center’s influenza surveillance weekly report and Baidu Index. The establishment of support vector regression (SVR), least absolute shrinkage and selection operator (LASSO), convolutional neural networks (CNN) prediction models through machine learning, took into account the seasonal characteristics of the influenza, also established the time series model (ARMA). The results show that, it is feasible to predict influenza based on web search data. Machine learning shows a certain forecast effect in the prediction of influenza based on web search data. In the future, it will have certain reference value in influenza prediction. The ARMA(3,0) model predicts better results and has greater generalization. Finally, the lack of research in this paper and future research directions are given. 展开更多
关键词 data MINING web search Machine Learning BAIDU Index INFLUENZA Prediction
下载PDF
ANALYSIS OF THE PREDICTION CAPABILITY OF WEB SEARCH DATA BASED ON THE HE-TDC METHOD - PREDICTION OF THE VOLUME OF DAILY TOURISM VISITORS 被引量:5
2
作者 Geng Peng Ying Liu +1 位作者 Jiyuan Wang Jifa Gu 《Journal of Systems Science and Systems Engineering》 SCIE EI CSCD 2017年第2期163-182,共20页
Web search query data are obtained to reflect social spots and serve as novel economic indicators. When faced with high-dimensional query data, selecting keywords that have plausible predictive ability and can reduce ... Web search query data are obtained to reflect social spots and serve as novel economic indicators. When faced with high-dimensional query data, selecting keywords that have plausible predictive ability and can reduce dimensionality is critical. This paper presents a new integrative method that combines Hurst Exponent (HE) and Time Difference Correlation (TDC) analysis to select keywords with powerful predictive ability. The method is called the HE-TDC screening method and requires keywords with predictive ability to satisfy two characteristics, namely, high correlation and fluctuation memorability similar to the predicting target series. An empirical study is employed to predict the volume of tourism visitors in the Jiuzhai Valley scenic area. The study shows that keywords selected using HE-TDC method produce a model with better robustness and predictive ability. 展开更多
关键词 Tourism visitor volume prediction web-search data HE-TDC method Jiuzhai Valley time series Hurst exponent
原文传递
一个基于现实世界的大型Web参照数据集——UK2006 Datasets的初步研究
3
作者 曾刚 李宏 《企业技术开发》 2009年第5期16-17,31,共3页
文章介绍了WEBSPAM-UK2006数据集,一个大型的基于现实世界的,人工评判过一些垃圾行为的web数据集合,详细的对数据集的构成进行了分析,对数据集采用Python进行了初步的预处理,为以后在反垃圾网页行为方面的算法和判定研究提供了非常有意... 文章介绍了WEBSPAM-UK2006数据集,一个大型的基于现实世界的,人工评判过一些垃圾行为的web数据集合,详细的对数据集的构成进行了分析,对数据集采用Python进行了初步的预处理,为以后在反垃圾网页行为方面的算法和判定研究提供了非常有意的经验和参考。 展开更多
关键词 搜索引擎作弊 web数据集 链接分析 web
下载PDF
基于网络搜索数据的GDP组合预测研究
4
作者 王书平 卢子晗 冀承秀 《黑龙江科学》 2024年第8期44-48,共5页
网络搜索数据(Web Search Data, WSD)是研究宏观经济现象的重要微观信息依据。从需求、供给与政策环境等方面选取和筛选关键词来合成网络搜索指数,采用金枪鱼群(Tuna Swarm Optimization, TSO)算法优化的最小二乘支持向量回归(Least Squ... 网络搜索数据(Web Search Data, WSD)是研究宏观经济现象的重要微观信息依据。从需求、供给与政策环境等方面选取和筛选关键词来合成网络搜索指数,采用金枪鱼群(Tuna Swarm Optimization, TSO)算法优化的最小二乘支持向量回归(Least Squares Support Vector Regression, LSSVR)模型,对GDP进行预测。结果表明,网络搜索指数与GDP具有强相关性,合成的网络搜索指数能较好地反映GDP的波动走势;网络搜索数据的加入使得预测结果呈现出强时效性,预测效果及预测精度都取决于对最优模型的选择,引入参数智能优化算法可提高模型的预测性能。提出的TSO-LSSVR&WSD模型充分利用网络搜索数据及组合预测优势,提高了GDP的预测精度和时效性,可应用于宏观经济指标预测中。 展开更多
关键词 GDP预测 组合预测 网络搜索数据 金枪鱼群算法 LSSVR模型
下载PDF
Web挖掘技术在搜索引擎中的应用 被引量:15
5
作者 王涛 孙河山 《情报理论与实践》 CSSCI 北大核心 2002年第4期296-299,共4页
As a new knowledge mining means,Web mining provides a new solution for the utilization of Web information resources This article describes the application of Web mining technologies in search engines,and discusses how... As a new knowledge mining means,Web mining provides a new solution for the utilization of Web information resources This article describes the application of Web mining technologies in search engines,and discusses how to mine the latest technologies for search engines so as to improve their retrieving 展开更多
关键词 网络资源 开发利用 web内容挖掘 web结构挖掘 web行为挖掘 web挖掘技术发 搜索引擎
下载PDF
基于Web服务的异构数据源统一检索研究 被引量:8
6
作者 吴泽彬 魏洁 +1 位作者 李蔚清 吴慧中 《计算机集成制造系统》 EI CSCD 北大核心 2007年第7期1444-1450,共7页
为使统一检索能够适应当前Internet和异构数据源的不断发展,基于目前流行的Web服务技术,设计了一个异构数据源统一检索框架,并针对检索服务分发和结果融合提出了检索服务统一模型、记录统一模型,以及相应的结果融合算法。结合可扩展标... 为使统一检索能够适应当前Internet和异构数据源的不断发展,基于目前流行的Web服务技术,设计了一个异构数据源统一检索框架,并针对检索服务分发和结果融合提出了检索服务统一模型、记录统一模型,以及相应的结果融合算法。结合可扩展标记语言,统一各数据源检索返回的异构数据记录,利用Web服务机制的完好封装性、规范性、松散耦合、高度集成能力等特点,实现异构数据源检索接口的透明集成。基于Web服务的异构数据源统一检索系统实现简单,时空性能好,可扩展性强,能兼顾各数据源的特点实现全局优化。 展开更多
关键词 web服务 异构 数据源 检索 结果融合
下载PDF
Web数据管理研究进展 被引量:2
7
作者 王晖 彭智勇 +2 位作者 李蓉蓉 徐波 翟卫祥 《小型微型计算机系统》 CSCD 北大核心 2011年第1期1-8,共8页
Web数据管理是研究如何根据动态的用户需求从动态的数据源中获取和管理Web数据.本文综述了近10年来该领域的相关文献,针对Web数据管理所必需的数据获取、数据管理和数据服务三大功能,对元搜索技术、数据空间以及跨媒体技术的研究现状和... Web数据管理是研究如何根据动态的用户需求从动态的数据源中获取和管理Web数据.本文综述了近10年来该领域的相关文献,针对Web数据管理所必需的数据获取、数据管理和数据服务三大功能,对元搜索技术、数据空间以及跨媒体技术的研究现状和研究成果进行了总结和分析.最后,讨论Web数据管理系统中存在的问题,从数据质量、系统一致性维护以及个性化服务三个方面对未来研究进行了展望. 展开更多
关键词 web数据管理 元搜索 数据空间 跨媒体
下载PDF
含有丰富结构化数据的Web页面分类技术的研究 被引量:5
8
作者 赵志滨 贾岩峰 +1 位作者 姚兰 鲍玉斌 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期53-60,共8页
Web页面的主题识别和分类是垂直搜索引擎的核心,是结构化数据抽取的前提,具有重要的学术价值,工程应用也非常广泛.以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分... Web页面的主题识别和分类是垂直搜索引擎的核心,是结构化数据抽取的前提,具有重要的学术价值,工程应用也非常广泛.以往的工作多以定向爬虫技术来解决垂直搜索引擎数据采集的专业化问题,而Web页面的主题识别和分类也多采用传统的文本分类方法.针对含有丰富结构化数据的Web页面,提出了复用结构化数据抽取模板来进行Web页面主题识别的分类框架.该框架首先解析Web页面的组织结构,通过属性探测算法,获得Web页面所包含的主题关键词.进一步通过计算主题关键词与结构化抽取模板的相似性来判定Web页面的主题并按照领域进行分类.该方法避免了主题爬虫对URL格式严重依赖的问题,分类准确率也高于传统的文本分类方法.通过实验证明了框架在含有丰富结构化数据的Web页面分类方面的有效性. 展开更多
关键词 垂直搜索 结构化数据 网页分类 模板 相似性计算
下载PDF
针对小文本的Web数据挖掘技术及其应用 被引量:10
9
作者 彭曙蓉 王耀南 《微计算机信息》 北大核心 2006年第07X期203-205,共3页
现有搜索引擎技术返回给用户的信息太多太杂,为此提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,该技术根据用户的兴趣程度形成词汇库,利用模糊聚类方法获得分词词典组,采用MD5算法去除重复页面,采用近似网页聚类算... 现有搜索引擎技术返回给用户的信息太多太杂,为此提出一种针对小文本的基于近似网页聚类算法的Web文本数据挖掘技术,该技术根据用户的兴趣程度形成词汇库,利用模糊聚类方法获得分词词典组,采用MD5算法去除重复页面,采用近似网页聚类算法对剩余页面聚类,并用马尔可夫Web序列挖掘算法对聚类结果排序,从而提供用户感兴趣的网页簇序列,使用户可以迅速找到感兴趣的页面。实验证明该算法在保证查全率和查准率的基础上大大提高了搜索效率。由于是针对小文本的数据挖掘,所研究的算法时间和空间复杂度都不高,因此有望成为一种实用、有效的信息检索技术。 展开更多
关键词 智能搜索 web数据挖掘 小文本 用户兴趣
下载PDF
Web信息检索服务系统与搜索引擎 被引量:11
10
作者 常桂然 张晓辉 《计算机科学》 CSCD 北大核心 1998年第5期86-90,共5页
引言由于WWW的信息量在不断地增加,而且不断地动态更新,人们研制了许多web索引与检索服务系统以帮助用户查找信息。按照信息收集和索引的方式,大体上可将Web索引与检索服务系统分为三类。第一种是将手工收集到的信息编成HTML文件,按某... 引言由于WWW的信息量在不断地增加,而且不断地动态更新,人们研制了许多web索引与检索服务系统以帮助用户查找信息。按照信息收集和索引的方式,大体上可将Web索引与检索服务系统分为三类。第一种是将手工收集到的信息编成HTML文件,按某种次序排列组织,使用户可以通过索引进行查阅。 展开更多
关键词 信息检索系统 web 搜索引擎
下载PDF
基于REST Web Services的分布式遥感数据检索技术研究 被引量:11
11
作者 陈赟 胡坚 +1 位作者 汪超亮 李子扬 《计算机工程与设计》 CSCD 北大核心 2010年第14期3207-3209,3213,共4页
为了更好地解决分布式遥感数据检索的问题,提出了基于REST Web Services的分布式检索实现方法。根据分布式数据检索的需求和遥感数据检索系统的特点,研究了分布式数据检索的实现技术、REST的基本概念、目标与设计原则、主要思想以及实... 为了更好地解决分布式遥感数据检索的问题,提出了基于REST Web Services的分布式检索实现方法。根据分布式数据检索的需求和遥感数据检索系统的特点,研究了分布式数据检索的实现技术、REST的基本概念、目标与设计原则、主要思想以及实现方式,在此基本上设计了基于REST Web Services分布式遥感数据检索原型系统,并实现了基于REST Web Services分布式遥感数据检索原型系统。 展开更多
关键词 分布式检索 简单对象访问协议 表述性状态转移 网络服务 可扩展标记语言 遥感数据
下载PDF
基于数据融合的Web元搜索模型比较研究 被引量:2
12
作者 丁一 杨朋英 《计算机仿真》 CSCD 2007年第4期120-123,共4页
没有一个搜索引擎系统在任何情况下所表现出来的性能都比其他的搜索引擎要好,因此研究元搜索引擎是必要的。文中提出了三种元搜索中的传统数据融合方法:基于线性组合的相似度融合、基于排序的Unbiased和Biased-Bayes融合。其中相似度融... 没有一个搜索引擎系统在任何情况下所表现出来的性能都比其他的搜索引擎要好,因此研究元搜索引擎是必要的。文中提出了三种元搜索中的传统数据融合方法:基于线性组合的相似度融合、基于排序的Unbiased和Biased-Bayes融合。其中相似度融合通过分析部分Web文档的内容来产生线性组合的参数,Unbiased则将各搜索引擎的结果表均衡地融合在一起,Biased-Bayes则利用了ODP的分类服务和Bayes概率模型来计算文档的相关度。通过实验证明它们是行之有效的融合方法,比较传统的方法的性能有一定提高,在效率上比纯粹分析所有文档的内容来进行融合的方法更好。 展开更多
关键词 网上数据挖掘 网页搜索 信息检索 数据融合
下载PDF
WEB信息检索与WEB数据挖掘 被引量:13
13
作者 刘振岩 王万森 陈立平 《微机发展》 2003年第7期66-68,100,共4页
首先分析了WEB信息检索的现状,主要针对WEB信息检索的局限性,引出WEB数据挖掘,并对WEB数据挖掘技术作了概要的介绍。然后,讨论了WEB数据挖掘与WEB信息检索之间的关系,最后阐述了如何将WEB数据挖掘的研究成果应用到WEB信息检索领域中,从... 首先分析了WEB信息检索的现状,主要针对WEB信息检索的局限性,引出WEB数据挖掘,并对WEB数据挖掘技术作了概要的介绍。然后,讨论了WEB数据挖掘与WEB信息检索之间的关系,最后阐述了如何将WEB数据挖掘的研究成果应用到WEB信息检索领域中,从而提高WEB信息检索的效率和质量。 展开更多
关键词 web 信息检索 数据挖掘 网站 INTERNET 搜索引擎 智能搜索
下载PDF
一个基于关联规则的Web信息检索模型 被引量:5
14
作者 关戍 庄成三 陈定涛 《计算机应用》 CSCD 北大核心 2003年第3期88-90,共3页
针对Web信息检索系统在大数据量下的数据存储、数据调度与工作的效率问题 ,分析了数据挖掘在Internet信息检索中的运用 ,提出了一个基于关联规则的Web信息检索模型 ,并以逻辑层次、服务域与数据路由为中心 ,给出了这个模型的结构、算法... 针对Web信息检索系统在大数据量下的数据存储、数据调度与工作的效率问题 ,分析了数据挖掘在Internet信息检索中的运用 ,提出了一个基于关联规则的Web信息检索模型 ,并以逻辑层次、服务域与数据路由为中心 ,给出了这个模型的结构、算法与设计思想。 展开更多
关键词 关联规则 web 信息检索模型 INTERNET 数据调度 负属性
下载PDF
基于Web目录服务的地学传感器观测服务注册和搜索 被引量:7
15
作者 陈能成 狄黎平 +1 位作者 龚健雅 郑重 《遥感学报》 EI CSCD 北大核心 2008年第3期411-419,共9页
在分布式异构网络环境下,如何根据时间、空间和尺度等因子发现地学传感器和聚集传感器观测数据已成为自适应地球观测和空间信息服务中需要解决的问题。本文提出集成OGC的目录服务和传感器观测服务的地学传感器数据的访问方法和体系架构... 在分布式异构网络环境下,如何根据时间、空间和尺度等因子发现地学传感器和聚集传感器观测数据已成为自适应地球观测和空间信息服务中需要解决的问题。本文提出集成OGC的目录服务和传感器观测服务的地学传感器数据的访问方法和体系架构,包含分布式地学观测服务、基于ebRIM的目录服务、SOS注册与搜索服务中间件和地学传感器门户4个部件;深入探讨了观测数据注册的流程、观测能力注册的更新、目录服务中海量历史观测数据的管理和可视化搜索等实现技术;最后,基于传感器观测服务和目录服务标准,设计和实现了服务注册原型,并用EO-1的高光谱观测数据验证了服务原型的可行性,能够有效解决传感器观测服务、观测能力和观测结果的注册、管理和搜索。 展开更多
关键词 SENSOR web 地球观测 传感器观测服务 web目录服务 时空搜索 数据挖掘
下载PDF
基于Web搜索的数据挖掘系统的研究与实现 被引量:2
16
作者 查志琴 高波 《常州工学院学报》 2011年第1期36-41,共6页
利用搜索技术从Internet上搜索到大量的数据,如Web网站、网页等信息,对这些数据的处理是一个非常复杂的过程,通常可以使用数据挖掘的方法,提取其中有用的数据和知识。本课题对Web数据搜索与挖掘进行了研究,开发了一套从Internet上搜索数... 利用搜索技术从Internet上搜索到大量的数据,如Web网站、网页等信息,对这些数据的处理是一个非常复杂的过程,通常可以使用数据挖掘的方法,提取其中有用的数据和知识。本课题对Web数据搜索与挖掘进行了研究,开发了一套从Internet上搜索数据,并对这些数据进行初步挖掘,生成有效数据的搜索系统。 展开更多
关键词 web搜索 数据挖掘 搜索引擎
下载PDF
图书馆声像信息资源的Web检索与播放 被引量:3
17
作者 孟珊 张焱 黄闽 《图书馆论坛》 CSSCI 北大核心 2002年第4期67-68,共2页
文章提出了要实现声像信息资源在网络上的快速检索与播放 ,所应具备的四个基本要素以及实现的具体方法 。
关键词 图书馆 web 检索 播放 声像信息资源 元数据 对象数据 搜索平台
下载PDF
Web数据挖掘与个性化搜索引擎综述 被引量:5
18
作者 邹芳红 《计算机与现代化》 2007年第8期44-47,共4页
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域。本文论述了Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍了个性化搜索引擎的一些情况,最后论述了Web数据挖掘在个性化搜索引擎... Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域。本文论述了Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍了个性化搜索引擎的一些情况,最后论述了Web数据挖掘在个性化搜索引擎中的应用。 展开更多
关键词 web数据挖掘 个性化 搜索引擎
下载PDF
基于Web数据挖掘的个性化搜索引擎研究综述 被引量:6
19
作者 付晓翠 许盈 《现代计算机》 2008年第3期141-144,共4页
Web数据挖掘是将数据挖掘技术和理论应用于对WWW资源进行挖掘的一个新兴的研究领域。论述Web数据挖掘的发展现状、发展趋势以及将来可能的研究方向,并简单介绍个性化搜索引擎的一些情况,论述Web数据挖掘在个性化搜索引擎中的应用。
关键词 web数据挖掘 个性化 搜索引擎
下载PDF
智能搜索引擎如何应用WEB信息挖掘技术 被引量:6
20
作者 吴江 《图书馆论坛》 CSSCI 北大核心 2004年第5期107-110,共4页
介绍网络信息挖掘技术定义、关键技术 ,以Google为例 ,剖析网络信息挖掘技术在搜索引擎的应用。
关键词 智能搜索引擎 web信息挖掘 网络挖掘技术 知识库 目标样本 个性化服务
下载PDF
上一页 1 2 7 下一页 到第
使用帮助 返回顶部