期刊文献+
共找到198篇文章
< 1 2 10 >
每页显示 20 50 100
基于大数据搜索引擎的地震信息管理系统的研究与实现
1
作者 黄博兵 黄猛 +1 位作者 赵长开 张元旺 《现代信息科技》 2024年第9期68-72,共5页
近年来,由于国家对测震工作的重视,中国地震行业取得了较迅速的增长,但地震装备信息方面由于国家防震减灾机关的装备信息工作还比较落后,信息化和精细化管理程度不高,对本部门装备的状况、数量等信息还没有科学合理的统计分析方式和办法... 近年来,由于国家对测震工作的重视,中国地震行业取得了较迅速的增长,但地震装备信息方面由于国家防震减灾机关的装备信息工作还比较落后,信息化和精细化管理程度不高,对本部门装备的状况、数量等信息还没有科学合理的统计分析方式和办法,从而导致了大批优秀地震装备信息资料的浪费。根据分析与管理地震信息数据资料的现状,文章针对防震减灾部门对地震信息管理的实际需求,基于ElasticSearch具有分布式多用户的全文搜索引擎和分布式实时文件存储的优点设计并实现了基于ElasticSearch大数据搜索引擎的地震信息资源管理系统,以方便对地震设备进行高效管理并对地震信息资源进行信息化的建设工作。 展开更多
关键词 大数据搜索引擎 数据库 Elasticsearch 数据管理
下载PDF
多层次矿床本体的构建及在知识图谱中的应用
2
作者 张前龙 周永章 +3 位作者 虞鹏鹏 王汉雨 韩枫 贺炬翔 《矿物岩石地球化学通报》 CAS CSCD 北大核心 2024年第1期211-217,共7页
将具有多元异构性和复杂语义的矿床数据转化为结构化数据,是目前矿产资源勘查大数据领域面临的关键问题。传统的机器学习方法无法精确描述实体概念、属性及其属性值的语义信息,导致多源异构数据的可解释性较差。因此,可解释性的知识图... 将具有多元异构性和复杂语义的矿床数据转化为结构化数据,是目前矿产资源勘查大数据领域面临的关键问题。传统的机器学习方法无法精确描述实体概念、属性及其属性值的语义信息,导致多源异构数据的可解释性较差。因此,可解释性的知识图谱已成为当前研究的热点。然而,当前矿床领域本体构建研究仍相对匮乏,这阻碍了矿床知识图谱的研究。本文聚焦于矿床领域的概念、关系、属性描述,结合知识工程、叙词表、复用前人本体及专家知识,采用基于知识工程和基于顶层本体相结合的本体构建方法,使用本体开发工具Protégé构建了以时空矿床文本为基础的矿床领域本体库,实现了矿床知识概念、关系的系统化、规范化、形式化表达。然后运用Neo4j构建本体库知识图谱,并以庞西垌多金属矿床为案例,将矿床本体与矿床数据进行了知识图谱连接,展示了矿床本体作为知识图谱骨架的重要性。本文研究对下一步矿床知识图谱推理分析具有一定的指导意义。 展开更多
关键词 领域本体 矿床 知识图谱 矿床本体 可视化 智能找矿 地质大数据
下载PDF
基于均衡聚类索引的近似最近邻检索方法
3
作者 吕宏伟 李博 +3 位作者 刘普凡 刘识 李继伟 刘俊健 《南京师大学报(自然科学版)》 CAS 北大核心 2024年第2期99-108,共10页
大数据时代,深度学习通过将复杂对象表示为高维特征向量,并使用向量之间的距离度量来衡量样本的相似性,在推荐系统、用户画像、数据中台管理等场景中得到了广泛的应用.但是,随着数据规模的不断增加,海量特征数据的相似向量检索面临着检... 大数据时代,深度学习通过将复杂对象表示为高维特征向量,并使用向量之间的距离度量来衡量样本的相似性,在推荐系统、用户画像、数据中台管理等场景中得到了广泛的应用.但是,随着数据规模的不断增加,海量特征数据的相似向量检索面临着检索模型占用内容大、特征检索算法召回率较低的严重挑战.如何在保证检索精度的前提下,设计紧凑型索引图结构,降低特征检索的内存消耗,对于提升大数据系统的近邻检索效率具有重要的作用.因此,本文提出了一种均衡感知的快速K均值近邻聚类的特征数据分桶及其图结构紧凑型索引用于海量数据近邻检索.首先,设计了均衡感知的快速K-均值聚类算法,通过在图索引构建过程中海量特征数据的均衡分桶,将高维向量压缩成轻量级紧凑型图索引结构,随后通过量化操作进一步压缩高维向量样本,提升其在候选集上的最近邻检索速度.在基准数据集上实验验证结果表明,本文提出的方法能够在保证较高检测召回率的同时,有效加快索引构建速度,可以用于支持高维特征数据的高效最近邻检索. 展开更多
关键词 大数据检索与分析 最近邻搜索 均衡感知
下载PDF
基于ElasticSearch的分布式全文搜索系统 被引量:24
4
作者 王伟 魏乐 +1 位作者 刘文清 舒红平 《电子科技》 2018年第8期56-59,65,共5页
为了提高海量、复杂数据的访问效率,文中在分析ElasticSearch搜索引擎框架的基础上,设计和实现一种基于ElasticSearch的分布式全文搜索系统。系统主要包括数据接入、数据索引和全文搜索3个模块,其中数据接入模块将数据从数据源同步或迁... 为了提高海量、复杂数据的访问效率,文中在分析ElasticSearch搜索引擎框架的基础上,设计和实现一种基于ElasticSearch的分布式全文搜索系统。系统主要包括数据接入、数据索引和全文搜索3个模块,其中数据接入模块将数据从数据源同步或迁移到系统中,数据索引模块对数据建立对应的倒排索引表,全文搜索模块以J2EE技术实现系统功能。重点分析了倒排索引的性能模型,根据测试,系统具备高稳定性、高访问效率、高容错性、高可扩展性等优点,为提高全文搜索系统的性能提供了参考。 展开更多
关键词 Elasticsearch 分布式搜索 倒排索引 大数据 海量存储
下载PDF
基于ElasticSearch全文检索的农业地理信息大数据平台设计与实现 被引量:3
5
作者 刘吉 孙俊英 +1 位作者 陈忠超 蔡忠亮 《测绘与空间地理信息》 2021年第6期162-164,共3页
针对目前农业大数据平台地理要素纳入不足、研究尺度受限、搜索功能相对薄弱等问题,本文充分发挥了测绘部门自然地理要素数据精细、农业遥感监测数据精准、野外全景采样数据完整的优势,基于ElasticSearch搜索引擎,利用网络技术、电子地... 针对目前农业大数据平台地理要素纳入不足、研究尺度受限、搜索功能相对薄弱等问题,本文充分发挥了测绘部门自然地理要素数据精细、农业遥感监测数据精准、野外全景采样数据完整的优势,基于ElasticSearch搜索引擎,利用网络技术、电子地图技术与空间数据库技术设计并实现了全文检索的农业地理信息大数据平台,多角度、多维度、多层次精确地展示数据信息内容,为农业大数据的规律寻找、价值挖掘与有效利用提供了有力支撑。 展开更多
关键词 农业大数据 地理信息平台 Elasticsearch 全文检索
下载PDF
基于Elasticsearch的大数据搜索引擎在电力企业的应用研究 被引量:3
6
作者 杨丽萍 张希翔 +1 位作者 孟椿智 谢瑞浩 《数字技术与应用》 2017年第12期63-63,65,共2页
电力企业是信息化应用的重要领域,引入了变电站告警系统、电力设备运维系统、电力收费缴费系统等,这些信息系统运行积累了海量的数据,常规的检索和处理模式速度慢,已经无法适应大数据时代操作需求,因此为了解决这个问题,本文在电力企业... 电力企业是信息化应用的重要领域,引入了变电站告警系统、电力设备运维系统、电力收费缴费系统等,这些信息系统运行积累了海量的数据,常规的检索和处理模式速度慢,已经无法适应大数据时代操作需求,因此为了解决这个问题,本文在电力企业大数据搜索引擎设计时引入了Elasticsearch技术,实现了电力大数据快速检索、数据索引、全文搜索,提高了电力大数据的应用成效,具有重要的作用和意义。 展开更多
关键词 Elasticsearch 大数据 搜索引擎 电力企业 快速检索
下载PDF
基于大数据技术的无线传感网络异常节点深度挖掘方法
7
作者 曾霞 宋一鸣 康利娟 《信息与电脑》 2024年第5期178-180,共3页
由于无线传感网络节点分布不规则,难以有效控制对异常节点的定位误差,为此提出基于大数据技术的无线传感网络异常节点深度挖掘方法。在节点均分布在目标区域范围内的前提下,构建无线传感网络组网模型,设置异常节点与网络中心节点之间的... 由于无线传感网络节点分布不规则,难以有效控制对异常节点的定位误差,为此提出基于大数据技术的无线传感网络异常节点深度挖掘方法。在节点均分布在目标区域范围内的前提下,构建无线传感网络组网模型,设置异常节点与网络中心节点之间的关系函数,之后采用大数据技术中的邻域搜索算法,对具体的网络异常节点位置进行深度挖掘定位。实验结果显示,基于大数据技术的无线传感网络异常节点深度挖掘方法在不同噪声状态下的异常节点定位误差始终稳定在2.0以内。 展开更多
关键词 大数据技术 无线传感网络 异常节点 深度挖掘 邻域搜索算法
下载PDF
Parallel Multiple Tabu Search for Multiobjective Urban Transit Scheduling Problem
8
作者 Vikneswary Uvaraja Lai Soon Lee +1 位作者 Nor Aliza Abd Rahmin Hsin Vonn Seow 《Journal of Computer and Communications》 2020年第5期14-54,共41页
Urban Transit Scheduling Problem (UTSP) is concerned with determining reliable transit schedules for buses and drivers by considering the preferences of both passengers and operators based on the demand and the set of... Urban Transit Scheduling Problem (UTSP) is concerned with determining reliable transit schedules for buses and drivers by considering the preferences of both passengers and operators based on the demand and the set of transit routes. This paper considered a UTSP which consisted of frequency setting, timetabling, and simultaneous bus and driver scheduling. A mixed integer multiobjective model was constructed to optimize the frequency of the routes by minimizing the number of buses, passenger’s waiting times and overcrowding. The model was further extended by incorporating timeslots in determining the frequencies during peak and off-peak hours throughout the time period. The timetabling problem studied two different scenarios which reflected the preferences of passengers and operators to assign the bus departure times at the first and last stop of a route. A set covering model was then adopted to minimize the number of buses and drivers simultaneously. A parallel tabu search algorithm was proposed to solve the problem by modifying the initialization process and incorporating intensification and diversification approaches to guide the search effectively from the different feasible domain in finding optimal solutions with lesser computational effort. Computational experiments were conducted on the well-known Mandl’s and Mumford’s benchmark networks to assess the effectiveness of the proposed algorithm. Competitive results are reported based on the performance metrics, as compared to other algorithms from the literature. 展开更多
关键词 Urban TRANSIT Scheduling MULTIPLE Tabu search PARALLEL Frequency SETTING TIMETABLING big Data
下载PDF
疫情中基于网络搜索大数据的心理健康研究综述 被引量:1
9
作者 徐之韵 刘子源 王燕 《心理技术与应用》 2023年第11期673-684,共12页
新冠疫情给公众心理健康带来了极大挑战,疫情中的心理健康测量显得尤为重要。网络搜索数据作为大数据的一种,近年来已被应用于心理学研究。目前基于网络搜索数据的疫情心理健康研究可归纳为三类:跨时间比较研究、疫情与心理健康的相关... 新冠疫情给公众心理健康带来了极大挑战,疫情中的心理健康测量显得尤为重要。网络搜索数据作为大数据的一种,近年来已被应用于心理学研究。目前基于网络搜索数据的疫情心理健康研究可归纳为三类:跨时间比较研究、疫情与心理健康的相关研究以及网络搜索数据有效性的验证性研究,其中一部分研究也涉及空间维度的比较。上述研究之间存在矛盾之处。网络搜索数据具有客观、生态效度高、时间分辨率高、体现用户心理动机和易得等优势。未来的网络搜索研究应充分发挥优势,提高信效度,加强对其背后机制的探讨。 展开更多
关键词 大数据 网络搜索 谷歌趋势 心理健康 新冠疫情
下载PDF
基于大数据技术架构的免疫规划信息系统设计与应用 被引量:1
10
作者 唐蓉 张华东 +2 位作者 王东 吴蕾蕾 汤来红 《中国卫生信息管理杂志》 2023年第4期581-586,共6页
目的为支撑疫苗接种工作,设计基于大数据技术架构的免疫规划信息系统,大幅提升系统高并发状态下的承载能力。方法基于大数据技术架构设计系统的硬件部署、软件功能及业务流程,对各个环节实时查看、分析和统计。结果该系统高效支撑了全... 目的为支撑疫苗接种工作,设计基于大数据技术架构的免疫规划信息系统,大幅提升系统高并发状态下的承载能力。方法基于大数据技术架构设计系统的硬件部署、软件功能及业务流程,对各个环节实时查看、分析和统计。结果该系统高效支撑了全市疫苗接种工作,实现了对疫苗接种全流程信息采集、疫苗管理全程追溯、实时查询统计分析、数据共享交换等功能。结论大数据技术在疫苗接种工作中的成功应用,对于高并发信息系统建设具有借鉴意义。 展开更多
关键词 HADOOP 大数据 免疫规划 Elastic search 疫苗接种
下载PDF
基于FOA的无人机协同态势感知搜寻模型构建及应用
11
作者 马申佳 木子尧 +3 位作者 曹新益 程煜峰 兰盾 安磊 《网络安全与数据治理》 2023年第S01期137-142,共6页
无人机协同态势感知搜寻任务规划问题是当前无人机应用研究领域的关注重点。基于现实无人机搜寻任务统计的大数据概率搜寻热图,概括总结出区域定点搜寻、大范围机动搜寻和机动避让搜寻3类搜寻目标机动模式,采取大数据增量计算3类情形下... 无人机协同态势感知搜寻任务规划问题是当前无人机应用研究领域的关注重点。基于现实无人机搜寻任务统计的大数据概率搜寻热图,概括总结出区域定点搜寻、大范围机动搜寻和机动避让搜寻3类搜寻目标机动模式,采取大数据增量计算3类情形下的无人机协同搜索识别概率,基于果蝇优化算法对应构建了“效率优先”“中心辐散”和“向心辐合”搜索策略的无人机协同态势感知FOA搜寻模型,得到无人机协同搜索到搜寻机动目标的最高概率分别为66.82%、86.72%和81.48%,并利用博弈论思想对无人机协同搜索策略和搜寻机动目标对抗避让策略进行了辨析。该模型具有较强适应性,为无人机协同态势感知搜寻任务规划问题提供了一定技术支撑。 展开更多
关键词 无人机协同搜索 大数据搜寻概率热图 果蝇优化算法 对抗策略博弈
下载PDF
面向多源异构丝路文化遗产数据的智能挖掘方法 被引量:1
12
作者 杨寒淋 周娅鹃 +5 位作者 赵丰 徐蓉 安薇竹 翁正秋 宁灵舰 金宇 《丝绸》 CAS CSCD 北大核心 2023年第1期9-15,共7页
为了进一步弘扬丝路文化遗产价值,有必要对丝路文化遗产数据进行深入分析与探究。然而,目前丝路文化遗产数据呈现多源异构的特性,包括不同来源的数据和不同模态的数据,导致了对多维度海量数据进行深层次的处理较为困难。文章首先通过对... 为了进一步弘扬丝路文化遗产价值,有必要对丝路文化遗产数据进行深入分析与探究。然而,目前丝路文化遗产数据呈现多源异构的特性,包括不同来源的数据和不同模态的数据,导致了对多维度海量数据进行深层次的处理较为困难。文章首先通过对互联网数据的垂直搜索,高效采集丝绸之路相关信息;接着利用支持向量机自动快速、精确地完成文本分类工作;然后利用文本聚类技术对数据信息进行去重、去噪等清洗作业;最后,评选出影响力较大的事件,形成《丝绸之路文化遗产年报》对全球公开发布。文章为丝路文化遗产数据的分析与挖掘提供了经验与借鉴。 展开更多
关键词 丝绸之路 文化遗产 多源异构 数据垂直搜索 支持向量机 文本聚类 大数据分析
下载PDF
基于大数据的道路视频监控系统框架分析
13
作者 张天保 陈力 +1 位作者 高华云 孙琪 《黑龙江交通科技》 2023年第3期146-148,共3页
随着国家安全和公共安全对智能监控系统的需求的增加,可用的视频数据量呈指数增加。为了及时检索最重要的信息,图像索引是非常必要的。本研究以实时存储的大数据为基础,提出了一种新的视频监控自动索引与检索框架。本框架在网关、用户... 随着国家安全和公共安全对智能监控系统的需求的增加,可用的视频数据量呈指数增加。为了及时检索最重要的信息,图像索引是非常必要的。本研究以实时存储的大数据为基础,提出了一种新的视频监控自动索引与检索框架。本框架在网关、用户之间进行查询传输时,采用了基于虚拟专用网双网的安全策略,在IP连通性上采用第二层隧道协议和第二层转发协议进行安全保护。 展开更多
关键词 监控系统 大数据 图像检索 隧道协议
下载PDF
网络信息资源分类检索方法的应用
14
作者 康丽丽 钱婧 《集成电路应用》 2023年第5期158-159,共2页
阐述基于大数据技术的网络信息资源分类检索方法,包括全文搜索引擎、目录搜索引擎、多元搜索引擎,智能化检索、移动式检索、实时性搜索,探讨分布式全文搜索引擎的架构。
关键词 大数据技术 网络信息检索 搜索引擎架构
下载PDF
基于全网综艺的播后数据反馈系统
15
作者 鲜沁雨 《电视技术》 2023年第9期204-207,211,共5页
当前,综艺传播呈现多屏化、多样化的发展趋势,仅依靠大屏端收视率数据,不能全面地展示综艺传播情况。为此,基于播后数据反馈系统,针对大数据采集、数据处理及分析、各视频平台全网正片播放数据、互动指数、热搜情况、二次传播等多维度数... 当前,综艺传播呈现多屏化、多样化的发展趋势,仅依靠大屏端收视率数据,不能全面地展示综艺传播情况。为此,基于播后数据反馈系统,针对大数据采集、数据处理及分析、各视频平台全网正片播放数据、互动指数、热搜情况、二次传播等多维度数据,分析全媒体时代下综艺节目播后数据系统建设方案,以浙江卫视综艺节目为主要应用对象,探究系统如何为节目的传播效果提供有效的反馈和评估。 展开更多
关键词 大数据采集 数据处理 热搜榜单 传播反馈
下载PDF
智慧搜索中的实体与关联关系建模与挖掘 被引量:13
16
作者 王晓阳 郑骁庆 肖仰华 《通信学报》 EI CSCD 北大核心 2015年第12期17-27,共11页
随着网络搜索空间从互联网扩展到人、机、物互联的泛在网络空间,以及大数据时代的到来,传统的搜索引擎已经不能满足时代的需求,新时代的搜索引擎技术——大搜索(或称智慧搜索)概念应运而生。因此,讨论实现大搜索所需关键技术之一的实体... 随着网络搜索空间从互联网扩展到人、机、物互联的泛在网络空间,以及大数据时代的到来,传统的搜索引擎已经不能满足时代的需求,新时代的搜索引擎技术——大搜索(或称智慧搜索)概念应运而生。因此,讨论实现大搜索所需关键技术之一的实体与关联关系建模与挖掘,以及相关的设计思想和实现技术。 展开更多
关键词 大搜索 实体与关系建模 知识图谱 知识仓库
下载PDF
网络空间大搜索研究范畴与发展趋势 被引量:6
17
作者 方滨兴 贾焰 +1 位作者 李爱平 殷丽华 《通信学报》 EI CSCD 北大核心 2015年第12期1-8,共8页
随着网络空间的拓展、网络应用模式的发展及大数据时代的到来,面向网络空间的下一代搜索引擎——"大搜索"已具有迫切的需求。阐述了网络空间大搜索的内涵及其特点,提出了大搜索的研究范畴,包括泛在网络空间信息获取与发掘、... 随着网络空间的拓展、网络应用模式的发展及大数据时代的到来,面向网络空间的下一代搜索引擎——"大搜索"已具有迫切的需求。阐述了网络空间大搜索的内涵及其特点,提出了大搜索的研究范畴,包括泛在网络空间信息获取与发掘、知识仓库构建和管理、用户搜索意图准确理解与表示、用户意图高效匹配和推演、大搜索安全可信与隐私保护等方面的内容,并针对上述问题,指出了具有5S特性的网络空间大搜索技术的发展趋势。 展开更多
关键词 网络空间大搜索 意图理解 意图匹配 智慧解答
下载PDF
社交网络智慧搜索研究进展与发展趋势 被引量:5
18
作者 贾焰 甘亮 +1 位作者 李爱平 徐菁 《通信学报》 EI CSCD 北大核心 2015年第12期9-16,共8页
在以社交网络为代表的Web 2.0时代,搜索需求已经远超出Web 1.0搜索引擎的能力范畴,数据具有模式多态、快速产生、动态交互、碎片化、变化演绎等特点,这些新特点给搜索引擎技术带来了革命性和颠覆性的挑战。归纳了在线社交网络智慧搜索... 在以社交网络为代表的Web 2.0时代,搜索需求已经远超出Web 1.0搜索引擎的能力范畴,数据具有模式多态、快速产生、动态交互、碎片化、变化演绎等特点,这些新特点给搜索引擎技术带来了革命性和颠覆性的挑战。归纳了在线社交网络智慧搜索研究进展和技术要点,分析了研究发展过程将面临3个主要问题:在线社交网络中智慧与知识的发掘与推演、用户真实搜索意图的理解与表示以及满足用户真实意图的智慧解答在线响应,并以解决此3个问题为目标讨论了相关技术发展。 展开更多
关键词 社交网络 社交网络大搜索 意图理解 匹配求解 智慧解答
下载PDF
医疗大数据搜索系统的建设与应用 被引量:14
19
作者 郝梅 谢嵘 +2 位作者 王立 黄锋 王天兵 《医疗卫生装备》 CAS 2019年第2期43-46,59,共5页
目的:解决医疗数据多源异构、分布式、碎片化等问题,有效整合分散于医院各独立系统中的数据,更好地为临床科研服务。方法:采用Hadoop分布式的列式数据库、ElasticSearch搜索引擎、Spark集群并行计算框架、R语言等开源大数据技术,结合自... 目的:解决医疗数据多源异构、分布式、碎片化等问题,有效整合分散于医院各独立系统中的数据,更好地为临床科研服务。方法:采用Hadoop分布式的列式数据库、ElasticSearch搜索引擎、Spark集群并行计算框架、R语言等开源大数据技术,结合自然语言处理、机器学习等人工智能技术,依据临床科研需求,建立基于临床数据中心的医疗大数据搜索系统。结果:医疗大数据搜索系统已初具规模,该系统的建设解决了数据杂乱、分散的问题,提高了查询效率和利用率,实现了各系统数据的有效整合。在注重保护患者隐私的同时,支持用户对搜索内容的秒级呈现,可满足组合、多级条件查询及常规查询等需求,取得了良好的应用效果。结论:医疗大数据搜索系统在保障数据安全的前提下,为临床科研提供了便捷、有效的数据查询服务,进一步提高了临床科研数据查询效率及科研服务质量。 展开更多
关键词 医疗大数据搜索系统 临床数据中心 大数据技术 人工智能 数据查询服务 条件查询
下载PDF
大数据隐私保护密码技术研究综述 被引量:60
20
作者 黄刘生 田苗苗 黄河 《软件学报》 EI CSCD 北大核心 2015年第4期945-959,共15页
大数据是一种蕴含大量信息、具有极高价值的数据集合.为了避免大数据挖掘泄露用户的隐私,必须要对大数据进行必要的保护.由于大数据具有总量庞大、结构复杂、处理迅速等特点,传统的保护数据隐私的技术很多都不再适用.从密码学的角度,综... 大数据是一种蕴含大量信息、具有极高价值的数据集合.为了避免大数据挖掘泄露用户的隐私,必须要对大数据进行必要的保护.由于大数据具有总量庞大、结构复杂、处理迅速等特点,传统的保护数据隐私的技术很多都不再适用.从密码学的角度,综述了近年来提出的、适用于大数据的隐私保护技术的研究进展.针对大数据的存储、搜索和计算这3个重要方面,分别阐述了大数据隐私保护的研究背景和主要研究方向,并具体介绍了相关技术的最新研究进展.最后指出未来大数据隐私保护研究的一些重要方向. 展开更多
关键词 大数据 隐私 存储 搜索 计算
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部