期刊文献+
共找到347篇文章
< 1 2 18 >
每页显示 20 50 100
Large Language Model Based Semantic Parsing for Intelligent Database Query Engine
1
作者 Zhizhong Wu 《Journal of Computer and Communications》 2024年第10期1-13,共13页
With the rapid development of artificial intelligence, large language models (LLMs) have demonstrated remarkable capabilities in natural language understanding and generation. These models have great potential to enha... With the rapid development of artificial intelligence, large language models (LLMs) have demonstrated remarkable capabilities in natural language understanding and generation. These models have great potential to enhance database query systems, enabling more intuitive and semantic query mechanisms. Our model leverages LLM’s deep learning architecture to interpret and process natural language queries and translate them into accurate database queries. The system integrates an LLM-powered semantic parser that translates user input into structured queries that can be understood by the database management system. First, the user query is pre-processed, the text is normalized, and the ambiguity is removed. This is followed by semantic parsing, where the LLM interprets the pre-processed text and identifies key entities and relationships. This is followed by query generation, which converts the parsed information into a structured query format and tailors it to the target database schema. Finally, there is query execution and feedback, where the resulting query is executed on the database and the results are returned to the user. The system also provides feedback mechanisms to improve and optimize future query interpretations. By using advanced LLMs for model implementation and fine-tuning on diverse datasets, the experimental results show that the proposed method significantly improves the accuracy and usability of database queries, making data retrieval easy for users without specialized knowledge. 展开更多
关键词 Semantic Query large Language Models Intelligent database Natural Language Processing
下载PDF
CMA:an efficient index algorithmof clustering supporting fast retrieval oflarge image databases
2
作者 谢毓湘 栾悉道 +2 位作者 吴玲达 老松杨 谢伦国 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 2005年第3期709-714,共6页
To realize content-hased retrieval of large image databases, it is required to develop an efficient index and retrieval scheme. This paper proposes an index algorithm of clustering called CMA, which supports fast retr... To realize content-hased retrieval of large image databases, it is required to develop an efficient index and retrieval scheme. This paper proposes an index algorithm of clustering called CMA, which supports fast retrieval of large image databases. CMA takes advantages of k-means and self-adaptive algorithms. It is simple and works without any user interactions. There are two main stages in this algorithm. In the first stage, it classifies images in a database into several clusters, and automatically gets the necessary parameters for the next stage-k-means iteration. The CMA algorithm is tested on a large database of more than ten thousand images and compare it with k-means algorithm. Experimental results show that this algorithm is effective in both precision and retrieval time. 展开更多
关键词 large image database content-based retrieval K-means clustering self-adaptive clustering.
下载PDF
Outcomes of cardiac surgery in senior aged patients with ventricular dysfunction:analysis of a large national database
3
作者 Han-Wei TANG Kai CHEN +4 位作者 Jian-Feng HOU Xiao-Hong HUANG Sheng LIU Han-Ping MA Sheng-Shou HU 《Journal of Geriatric Cardiology》 SCIE CAS CSCD 2021年第1期1-9,共9页
OBJECTIVE In patients undergoing cardiac surgery,reduced preoperative ejection fraction(EF)and senior age are associated with a worse outcome.As most outcome data available for these patients are mainly from Western s... OBJECTIVE In patients undergoing cardiac surgery,reduced preoperative ejection fraction(EF)and senior age are associated with a worse outcome.As most outcome data available for these patients are mainly from Western surgical populations involving specific surgery types,our aim is to evaluate the real-world characteristics and perioperative outcomes of surgery in senior-aged heart failure patients with reduced EF across a broad range cardiac surgeries.METHODS Data were obtained from the China Heart Failure Surgery Registry(China-HFSR)database,a nationwide multicenter registry study in China's Mainland.Multiple variable regression analysis was performed in patients over 75 years old to identify risk factors associated with mortality.RESULTS From 2012 to 2017,578 senior-aged(>75 years)patients were enrolled in China HFSR,21.1%of whom were female.Isolated coronary bypass grafting(CABG)were performed in 71.6%of patients,10.1%of patients underwent isolated valve surgery and 8.7%received CABG combined with valve surgery.In-hospital mortality was 10.6%,and the major complication rate was 17.3%.Multivariate analysis identified diabetes mellitus(odds ratio(OR)=1.985),increased creatinine(OR=1.007),New York Heart Association(NYHA)Class III(OR=1.408),NYHA class IV(OR=1.955),cardiogenic shock(OR,6.271),and preoperative intra-aortic balloon pump insertion(OR=3.426)as independent predictors of in-hospital mortality.CONCLUSIONS In senior-aged patients,preoperative evaluation should be carefully performed,and strict management of reversible factors needs more attention.Senior-aged patients commonly have a more severe disease status combined with more frequent comorbidities,which may lead to a high risk in mortality. 展开更多
关键词 WESTERN analysis of a large national database Outcomes of cardiac surgery in senior aged patients with ventricular dysfunction
下载PDF
Fusion of Hash-Based Hard and Soft Biometrics for Enhancing Face Image Database Search and Retrieval
4
作者 Ameerah Abdullah Alshahrani Emad Sami Jaha Nahed Alowidi 《Computers, Materials & Continua》 SCIE EI 2023年第12期3489-3509,共21页
The utilization of digital picture search and retrieval has grown substantially in numerous fields for different purposes during the last decade,owing to the continuing advances in image processing and computer vision... The utilization of digital picture search and retrieval has grown substantially in numerous fields for different purposes during the last decade,owing to the continuing advances in image processing and computer vision approaches.In multiple real-life applications,for example,social media,content-based face picture retrieval is a well-invested technique for large-scale databases,where there is a significant necessity for reliable retrieval capabilities enabling quick search in a vast number of pictures.Humans widely employ faces for recognizing and identifying people.Thus,face recognition through formal or personal pictures is increasingly used in various real-life applications,such as helping crime investigators retrieve matching images from face image databases to identify victims and criminals.However,such face image retrieval becomes more challenging in large-scale databases,where traditional vision-based face analysis requires ample additional storage space than the raw face images already occupied to store extracted lengthy feature vectors and takes much longer to process and match thousands of face images.This work mainly contributes to enhancing face image retrieval performance in large-scale databases using hash codes inferred by locality-sensitive hashing(LSH)for facial hard and soft biometrics as(Hard BioHash)and(Soft BioHash),respectively,to be used as a search input for retrieving the top-k matching faces.Moreover,we propose the multi-biometric score-level fusion of both face hard and soft BioHashes(Hard-Soft BioHash Fusion)for further augmented face image retrieval.The experimental outcomes applied on the Labeled Faces in the Wild(LFW)dataset and the related attributes dataset(LFW-attributes),demonstrate that the retrieval performance of the suggested fusion approach(Hard-Soft BioHash Fusion)significantly improved the retrieval performance compared to solely using Hard BioHash or Soft BioHash in isolation,where the suggested method provides an augmented accuracy of 87%when executed on 1000 specimens and 77%on 5743 samples.These results remarkably outperform the results of the Hard BioHash method by(50%on the 1000 samples and 30%on the 5743 samples),and the Soft BioHash method by(78%on the 1000 samples and 63%on the 5743 samples). 展开更多
关键词 Face image retrieval soft biometrics similar pictures HASHING database search large databases score-level fusion multimodal fusion
下载PDF
结构化数据库查询语言智能合成技术研究进展 被引量:1
5
作者 刘雨蒙 赵怡婧 +2 位作者 王碧聪 王潮 张宝民 《计算机科学》 CSCD 北大核心 2024年第7期40-48,共9页
近年来,随着大数据、云计算等技术的飞速发展,大规模数据的产生使得各类应用对于数据库技术的依赖日益加深。然而,传统的数据库一般采用形式化的数据库查询语言SQL进行操作,对无编程经验或数据库使用经验的用户来说,复杂SQL语法难度较高... 近年来,随着大数据、云计算等技术的飞速发展,大规模数据的产生使得各类应用对于数据库技术的依赖日益加深。然而,传统的数据库一般采用形式化的数据库查询语言SQL进行操作,对无编程经验或数据库使用经验的用户来说,复杂SQL语法难度较高,降低了各个领域数据库应用者的便捷程度。近年来,机器学习、深度神经网络等人工智能技术的飞速发展,尤其是ChatGPT横空出世引发的大语言模型技术热潮,驱动了数据库与人工智能的深度结合与技术变革。通过智能方法将用户输入语言自动化合成SQL语言,以满足不同程度数据库使用者的操作需求,提升数据库的智能性、环境适应性及用户友好性。为全面聚焦数据库查询语言智能合成技术的最新研究进展,从范例输入、文本输入及语音输入这3类用户输入切入,详细阐述各类智能合成模型的研究脉络、代表性工作及最新进展,同时对各类方法的技术框架进行归纳与对比,最后对全文进行全面性的总结,并针对现有方法存在的问题和挑战展望未来发展方向。 展开更多
关键词 数据库技术 SQL智能合成 语义解析 SQL语法 大语言模型
下载PDF
ChatSOS:基于大语言模型的安全工程知识问答系统
6
作者 唐海洋 刘振翼 +1 位作者 陈东平 初庆钊 《中国安全科学学报》 CAS CSCD 北大核心 2024年第8期178-185,共8页
为解决大语言模型在安全工程领域应用时面临的语料库规模、输入处理能力和隐私性限制等问题,以2013—2023年间共117篇爆炸事故调查报告为基础构建向量数据库,利用大语言模型的生成式能力,进行提示工程,提出一个基于大语言模型的安全工... 为解决大语言模型在安全工程领域应用时面临的语料库规模、输入处理能力和隐私性限制等问题,以2013—2023年间共117篇爆炸事故调查报告为基础构建向量数据库,利用大语言模型的生成式能力,进行提示工程,提出一个基于大语言模型的安全工程知识问答(Q&A)系统——ChatSOS;与ChatGPT大语言模型相比,ChatSOS能够通过整合外部知识库,使大语言模型根据用户的输入信息,从数据库中检索相关语料,并深入分析。结果表明:ChatSOS具备深入分析问题、自主分配任务的能力,能够详尽总结事故报告并提出建议;通过结合外部知识库解决基础大模型在安全工程领域语料不足和语料实时性不高的问题,避免了使用新数据集微调模型可能导致的模型性能下降等问题,提升了大语言模型在安全工程领域的应用能力。 展开更多
关键词 ChatSOS 大语言模型 安全工程 知识问答(Q&A)系统 事故调查 向量数据库
下载PDF
基于Gabor变换的电网调度自动化设备运行状态监控技术 被引量:1
7
作者 李敏 徐建航 +2 位作者 岳振铎 赵双全 张政 《机械与电子》 2024年第3期40-44,共5页
提出基于Gabor变换的电网调度自动化设备运行状态监控技术。该方法从电网调度自动化设备的大规模数据库技术和自动化电网调度技术入手,分别采集2项技术在电网调度自动化设备运行中存储和调度的状态信息,并将状态信息与Gabor变换结合,消... 提出基于Gabor变换的电网调度自动化设备运行状态监控技术。该方法从电网调度自动化设备的大规模数据库技术和自动化电网调度技术入手,分别采集2项技术在电网调度自动化设备运行中存储和调度的状态信息,并将状态信息与Gabor变换结合,消除状态信息携带的干扰噪声,通过将优化后的状态信息输入以模糊神经网络与电网调度自动化设备健康评估体系为基础建立的设备运行状态监控模型中,实现电网调度自动化设备运行状态监控。实验结果表明,所提方法能够迅速监控电网调度自动化设备运行故障状态,监控功率与实际功率一致,监控精确度高。 展开更多
关键词 电网调度 自动化设备 大规模数据库 GABOR变换 设备运行状态
下载PDF
基于大语言模型的检索增强方法的研究综述
8
作者 蒋雷 汤海林 《计算机应用文摘》 2024年第23期151-154,157,共5页
当今的大型语言模型(LLM)虽然具备强大的能力,但也面临幻觉、过时知识和推理过程不透明等难题。目前,学术界正在通过整合外部数据库的知识来实现“检索增强生成(RAG)”,以解决这些问题。该方法被认为是最有前途的解决方案,能够增强LLM... 当今的大型语言模型(LLM)虽然具备强大的能力,但也面临幻觉、过时知识和推理过程不透明等难题。目前,学术界正在通过整合外部数据库的知识来实现“检索增强生成(RAG)”,以解决这些问题。该方法被认为是最有前途的解决方案,能够增强LLM的准确性和可信度,尤其是在知识密集型任务中。通过将LLM的内在知识与外部数据库的庞大动态存储库融合,RAG使LLM能够持续更新知识并集成特定领域的信息。文章对RAG范式进行了详细研究,分析了其3个基础组件:检索、生成和增强,并重点阐述了嵌入等关键组件中应用的先进技术,报告了RAG系统的当前总体现状。 展开更多
关键词 检索增强生成 大语言模型 数据库
下载PDF
福州市轨道交通安全监测智能化的设计与实现
9
作者 温晓东 《福建建设科技》 2024年第6期143-146,共4页
针对福州市轨道交通施工和运维安全监测,常规人工监测作业强度高、人员安全风险大和作业效率低等问题,同时为保障后续线路采用先进的无人驾驶技术,本文通过测量机器人自动化获取观测数据,经互联网传输至运营监控中心自动化监测系统,然... 针对福州市轨道交通施工和运维安全监测,常规人工监测作业强度高、人员安全风险大和作业效率低等问题,同时为保障后续线路采用先进的无人驾驶技术,本文通过测量机器人自动化获取观测数据,经互联网传输至运营监控中心自动化监测系统,然后利用历史与在建项目的监测数据建立监测数据库,基于监测数据库和基础地理信息数据建立监测大数据库,形成监测的数据基础底座。在此基础上构建智能化平台进行轨道交通安全监测的管理、决策与发布,为轨道安全监测提供有力支撑。 展开更多
关键词 轨道交通 安全监测 监测大数据库 智能化平台
下载PDF
一种基于大模型技术的算力产业监测服务平台设计
10
作者 李峰 乔春庚 《信息通信技术与政策》 2024年第6期45-53,共9页
提出了一种基于大模型技术的算力产业监测服务平台的设计,旨在通过高效的技术手段实现对算力产业发展监测,为智能化决策提供更加综合全面的支撑。该平台采用分层架构设计,底层以国产百亿参数大模型基座为支撑,上层为业务层应用系统,提... 提出了一种基于大模型技术的算力产业监测服务平台的设计,旨在通过高效的技术手段实现对算力产业发展监测,为智能化决策提供更加综合全面的支撑。该平台采用分层架构设计,底层以国产百亿参数大模型基座为支撑,上层为业务层应用系统,提供算力发展洞察、智能分析助手等功能。 展开更多
关键词 大模型 向量库 算力产业监测
下载PDF
基于语义理解与生成模型的铁路应急处置决策支持系统
11
作者 王祥昊 杨怀志 +1 位作者 王莉 胡恒闯 《铁道技术标准(中英文)》 2024年第6期44-51,共8页
本研究旨在提出一种新型的铁路应急处置决策支持系统,该系统基于语义理解与生成模型,能够有效生成应急处置策略、验证并更新处置流程,以及智能分发处置任务。首先,通过融合语义理解与生成模型及铁路应急处置专业知识库,处置策略动态生... 本研究旨在提出一种新型的铁路应急处置决策支持系统,该系统基于语义理解与生成模型,能够有效生成应急处置策略、验证并更新处置流程,以及智能分发处置任务。首先,通过融合语义理解与生成模型及铁路应急处置专业知识库,处置策略动态生成模块能够自主生成应急处置策略,并提供决策支持。接着,处置策略验证与更新模块利用Petri网模型的多方面可量化特性,实现对生成策略的验证与更新,确保策略的实时性和有效性。最后,应急处置任务智能分发模块采用基于BERT的深度学习模型进行命名实体识别和关系抽取,构建出详细的〈处置任务—归属—部门〉知识图谱,并通过Neo4j图数据库及Cypher查询语言实现任务的智能分发。通过这一综合性决策支持系统,本研究为铁路应急处置领域的智能化调度提供了有效的解决方案,并开拓了大语言模型在该领域应用的新方向。 展开更多
关键词 铁路应急处置决策 大语言模型 PETRI网 检索增强生成 BERT模型 Neo4j图数据库
下载PDF
基于mRNA组学构建弥漫大B细胞淋巴瘤预后模型
12
作者 王玉波 马东慎 +2 位作者 骆丹 范美婷 刘慧 《徐州医科大学学报》 CAS 2024年第3期195-201,共7页
目的 根据mRNA组学数据筛选弥漫大B细胞淋巴瘤(DLBCL)预后相关基因并建立预后模型。方法 从TCGA数据库下载NCICCR-DLBCL数据集中234例DLBCL患者mRNA组学数据和预后数据作为训练集,从GEO数据库下载GSE87371数据集中223例DLBCL患者相应数... 目的 根据mRNA组学数据筛选弥漫大B细胞淋巴瘤(DLBCL)预后相关基因并建立预后模型。方法 从TCGA数据库下载NCICCR-DLBCL数据集中234例DLBCL患者mRNA组学数据和预后数据作为训练集,从GEO数据库下载GSE87371数据集中223例DLBCL患者相应数据作为验证集,通过Cox回归分析、Kaplan-Meier分析和LASSO分析建立预后模型,结合生存曲线和ROC曲线验证模型的准确性。采用免疫组化法验证117例DLBCL组织中CD70蛋白的表达及其与预后的关系。结果 构建包含14个独立预后预测mRNA(ANO3、ZNF93、RAD9B、PROC、ZSCAN20、RBBP9、SLC18B1、CXorf21、MUC12、CYP2U1、VSIG4、CCDC178、CD70、GHRH)的预后模型。高风险组生存时间显著短于低风险组(P<0.000 1),ROC 1年、3年和5年生存率曲线下面积分别为0.92、0.90和0.91。CD70阳性组与阴性组的Kaplan-Meier生存曲线差异有统计学意义(P=0.009 4),阳性组生存时间较短。结论 成功建立了基于mRNA表达的DLBCL预后预测模型,为mRNA转录组学在DLBCL预后预测中的实际应用提供了可行性方案,并在临床样本中证实CD70高表达与DLBCL预后密切相关,可作为临床预后评价的指标之一。 展开更多
关键词 MRNA CD70 弥漫大B细胞淋巴瘤 TCGA数据库 预后模型 生存分析
下载PDF
基于多租户架构的企业GPT构造器的设计及其在5G消息上的应用
13
作者 李红纲 丁健 《移动信息》 2024年第3期280-282,共3页
ChatGPT以其强大的自然语言处理和知识推理技术,在全球范围内引起了大型语言模型(LLM)的热潮。通过基于多租户基础架构的企业GPT构造器,实现了企业网站抓取和文档加载功能,为中小型企业租户提供了私域数据喂养和向量化服务,并将语料向... ChatGPT以其强大的自然语言处理和知识推理技术,在全球范围内引起了大型语言模型(LLM)的热潮。通过基于多租户基础架构的企业GPT构造器,实现了企业网站抓取和文档加载功能,为中小型企业租户提供了私域数据喂养和向量化服务,并将语料向量作为LLM的长期记忆,构建了企业级GPT能力。通过配置的5G消息Chatbot同企业客户进行交互,在交互过程中,其能通过检索向量数据库中的企业相关信息,提供企业级的ChatGPT服务。 展开更多
关键词 大语言模型 向量数据库 ChatGPT 企业GPT 多租户 5G消息 聊天机器人
下载PDF
基于AIGC的营养配餐推荐系统研究
14
作者 陈钻凯 王志林 +1 位作者 朱润键 曾沛乐 《现代信息科技》 2024年第17期94-99,共6页
文章提出一种基于人工智能生成内容(AIGC)的营养配餐推荐系统,结合通义千问(Qwen)大语言模型和LORA技术对模型进行微调,以实现更精准的营养建议和配餐推荐。通过构建丰富的营养信息和菜谱数据的知识库,以及利用向量数据库进行高效检索,... 文章提出一种基于人工智能生成内容(AIGC)的营养配餐推荐系统,结合通义千问(Qwen)大语言模型和LORA技术对模型进行微调,以实现更精准的营养建议和配餐推荐。通过构建丰富的营养信息和菜谱数据的知识库,以及利用向量数据库进行高效检索,系统能够快速响应用户的查询请求,并提供个性化的配餐方案。实验证明,该系统在推荐准确性和用户体验上均优于传统方法。这项研究的贡献在于提出了一种新的营养配餐推荐方法,并通过实验证实了其有效性。 展开更多
关键词 人工智能生成内容 营养配餐推荐系统 大语言模型 微调技术 向量数据库
下载PDF
架构大数据:挑战、现状与展望 被引量:616
15
作者 王珊 王会举 +1 位作者 覃雄派 周烜 《计算机学报》 EI CSCD 北大核心 2011年第10期1741-1752,共12页
大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架... 大数据分析相比于传统的数据仓库应用,具有数据量大、查询分析复杂等特点.为了设计适合大数据分析的数据仓库架构,文中列举了大数据分析平台需要具备的几个重要特性,对当前的主流实现平台——并行数据库、MapReduce及基于两者的混合架构进行了分析归纳,指出了各自的优势及不足,同时也对各个方向的研究现状及作者在大数据分析方面的努力进行了介绍,对未来研究做了展望. 展开更多
关键词 大数据 大规模可扩展 MAPREDUCE 并行数据库 深度分析
下载PDF
基于NoSQL数据库的大数据查询技术的研究与应用 被引量:28
16
作者 朱建生 汪健雄 张军锋 《中国铁道科学》 EI CAS CSCD 北大核心 2014年第1期135-141,共7页
基于NoSQL数据库理论,根据应用场景的不同,将NoSQL数据库分为面向高性能读写、面向文档和面向分布式计算的3种类型。对比分析这3种类型数据库的6种代表产品的优缺点,结合铁路客票实名制售票信息综合分析系统中的大数据操作的需求,选用No... 基于NoSQL数据库理论,根据应用场景的不同,将NoSQL数据库分为面向高性能读写、面向文档和面向分布式计算的3种类型。对比分析这3种类型数据库的6种代表产品的优缺点,结合铁路客票实名制售票信息综合分析系统中的大数据操作的需求,选用NoSQL数据库中的面向分布式计算的Cassandra数据库。基于Cassandra数据库,提出铁路客票实名制信息综合分析系统的技术架构,并设计反向索引以构建客票实名制乘车信息的查询策略和查询流程。通过性能测试,验证了NoSQL数据库技术在处理大数据查询和分析中的高可用性,可突破传统关系型数据库和数据仓库在应用中所遇到的查询性能、扩展性以及投资成本的瓶颈。 展开更多
关键词 NOSQL数据库 Cassandra数据库 大数据处理 反向索引 数据查询
下载PDF
FDBSCAN:一种快速 DBSCAN算法(英文) 被引量:42
17
作者 周水庚 周傲英 +2 位作者 金文 范晔 钱卫宁 《软件学报》 EI CSCD 北大核心 2000年第6期735-744,共10页
聚类分析是一门重要的技术 ,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景 .目前 ,人们已经提出了许多聚类算法 .其中 ,DBSCAN是一种性能优越的基于密度的空间聚类算法 .利用基于密度的聚类概念 ,用户只需输... 聚类分析是一门重要的技术 ,在数据挖掘、统计数据分析、模式匹配和图象处理等领域具有广泛的应用前景 .目前 ,人们已经提出了许多聚类算法 .其中 ,DBSCAN是一种性能优越的基于密度的空间聚类算法 .利用基于密度的聚类概念 ,用户只需输入一个参数 ,DBSCAN算法就能够发现任意形状的类 ,并可以有效地处理噪声 .文章提出了一种加快 DBSCAN算法的方法 .新算法以核心对象邻域中所有对象的代表对象为种子对象来扩展类 ,从而减少区域查询次数 ,降低 I/ O开销 .实验结果表明 ,FDBSCAN能够有效地对大规模数据库进行聚类 ,速度上数倍于 DBSCAN. 展开更多
关键词 大规模数据库 数据挖掘 聚类 快速DBSCAN算法 代表点
下载PDF
基于Hadoop及关系型数据库的海量数据分析研究 被引量:29
18
作者 程莹 张云勇 +1 位作者 徐雷 房秉毅 《电信科学》 北大核心 2010年第11期47-50,共4页
Hadoop可以在大量廉价的硬件设备组成的集群上运行应用程序,全面地将计算推向数据,在处理海量数据方面具有一定的优势。本文对Hadoop和关系型数据库进行了比较分析,讨论了将二者结合构建海量数据分析系统的可行性,同时给出了实际的应用... Hadoop可以在大量廉价的硬件设备组成的集群上运行应用程序,全面地将计算推向数据,在处理海量数据方面具有一定的优势。本文对Hadoop和关系型数据库进行了比较分析,讨论了将二者结合构建海量数据分析系统的可行性,同时给出了实际的应用场景。 展开更多
关键词 云计算 关系型数据库 海量数据
下载PDF
VISMiner:一个交互式可视化数据挖掘原型系统 被引量:10
19
作者 汪加才 陈奇 +1 位作者 赵杰煜 俞瑞钊 《计算机工程》 CAS CSCD 北大核心 2003年第1期17-19,共3页
交互式可视化数据挖掘是利用可视化技术进行联机数据挖掘的技术。基于SOM的交互式可视化数据挖掘原型系统VISMiner的主要目的是将数据挖掘与数据可视化及OLAP进行集成,允许用户以交互的方式从SOM的标记图或距离图中选定感兴趣区域加以... 交互式可视化数据挖掘是利用可视化技术进行联机数据挖掘的技术。基于SOM的交互式可视化数据挖掘原型系统VISMiner的主要目的是将数据挖掘与数据可视化及OLAP进行集成,允许用户以交互的方式从SOM的标记图或距离图中选定感兴趣区域加以深入分析。 展开更多
关键词 VISMiner 交互式可视化数据挖掘原型系统 数据库 数据仓库 自组织神经网络
下载PDF
一种基于矩阵的关联规则挖掘新算法 被引量:13
20
作者 丁艳辉 王洪国 +1 位作者 高明 谷建军 《计算机科学》 CSCD 北大核心 2006年第4期188-189,197,共3页
本文针对大型交易事务数据库数据间发现关联规则问题,提出了一个新的关联规则挖掘算法,BOM(BaseOn Matrix)算法。该算法不同于经典的 Apriori 算法,对于大型交易事务数据库,具有较 Apriori 算法更加优越的性能。
关键词 大型交易事务数据库 矩阵 关联规则
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部