期刊文献+
共找到155篇文章
< 1 2 8 >
每页显示 20 50 100
A Rule Management System for Knowledge Based Data Cleaning
1
作者 Louardi BRADJI Mahmoud BOUFAIDA 《Intelligent Information Management》 2011年第6期230-239,共10页
In this paper, we propose a rule management system for data cleaning that is based on knowledge. This system combines features of both rule based systems and rule based data cleaning frameworks. The important advantag... In this paper, we propose a rule management system for data cleaning that is based on knowledge. This system combines features of both rule based systems and rule based data cleaning frameworks. The important advantages of our system are threefold. First, it aims at proposing a strong and unified rule form based on first order structure that permits the representation and management of all the types of rules and their quality via some characteristics. Second, it leads to increase the quality of rules which conditions the quality of data cleaning. Third, it uses an appropriate knowledge acquisition process, which is the weakest task in the current rule and knowledge based systems. As several research works have shown that data cleaning is rather driven by domain knowledge than by data, we have identified and analyzed the properties that distinguish knowledge and rules from data for better determining the most components of the proposed system. In order to illustrate our system, we also present a first experiment with a case study at health sector where we demonstrate how the system is useful for the improvement of data quality. The autonomy, extensibility and platform-independency of the proposed rule management system facilitate its incorporation in any system that is interested in data quality management. 展开更多
关键词 rule data Quality data CLEANING KNOWLEDGE rule Management SYSTEM rule based SYSTEM Structure
下载PDF
基于置信规则库气象站故障检测专家系统
2
作者 陈晓 嵇伟明 张凯 《信息技术》 2024年第9期161-167,共7页
针对气象站故障检测的需求,研制了基于置信规则库的气象站故障检测专家系统。专家系统利用前期建立起来的气象站的气象数据库,根据当前实时气象数据,通过改进的置信规则库模型结合专家经验知识自动完成数据分析和处理、是否有故障判断... 针对气象站故障检测的需求,研制了基于置信规则库的气象站故障检测专家系统。专家系统利用前期建立起来的气象站的气象数据库,根据当前实时气象数据,通过改进的置信规则库模型结合专家经验知识自动完成数据分析和处理、是否有故障判断并对故障程度进行等级划分。工作人员在进行现场故障检测之前,只需通过气象站传感器故障专家系统对异常传感器进行辅助诊断,确定故障等级后依据故障等级携带相应检修设备或需更换的零部件进入现场实施检查和维修。实验测试表明系统对各个设备的总体平均检测准确率从69.8%提高到85.7%,极大提升了检测的效率和准确性。 展开更多
关键词 气象站 故障检测 置信规则库 专家系统 数据分析
下载PDF
基于真实世界数据的青春期异常子宫出血用药规律研究
3
作者 郭春彦 柳静 +4 位作者 张萌 丁倩 王谦 张怡 王晓玲 《世界中医药》 CAS 北大核心 2024年第10期1469-1475,1485,共8页
目的:通过对女童青春期异常子宫出血患儿临床实际诊疗病例资料进行数据挖掘分析其中药治疗的用药规律。方法:基于医院信息管理系统提取2020年1月至2022年12月首都医科大学附属北京儿童医院女童青春期异常子宫出血患儿的病历数据,分为止... 目的:通过对女童青春期异常子宫出血患儿临床实际诊疗病例资料进行数据挖掘分析其中药治疗的用药规律。方法:基于医院信息管理系统提取2020年1月至2022年12月首都医科大学附属北京儿童医院女童青春期异常子宫出血患儿的病历数据,分为止血期和调理期2个阶段,总结归纳其辨治规律。结果:纳入止血期663例患儿,1020例病历;调理期796例患儿,2047例病历。止血期涉及中药169味,排名前5位为侧柏炭、牡丹皮、小蓟、麸炒椿皮和白芍,性味以寒、苦药为最多,归经以肝经为最多,功效以止血、补虚类药物为最多;调理期涉及中药232味,排名前5位为当归、酒女贞子、炙淫羊藿、黄芪和生地黄,性味以温、甘药最多,归经以肝、肾经为最多,功效以补虚类为最多。聚类分析分别获得4类和5类核心药物组合。结论:真实世界临床数据显示肾阴亏虚、血热内扰为青春期异常子宫出血常见证型,治则先以止血为主,待崩漏缓解后,重在调补脾肾以复旧,组方注重止血、补虚、收涩和清热等药物的配伍应用。 展开更多
关键词 中医药 儿童 青春期异常子宫出血 真实世界数据 数据挖掘 关联规则 辨证论治 用药规律
下载PDF
基于隐结构模型联合频繁项集的针灸治疗弱精子症不育患者的辨证取穴规律
4
作者 何瑞宣 孙自学 +3 位作者 华众 张芳 张迪 胡创政 《世界中医药》 CAS 北大核心 2024年第14期2185-2190,共6页
目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针... 目的:探讨针灸治疗弱精子症不育患者的辨证取穴规律,为临床治疗弱精子症不育患者提供帮助。方法:检索国家知识基础设施数据库(CNKI)、中国生物医学文献数据库(CBM)、中国学术期刊数据库(CSPD)及中文科技期刊数据库(CCD)等数据库有关针灸治疗弱精子症的相关文献,提取症状、取穴处方信息构建医案数据库,采用隐结构模型、频繁项集的数据挖掘方法,分析针灸治疗弱精子症的辨证取穴规律。结果:纳入文献35篇,涉及症状62种,穴位49个。高频症状包括腰酸、神疲乏力等,高频腧穴包括关元、肾俞等。对症状、腧穴、证型进行频繁项集分析,挖掘出症状-腧穴频繁项集4项,包括耳鸣+头晕+腰酸+关元+肾俞等;证型-症状频繁项集4项,包括肾精亏虚证+健忘+性欲淡漠+神疲乏力+脉细等;证型-症状-腧穴频繁项集4项,包括肾精亏虚证+性欲淡漠+神疲乏力+头发易脱+关元等。结论:针灸治疗弱精子症多以关元、肾俞、足三里为主穴。 展开更多
关键词 隐结构模型 频繁项集 弱精子症 辨证取穴规律 数据挖掘 Apriori算法 穴位 针灸
下载PDF
基于规则库的不动产登记数据质量检查技术研究
5
作者 杨文杰 许钡榛 +1 位作者 杜剑光 列键佳 《城市勘测》 2024年第5期29-32,共4页
随着不动产登记工作的不断推进,不动产登记数据质量问题越发突出,各项工作对不动产登记数据质量要求也更加严格,如互联网+不动产、三维不动产和区块链等方面,因此需要不断提高不动产登记数据质量,以更好地服务不动产登记工作。本文结合... 随着不动产登记工作的不断推进,不动产登记数据质量问题越发突出,各项工作对不动产登记数据质量要求也更加严格,如互联网+不动产、三维不动产和区块链等方面,因此需要不断提高不动产登记数据质量,以更好地服务不动产登记工作。本文结合不动产登记数据的特点,研究基于规则库的不动产登记数据质量检查方法,形成了一套从规则库建立到全类型不动产登记检查的数据质量控制流程,为不动产登记数据质量保障提供了参考,也为不动产登记工作的提升提供了有效的技术支撑和数据基础。 展开更多
关键词 不动产登记 数据质量控制 规则库 楼盘表
下载PDF
普惠金融背景下金融替代数据的征信边界研究
6
作者 李恒利 《中阿科技论坛(中英文)》 2024年第3期58-62,共5页
近年来,随着数字经济的快速发展,互联网和大数据等新技术在征信领域广泛应用,大量有效“替代数据”被采集、分析和应用于判断企业和个人信用状况,征信已突破传统借贷信息共享的范围。然而,基于《中华人民共和国个人信息保护法》实施情况... 近年来,随着数字经济的快速发展,互联网和大数据等新技术在征信领域广泛应用,大量有效“替代数据”被采集、分析和应用于判断企业和个人信用状况,征信已突破传统借贷信息共享的范围。然而,基于《中华人民共和国个人信息保护法》实施情况,面对征信机构利用大数据不当搜集个人金融替代数据的现状,理应尽快厘清金融替代数据的征信边界以保护信贷主体的金融信息权益。基于此,文章认为:应遵循《中华人民共和国个人信息保护法》的基本原则,把满足“依法采集、用于描绘信用画像、服务普惠金融大局”三要素的金融替代数据整体纳入征信监管中,明晰金融替代数据的分级分类管理制度,并结合情境脉络完整性理论细化金融替代数据应用的场景化规则,并构建以诚信原则为核心、征信主体与信贷主体共同参与征信活动的良性互动机制。 展开更多
关键词 金融替代数据 分级分类管理 场景化规则 征信合规 普惠金融
下载PDF
基于规则库的智能急诊叫号系统建设实践 被引量:1
7
作者 莫远明 魏汉波 +1 位作者 马锐 陈康 《现代医院》 2023年第7期1095-1098,共4页
目的设计及建设一套符合急诊业务流程,满足急诊患者病情复杂、随机性强需求的叫号系统。方法利用先进软件开发技术和院内数据交互平台,实现智能急诊叫号系统的开发、部署。结果该系统实现与其它业务系统的互联互通以及排队叫号规则库管... 目的设计及建设一套符合急诊业务流程,满足急诊患者病情复杂、随机性强需求的叫号系统。方法利用先进软件开发技术和院内数据交互平台,实现智能急诊叫号系统的开发、部署。结果该系统实现与其它业务系统的互联互通以及排队叫号规则库管理,提高急诊前台护士工作效率,有效引导患者就诊,避免患者过度聚集,减轻急诊医护人员工作压力。结论基于规则库与数据平台的急诊叫号系统,满足急诊专科特殊需求,并为科室考勤管理、运营分析提供数据支持,对改善患者就医体验,提高医疗服务水平有较大的促进作用。 展开更多
关键词 急诊医学 叫号系统 数据平台 智慧医疗 规则库
下载PDF
Research on Hybrid Data Verification Method for Educational Data
8
作者 Lin Dong Xinhong Hei +2 位作者 Xiaojiao Liu Ping He Bin Wang 《国际计算机前沿大会会议论文集》 2018年第1期6-6,共1页
下载PDF
数据挖掘技术在计算机安全防御中的应用 被引量:1
9
作者 孟云飞 《集成电路应用》 2023年第5期118-119,共2页
阐述数据挖掘与计算机病毒防御技术,包括关联规则、分类规则、序列分析规则、异类规则,探讨数据挖掘技术中的数据收集、数据处理、规则库模块在计算机病毒防御中的应用。
关键词 数据挖掘 计算机系统 信息安全 规则库
下载PDF
压水堆核电厂运行瞬态自动分类算法研究
10
作者 白晓明 于新洋 +6 位作者 曹国畅 李政 曹洪胜 崔怀明 艾红雷 熊夫睿 姜赫 《原子能科学技术》 EI CAS CSCD 北大核心 2023年第11期2201-2209,共9页
瞬态统计与核电厂运行状态监测和延寿许可申请密切相关,是核电厂中的一项重要工作。瞬态分类是将运行瞬态归为设计瞬态的过程,是瞬态统计工作中的关键环节。目前国内外已有的自动分类算法存在识别正确率低、训练数据多的问题,因此大部... 瞬态统计与核电厂运行状态监测和延寿许可申请密切相关,是核电厂中的一项重要工作。瞬态分类是将运行瞬态归为设计瞬态的过程,是瞬态统计工作中的关键环节。目前国内外已有的自动分类算法存在识别正确率低、训练数据多的问题,因此大部分核电厂仍采用人工瞬态分类的方式。本文从设计瞬态物理意义及各参数影响关系出发,建立了一种将基于规则和基于数据算法融合的瞬态分类算法,研究了瞬态参数权重、信号信噪比对算法的影响,测试了算法的并行计算效率。采用核电厂运行数据对该算法验证的结果显示,该算法对运行瞬态能够有效识别。该算法解决了传统瞬态分类算法中需要大量训练数据的问题,实现了在少样本条件下的瞬态分类。 展开更多
关键词 瞬态统计 瞬态分类 核电厂 基于规则 基于数据
下载PDF
基于数据挖掘探析刘小虹教授治疗痰热郁肺型慢性阻塞性肺疾病急性加重期的用药规律 被引量:1
11
作者 连乐燊 蒋紫云 +2 位作者 刘城鑫 周谨希 刘小虹(指导) 《中国民族民间医药》 2023年第14期104-109,共6页
目的:探讨刘小虹教授治疗痰热郁肺型慢性阻塞性肺疾病急性加重期(AECOPD)的用药规律。方法:收集刘小虹教授近2年治疗痰热郁肺型AECOPD的中药处方,将方药录入Microsoft Excel软件。采用中医传承辅助平台(V2.5)统计用药频次和药物功效,根... 目的:探讨刘小虹教授治疗痰热郁肺型慢性阻塞性肺疾病急性加重期(AECOPD)的用药规律。方法:收集刘小虹教授近2年治疗痰热郁肺型AECOPD的中药处方,将方药录入Microsoft Excel软件。采用中医传承辅助平台(V2.5)统计用药频次和药物功效,根据Apriori算法对用药模式及关联规则(支持度≥0.30、置信度≥0.80)进行统计分析,运用熵层次聚类法提取内在核心组合和新方组合(相关度为7、惩罚度为2)。结果:共录入处方202首,包含中药2155味,其中用药频次由高到低依次为黄芩、杏仁、桑白皮、瓜蒌、甘草、半夏、浙贝母、葶苈子、麻黄、紫苏子等;主要药物功效分类按使用频次由高到低依次为化痰药、清热药、止咳平喘药、解表药、利水渗湿药、活血药、泻下药、行气药、补气药、养阴药等;常用药物配伍有“黄芩+杏仁”“黄芩+桑白皮”“黄芩+瓜蒌”“杏仁+桑白皮”等;挖掘出内在核心组合10个,以及新方5首。结论:刘小虹治疗痰热郁肺型AECOPD手法丰富、思路灵活,其以清热化痰、止咳平喘为主要治法,常用黄芩、杏仁、桑白皮等中药,另佐以解表、通腑、行气活血、补气、养阴等法。由内在关联聚类而成的5首新方,可为痰热郁肺型AECOPD的治疗提供参考。 展开更多
关键词 慢性阻塞性肺疾病急性加重期 痰热郁肺 辨证论治 数据挖掘 中医传承辅助平台 用药规律
下载PDF
习近平法治思想指导下的中国特色企业数据产权制度构建 被引量:2
12
作者 叶敏 范馨允 《法治现代化研究》 CSSCI 2023年第6期37-52,共16页
我国数据资源存储量庞大、规模增长迅速,“数据二十条”提出要释放数据要素价值,探索数据产权结构性分置制度,各地积极探索与推进数据管理机制创新。目前对于企业数据的法律地位存在多种理论争议,分歧主要体现在保护路径的选择上,但总... 我国数据资源存储量庞大、规模增长迅速,“数据二十条”提出要释放数据要素价值,探索数据产权结构性分置制度,各地积极探索与推进数据管理机制创新。目前对于企业数据的法律地位存在多种理论争议,分歧主要体现在保护路径的选择上,但总体均是在现有财产权的制度基础上进行拓展延伸。事实上,传统民事私法框架下的财产权制度对企业数据并不适应:知识产权对企业数据的覆盖范围不足,商业秘密保护方式又与数据共享的需求相悖,其根源在于私人占有与数据资源的公共性之间的本质冲突。在习近平法治思想的指导下,从准公共物品理论角度对企业数据的准公共性、正外部性、有限竞争性与排他性等属性进行分析后,中国特色数据产权制度的可能构建思路是:在数据资源所有权公共所有的前提下,对企业数据在生产、加工处理、流通交易等不同应用场景下进行相应的数据资源持有权、加工使用权、产品经营权等具体权属分配。这一制度安排不仅可以发挥数据共享的最大效能,也能有效地协调企业数据财产权益与个人信息保护私益、国家数据安全公益之间的冲突。 展开更多
关键词 习近平法治思想 企业数据产权 准公共物品理论 “场景化”权属配置
下载PDF
基于知识规则挖掘的风电机组故障识别与解释性分析 被引量:1
13
作者 钱小毅 孙天贺 +1 位作者 王宝石 韩玥 《太阳能学报》 EI CAS CSCD 北大核心 2023年第8期379-385,共7页
针对传统风电机组故障识别方法精度难以保证且缺乏解释性的问题,提出一种以模糊规则分类系统为框架的风电机组故障识别与解释性分析方案。离线阶段通过启发式学习生成代表性故障规则,采用多种群量子进化算法实现故障规则寻优,提高对故... 针对传统风电机组故障识别方法精度难以保证且缺乏解释性的问题,提出一种以模糊规则分类系统为框架的风电机组故障识别与解释性分析方案。离线阶段通过启发式学习生成代表性故障规则,采用多种群量子进化算法实现故障规则寻优,提高对故障的识别精度;在线阶段定义近邻规则竞争策略,在此基础上提出基于故障规则后处理策略的故障解释性分析方案,实现潜在故障概率排序以及解释性的关键异常征兆表达。以兆瓦级风电机组常见的10种故障数据进行仿真分析。结果表明,所提方法可有效提高故障识别精度,同时提供可靠的故障解释性结果。 展开更多
关键词 风电机组 数据挖掘 故障诊断 模糊规则分类系统 故障概率 解释性分析
下载PDF
一种电力造价异常数据辨识算法 被引量:1
14
作者 程津 周鲲 +1 位作者 徐志强 伍家耀 《沈阳工业大学学报》 CAS 北大核心 2023年第4期387-391,共5页
为了解决现有电力造价异常数据检测算法无法识别清单详情及清单与施工细节不符的问题,提出了一种基于规则匹配的电力造价异常数据辨识算法.利用K-means聚类算法实现了清单的初步分类和特征清单的提取,将特征清单的特征词作为清单类别特... 为了解决现有电力造价异常数据检测算法无法识别清单详情及清单与施工细节不符的问题,提出了一种基于规则匹配的电力造价异常数据辨识算法.利用K-means聚类算法实现了清单的初步分类和特征清单的提取,将特征清单的特征词作为清单类别特征.采用规则库对清单详情进行分词,并提取清单特征词,采用多项式贝叶斯算法计算出清单位于当前类别的概率.实验结果表明,所提出算法较传统异常数据检测算法的准确率提高了约10%. 展开更多
关键词 电力造价 规则匹配 规则库 异常数据 异常检测 清单详情 特征词 多项式贝叶斯
下载PDF
Test Data Generation for Stateful Network Protocol Fuzzing Using a Rule-Based State Machine 被引量:13
15
作者 Rui Ma Daguang Wang +2 位作者 Changzhen Hu Wendong Ji Jingfeng Xue 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2016年第3期352-360,共9页
To improve the efficiency and coverage of stateful network protocol fuzzing, this paper proposes a new method, using a rule-based state machine and a stateful rule tree to guide the generation of fuzz testing data. Th... To improve the efficiency and coverage of stateful network protocol fuzzing, this paper proposes a new method, using a rule-based state machine and a stateful rule tree to guide the generation of fuzz testing data. The method first builds a rule-based state machine model as a formal description of the states of a network protocol. This removes safety paths, to cut down the scale of the state space. Then it uses a stateful rule tree to describe the relationship between states and messages, and then remove useless items from it. According to the message sequence obtained by the analysis of paths using the stateful rule tree and the protocol specification, an abstract data model of test case generation is defined. The fuzz testing data is produced by various generation algorithms through filling data in the fields of the data model. Using the rule-based state machine and the stateful rule tree, the quantity of test data can be reduced. Experimental results indicate that our method can discover the same vulnerabilities as traditional approaches, using less test data, while optimizing test data generation and improving test efficiency. 展开更多
关键词 FUZZING stateful network protocol test data generation rule-based state machine stateful rule tree
原文传递
基于数据挖掘探讨功能性消化不良的中医辨证论治规律
16
作者 梁巧俐 邹孟龙 黄晓燕 《广西医学》 CAS 2023年第22期2749-2755,共7页
目的 利用数据挖掘技术分析功能性消化不良(FD)的中医辨证论治规律。方法 检索中国知网、维普资讯中文期刊服务平台、中国生物医学文献服务系统、万方数据知识服务平台收录的FD辨证分型和辨证论治的相关文献,提取文献中的中医证候分布... 目的 利用数据挖掘技术分析功能性消化不良(FD)的中医辨证论治规律。方法 检索中国知网、维普资讯中文期刊服务平台、中国生物医学文献服务系统、万方数据知识服务平台收录的FD辨证分型和辨证论治的相关文献,提取文献中的中医证候分布、方药组成等信息,经规范化处理并归类后,运用IBM SPSS Statistics 22.0软件对证型、证素及中药进行频数统计,使用IBM SPSS Modeler 18.0软件对高频药物进行关联规则分析。结果 共获得FD中医证型18个,以肝郁脾虚、脾胃虚弱、肝胃不和、脾胃湿热、寒热错杂为主要证型。肝郁脾虚型常用中药有柴胡、白术等,置信度最高的药对为白芍-柴胡;脾胃虚弱型常用中药有甘草、白术等,置信度最高的药对为茯苓-白术;肝胃不和型常用中药有柴胡、白芍等,置信度最高的药对为白芍-柴胡;脾胃湿热型常用中药有半夏、厚朴等,置信度最高药对为白豆蔻-薏苡仁;寒热错杂型常用中药有半夏、黄连、甘草等,置信度为100%且支持度>90%的药对为甘草-半夏。结论 FD的中医辨证主要为肝郁脾虚、脾胃虚弱、肝胃不和、脾胃湿热、寒热错杂,病位主要在胃,与脾、肝密切相关,病性证素以气滞、气虚为主,中医辨证论治FD的高频用药为白术、柴胡、白芍、茯苓、甘草等,药物功效多为健脾益气、理气止痛。 展开更多
关键词 功能性消化不良 中医疗法 证候分布 用药规律 辨证论治 数据挖掘
下载PDF
表格单元格分类的端到端不完全监督方法
17
作者 郝昕毓 周建涛 王昊 《计算机与数字工程》 2023年第1期59-65,共7页
大数据时代下,爆炸式增长的非结构化数据中蕴含着大量有价值的信息,对其进行识别和提取变得越发重要。表格是典型的高价值密度非结构化数据,为了识别表格的功能结构,并提高模型的通用性和结果的易用性,针对表格单元格分类提出一个端到... 大数据时代下,爆炸式增长的非结构化数据中蕴含着大量有价值的信息,对其进行识别和提取变得越发重要。表格是典型的高价值密度非结构化数据,为了识别表格的功能结构,并提高模型的通用性和结果的易用性,针对表格单元格分类提出一个端到端不完全监督方法。设计了基于视觉可见的特征选取方案来提高通用性,提出基于规则的自动修正算法用于改善单元格分类的效果,让用户对结果进行再次修正并将结果作为额外的训练数据参与模型训练来提高模型不同场景下的适应性。最后将方法实现为端到端工具,在提高便捷性的同时使得修正后的数据可直接导出用于下游任务。实验结果表明,提出的方法在多个指标上对比基线方法均有提升,同时在一定程度上提高了结果的易用性。 展开更多
关键词 非结构化数据 表格数据 单元格分类 不完全监督方法 基于规则
下载PDF
铁路12306通知系统智能化研究
18
作者 梅巧玲 王紫瑶 +2 位作者 范茂洋 梁超 李雯 《铁道运输与经济》 北大核心 2023年第5期94-98,156,共6页
针对铁路旅客出行时面临的通知信息过载,无法得到个性化和精准化通知的问题,对铁路12306通知系统进行智能化研究。在阐述12306智能通知系统架构设计的基础上,提出4个功能模块,为通知系统的智能化计算与运行提供支撑。通过分析旅客群体... 针对铁路旅客出行时面临的通知信息过载,无法得到个性化和精准化通知的问题,对铁路12306通知系统进行智能化研究。在阐述12306智能通知系统架构设计的基础上,提出4个功能模块,为通知系统的智能化计算与运行提供支撑。通过分析旅客群体分类方法,将现有的通知消息进行分类,针对不同类型的信息研究了基于规则的群体分类算法和基于模型的群体分类算法,在实际应用中不同通知内容应选择不同的算法以达到更好的推送效果。最后,以数字短信业务为例对比了2种群体分类算法对推送效果的影响。通过上述研究,为12306通知系统的智能化转型提供新的参考方向,对提升精准推送、提高信息资源利用率、增强旅客出行满意度和企业“降本增效,提质降耗”具有重要意义。 展开更多
关键词 铁路 智能通知系统 数据融合 旅客群体分类 基于规则群体分类 基于模型群体分类
下载PDF
基于规则库和聚类分析的复句短语字段的自动识别研究 被引量:9
19
作者 胡金柱 俞小娟 +1 位作者 李琼 周毕吉 《华中师范大学学报(自然科学版)》 CAS CSCD 2008年第2期190-194,共5页
复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的... 复句层次结构与层次关系研究,是一项将中文信息处理由字、词处理阶段提升到句处理阶段的关键性难题.在研究复句层次划分和层次关系之前,首先要确定复句中分句的数量,需要排除其中非完整分句的字段(本文中称之为短语字段).结合语言学的相关理论,首先建立规则库,在此基础上,引入聚类分析法,对短语字段进行分类,最终使短语字段的自动识别率达到92.1%. 展开更多
关键词 短语字段 规则库 聚类分析 变量
下载PDF
广义关联规则基及其挖掘算法 被引量:9
20
作者 李天瑞 杨宁 马骏 《西南交通大学学报》 EI CSCD 北大核心 2004年第1期86-89,共4页
为了解决传统的关联规则挖掘中产生大量规则的问题,提出了项目集上闭集和广义关联规则基的概念,并得出了闭项目集的上闭集是它本身、上闭集是惟一的等性质.基于这些性质,给出了事物数据库的广义关联规则基,不仅保留了数据库中所有关联... 为了解决传统的关联规则挖掘中产生大量规则的问题,提出了项目集上闭集和广义关联规则基的概念,并得出了闭项目集的上闭集是它本身、上闭集是惟一的等性质.基于这些性质,给出了事物数据库的广义关联规则基,不仅保留了数据库中所有关联规则的信息,而且规则有一致的结构,从而最大限度地减少了规则生成的数量.此外,还设计了广义关联规则基的挖掘算法,并通过实例验证了它的正确性. 展开更多
关键词 数据库 数据处理 广义关联规则基 数据挖掘 挖掘算法 项目集
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部