期刊文献+
共找到184篇文章
< 1 2 10 >
每页显示 20 50 100
基于知识图谱的网络攻击预测方法研究及应用 被引量:1
1
作者 黄智勇 刘昕宇 +2 位作者 林仁明 余雅宁 张凤荔 《现代电子技术》 北大核心 2024年第9期91-96,共6页
针对网络攻击知识图谱,同时引入了时序信息,提出一种基于知识图谱的网络攻击预测方案,并对其进行应用。通过对网络攻击知识图谱进行规则学习和应用,能够有效地得到网络攻击事件预测结果,为网络安全运维人员提供决策支持。以企业提供的... 针对网络攻击知识图谱,同时引入了时序信息,提出一种基于知识图谱的网络攻击预测方案,并对其进行应用。通过对网络攻击知识图谱进行规则学习和应用,能够有效地得到网络攻击事件预测结果,为网络安全运维人员提供决策支持。以企业提供的网络安全运维知识图谱为例,将文中研究的方法应用到企业安全检测系统,结果证明该方法具有充分的准确性和可行性,同时为后续研究提供了思路。 展开更多
关键词 网络安全 知识图谱 时序知识图谱 知识图谱推理 链接预测 网络攻击 随机游走 攻击规则
下载PDF
利用集成剪枝和多目标优化算法的随机森林可解释增强模型
2
作者 李扬 廖梦洁 张健 《计算机应用研究》 CSCD 北大核心 2024年第10期2947-2954,共8页
随机森林模型是广泛应用于各个领域的经典黑盒模型,而黑盒模型的结构特征导致模型可解释性弱,需要借助可解释技术优化随机森林的可解释性,从而促进其在可靠性要求较高场景的应用与发展。研究构建了基于集成剪枝和多目标优化算法的规则... 随机森林模型是广泛应用于各个领域的经典黑盒模型,而黑盒模型的结构特征导致模型可解释性弱,需要借助可解释技术优化随机森林的可解释性,从而促进其在可靠性要求较高场景的应用与发展。研究构建了基于集成剪枝和多目标优化算法的规则提取模型,集成剪枝在解决树模型规则提取易陷入局部最优的问题上具有代表性,多目标优化在解决规则准确性和可解释性的平衡问题上有多个领域的应用。模型验证结果表明,所构建模型能够在不降低准确性的前提下优化模型的可解释性。本研究首次将集成剪枝技术与多目标优化算法相融合,增强了随机森林的可解释性,有助于推动该模型在可解释性要求较高领域的决策应用。 展开更多
关键词 随机森林 可解释增强 集成剪枝 规则提取 多目标优化算法
下载PDF
山区高速隧道交通事故严重程度预测及特大事故决策规则提取
3
作者 乔建刚 范颖蓉 +1 位作者 陶瑞 王傑 《中国安全生产科学技术》 CAS CSCD 北大核心 2024年第7期186-192,共7页
为有效避免隧道段发生人员伤亡严重的交通事故,选取2013—2023年我国国内(不含港澳台)发生的交通事故数据进行统计分析,结合事故严重程度和时空分布情况筛选出14个影响因素;采用随机森林模型构建山区高速隧道段交通事故严重程度预测模型... 为有效避免隧道段发生人员伤亡严重的交通事故,选取2013—2023年我国国内(不含港澳台)发生的交通事故数据进行统计分析,结合事故严重程度和时空分布情况筛选出14个影响因素;采用随机森林模型构建山区高速隧道段交通事故严重程度预测模型,对比分析有序Logit模型和BP神经网络模型与所构建的模型预测精度;基于规则重要性对随机森林中“特大事故”决策规则进行提取。研究结果表明:随机森林模型对于事故严重程度的预测结果较优,决策规则揭示人员伤亡严重时的影响因素组合。研究结果可为针对事故严重程度影响机理提出改进意见提供参考。 展开更多
关键词 隧道 随机森林模型 决策规则 事故 严重程度
下载PDF
基于改进的Random Subspace 的客户投诉分类方法 被引量:3
4
作者 杨颖 王珺 王刚 《计算机工程与应用》 CSCD 北大核心 2020年第13期230-235,共6页
电信业的客户投诉不断增多而又亟待高效处理。针对电信客户投诉数据的特点,提出了一种面向高维数据的改进的集成学习分类方法。该方法综合考虑客户投诉中的文本信息及客户通讯状态信息,基于Random Subspace方法,以支持向量机(Support Ve... 电信业的客户投诉不断增多而又亟待高效处理。针对电信客户投诉数据的特点,提出了一种面向高维数据的改进的集成学习分类方法。该方法综合考虑客户投诉中的文本信息及客户通讯状态信息,基于Random Subspace方法,以支持向量机(Support Vector Machine,SVM)为基分类器,采用证据推理(Evidential Reasoning,ER)规则为一种新的集成策略,构造分类模型对电信客户投诉进行分类。所提模型和方法在某电信公司客户投诉数据上进行了验证,实验结果显示该方法能够显著提高客户投诉分类的准确率和投诉处理效率。 展开更多
关键词 客户投诉分类 random Subspace方法 支持向量机 证据推理规则
下载PDF
基于数据挖掘算法的大学生就业分析——以韩山师范学院统计学专业为例
5
作者 陈烁权 钟银婷 +1 位作者 佘梓润 佘梓航 《韩山师范学院学报》 2024年第3期68-75,共8页
为探讨毕业生的就业情况,使用python软件,对195位毕业生,从大学学业成绩、就业地点、就业薪资等方面进行数据分析.结果表明,生源地与就业地点之间存在一定的关联性,生源地在三、四线城市的学生更倾向于一线城市就业.学业成绩与就业薪资... 为探讨毕业生的就业情况,使用python软件,对195位毕业生,从大学学业成绩、就业地点、就业薪资等方面进行数据分析.结果表明,生源地与就业地点之间存在一定的关联性,生源地在三、四线城市的学生更倾向于一线城市就业.学业成绩与就业薪资之间也具有一定的关联性,优秀的成绩往往使毕业生获得更好的就业机会和更高的薪资.此外,不同的单位类型、所属行业、职业类型对毕业生的初次就业薪资也有一定的影响,而初次就业地点、学生毕业去向以及性别对学生就业薪资水平的影响则相对较小. 展开更多
关键词 随机森林算法 关联规则 PYTHON 学业成绩 薪资
下载PDF
一种改进的马尔可夫随机场遥感图像分割方法
6
作者 袁鹏 刘芳 +2 位作者 朱永泰 肖坚 王珂 《地理空间信息》 2024年第6期34-38,共5页
对于传统马尔可夫随机场而言,先验能量的势能函数中的先验参数通常是根据经验手动选取大于零的值,没有考虑像元之间的距离,也没有充分考虑图像局部邻域先验特征,针对上述问题,提出一种结合标号场先验特征和像元距离动态估计先验参数的方... 对于传统马尔可夫随机场而言,先验能量的势能函数中的先验参数通常是根据经验手动选取大于零的值,没有考虑像元之间的距离,也没有充分考虑图像局部邻域先验特征,针对上述问题,提出一种结合标号场先验特征和像元距离动态估计先验参数的方法,并在先验能量中定义了观测场像元之间的影响系数,似然能量函数中引入Sobel算子描述观测场像元之间的关系,最后结合分水岭算法消除碎屑小区域进一步优化分割结果。通过Merced Land Use Dataset场景分类数据集进行了相关实验,结果表明该方法可以有效应用于遥感图像分割工作中。 展开更多
关键词 马尔可夫随机场 分水岭算法 贝叶斯法则 混淆矩阵 遥感图像分割
下载PDF
基于朴素贝叶斯的大数据模糊随机挖掘仿真 被引量:1
7
作者 陈晓姗 张国华 《计算机仿真》 北大核心 2023年第11期428-432,共5页
提出基于朴素贝叶斯的大数据模糊随机挖掘仿真方法,为用户挖掘海量数据特征并从中发现可用数据提供有效途径。该方法依据数据间的关联规则,对具备非线性特征的大数据进行融合处理,利用模糊层次聚类算法依据融合后大数据获取大数据语义... 提出基于朴素贝叶斯的大数据模糊随机挖掘仿真方法,为用户挖掘海量数据特征并从中发现可用数据提供有效途径。该方法依据数据间的关联规则,对具备非线性特征的大数据进行融合处理,利用模糊层次聚类算法依据融合后大数据获取大数据语义关联特征;将语义关联特征作为朴素贝叶斯分类器的输入,输出大数据模糊随机挖掘结果。仿真结果表明,上述方法融合大数据时的关联规则支持度最大为100%,大数据融合效果较好;在大数据量为100GB时,其提取大数据语义关联特征时的概率化特征条件引入量高达96%;模糊随机挖掘大数据时,大数据空间聚焦能力较好,可有效实现大数据模糊随机挖掘。 展开更多
关键词 朴素贝叶斯 大数据 模糊随机挖掘 关联规则
下载PDF
基于多目标调节的东庄水库运行可靠性研究
8
作者 孙军平 许建建 张飞儒 《水利与建筑工程学报》 2023年第6期190-196,共7页
为了解决东庄水库供水系统中需考虑供水、发电、生态等问题,通过构建调水调沙情景下考虑供水-发电-生态需求的东庄水库多目标调度模型,并采用随机森林算法提取东庄水库调度规则。结果表明:东庄水库可以保障下游河道的生态基流需求,多年... 为了解决东庄水库供水系统中需考虑供水、发电、生态等问题,通过构建调水调沙情景下考虑供水-发电-生态需求的东庄水库多目标调度模型,并采用随机森林算法提取东庄水库调度规则。结果表明:东庄水库可以保障下游河道的生态基流需求,多年平均生态供水量为1.66亿m^(3);供水受调水调沙的影响较大,中线、北线和南线多年平均缺水量分别约为0.33亿m^(3)、0.21亿m^(3)、0.07亿m^(3);t、t+1时段入库流量、t+1时段总需水量、t时段初、末水位是东庄水库调度函数的关键决策因子。研究成果可为未来东庄水库协调多目标间的竞争关系、制定科学的调度规则和提高东庄水库运行可靠性提供参考。 展开更多
关键词 东庄水库 多目标调度 随机森林 调度规则
下载PDF
天枢穴主治病症及配伍规律探析:基于随机临床对照试验 被引量:3
9
作者 陈伟 王成 +1 位作者 余曙光 吴巧凤 《按摩与康复医学》 2023年第8期97-102,共6页
目的:运用数据挖掘技术深入总结天枢穴现代主治病症及腧穴配伍规律。方法:检索自建库至2022年6月2日中国期刊全文数据库(CNKI)、万方数据知识服务平台(Wanfang)、维普资讯中文期刊服务平台(VIP)、中国生物医学文献数据库(SinoMed)、Pub... 目的:运用数据挖掘技术深入总结天枢穴现代主治病症及腧穴配伍规律。方法:检索自建库至2022年6月2日中国期刊全文数据库(CNKI)、万方数据知识服务平台(Wanfang)、维普资讯中文期刊服务平台(VIP)、中国生物医学文献数据库(SinoMed)、PubMed及Web of Science等数据库相关文献资料,建立天枢单穴、配伍主治病症和配伍腧穴等数据库。运用SPSS Modeler 18.0和Gephi 0.9.2等软件对纳入文献进行复杂网络分析、关联分析、聚类分析。结果:共纳入随机对照试验文献622篇,毫针刺、电针、穴位敷贴以及艾灸是天枢穴常用的干预措施。单穴主治病症12种,优势病症为便秘、腹泻等2种;配伍主治病症85种,优势病症为便秘、胃肠功能障碍、肠易激综合征、肥胖、腹泻、消化不良、溃疡性结肠炎等14种。高频配伍腧穴为足三里、中脘、上巨虚、关元等22穴,聚类分析得到4系6类天枢配伍组合,配伍经脉以任脉频次最高,阳经腧穴多于阴经。结论:天枢穴主治范围广泛,以消化系统疾病为主,便秘为核心优势病症,其高频配穴为足三里、中脘、上巨虚、关元。 展开更多
关键词 腧穴 天枢 数据挖掘 随机对照试验 主治病症 配伍规律
下载PDF
基于RS_Hash频繁项集的卫星载荷关联规则算法
10
作者 贾澎涛 温滋 《国外电子测量技术》 北大核心 2023年第2期9-15,共7页
遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。... 遥测数据是反映卫星健康状态的重要依据,对遥测载荷数据进行关联性分析,在一定程度上能反映出卫星的整体运行情况的好坏。针对传统关联规则算法存在效率低下、占用内存过多的问题,提出一种基于RS_Hash频繁项集的卫星载荷关联规则算法。首先对事务数据库使用动态随机抽样的方法获取样本数据,设计抽样误差和抽样停止规则来确定最优的样本容量;其次将抽取出的样本使用哈希桶来存储频繁项集,进而减少占用的内存,提高算法的运行效率;最后使用3个与载荷数据相似的公开数据集和卫星载荷数据集进行实验,结果表明,在公共数据集上取得了良好的效果,尤其是在具有大数据量级的卫星载荷数据集上效果明显,在不同事务长度和支持度的情况下,相较于Apriori、PCY、SON、FP-Growth、RCM_Apriori和Hash_Cumulate算法,RS_Hash算法在平均时间效率上分别提高了75.81%、49.10%、59.38%、50.22%、40.16%和39.22%。 展开更多
关键词 卫星载荷分析 关联规则 频繁项集 动态随机抽样算法 哈希桶
下载PDF
全球FTA数字贸易规则网络结构及其影响因素 被引量:2
11
作者 杨碧舟 彭羽 《经济理论与经济管理》 CSSCI 北大核心 2023年第7期88-100,共13页
本文在考虑协定深度的基础上,分析了全球FTA数字贸易规则网络的结构特征,并采用时态指数随机图模型(TERGM)方法对网络形成的影响因素进行实证分析。结果发现:第一,全球FTA数字贸易规则网络的无权和有权网络密度总体呈增长趋势,反映了网... 本文在考虑协定深度的基础上,分析了全球FTA数字贸易规则网络的结构特征,并采用时态指数随机图模型(TERGM)方法对网络形成的影响因素进行实证分析。结果发现:第一,全球FTA数字贸易规则网络的无权和有权网络密度总体呈增长趋势,反映了网络中各国的参与广度和深度均有所提升,欧盟、美国、新加坡处于FTA数字贸易规则网络的中心地位;第二,欧盟所在子群与其他子群间形成明显的核心-边缘结构,美国所在子群与中国及部分东盟国家所在子群之间联系紧密,表明美式规则在亚太地区的强大影响力;第三,基于TERGM的实证分析,证实了网络传递性在推动全球FTA数字贸易规则网络结构形成中的作用,这为中国积极应对美式和欧式FTA规则传播,加快形成中国FTA数字贸易规则范本并积极在全球范围内推广提供了政策依据。 展开更多
关键词 FTA数字贸易规则网络 协定深度 网络传递性 时态指数随机图模型
下载PDF
电网设备故障的智能处置策略规则库构建方法 被引量:5
12
作者 刘翀 《微型电脑应用》 2023年第3期149-152,共4页
为了准确处理电网设备故障、提升处置策略规则的智能性,提出电网设备故障的智能处理策略规则库构建方法。采用人工智能技术中的蚁群算法挖掘电网设备故障处置规则,模拟蚂蚁觅食过程构造规则,利用规则剪枝过程去除冗余规则,利用多个决策... 为了准确处理电网设备故障、提升处置策略规则的智能性,提出电网设备故障的智能处理策略规则库构建方法。采用人工智能技术中的蚁群算法挖掘电网设备故障处置规则,模拟蚂蚁觅食过程构造规则,利用规则剪枝过程去除冗余规则,利用多个决策树形成的随机森林算法构建电网设备故障智能处置策略规则库。实验结果显示,用所提方法构建的电网设备故障智能处置策略规则库能够准确匹配处置策略,解决配电网与输电网设备故障。 展开更多
关键词 电网 设备故障 规则库构建 蚁群算法 随机森林树
下载PDF
尺度分析对景观格局指标的影响 被引量:65
13
作者 布仁仓 李秀珍 +2 位作者 胡远满 常禹 贺红士 《应用生态学报》 CAS CSCD 2003年第12期2181-2186,共6页
采用优势规则和随机规则为基础的两种尺度分析方法 ,对分类的TM数据进行了尺度变换分析 .结果表明 ,随着尺度 (粒度 )增加 ,优势规则处理法使景观中优势类型的面积增加 ,非优势类型的面积减少 .随机规则处理法使各景观类型的面积基本上... 采用优势规则和随机规则为基础的两种尺度分析方法 ,对分类的TM数据进行了尺度变换分析 .结果表明 ,随着尺度 (粒度 )增加 ,优势规则处理法使景观中优势类型的面积增加 ,非优势类型的面积减少 .随机规则处理法使各景观类型的面积基本上保持不变 .随尺度变大 ,整个景观和多数类型的最大斑块面积指标增加 ;最小斑块面积等于尺度大小的平方 ;平均斑块面积都增加 ;斑块数迅速减少 .在优势规则系列中 ,多样性指标减小 ,而在随机规则处理中 ,基本没有变化 .聚集度随尺度的增大而减小 ,但测量尺度固定的情况下 ,随图分辨率的提高而增大 .随尺度的增加 ,Moran’sI指标减小 ,景观类型在空间上趋于随机分布 .但是测量尺度固定的情况下 ,随图分辨率的提高而增大 ,景观类型在空间上趋于聚集分布 . 展开更多
关键词 尺度 聚集度 优势规则 随机规则
下载PDF
尺度变换的正确率分析 被引量:7
14
作者 布仁仓 李秀珍 +2 位作者 胡远满 常禹 贺红士 《生态学报》 CAS CSCD 北大核心 2004年第4期659-665,T001,共8页
采用优势规则和随机规则为基础的尺度分析方法 ,对分类的 TM数据 (景观类型图 ,包含 8类型 )进行了尺度变换分析。随着尺度的增加 ,优势规则分析方法使景观中优势景观类型的面积增加 ,相反 ,面积较小的非优势景观类型的面积减少。随机... 采用优势规则和随机规则为基础的尺度分析方法 ,对分类的 TM数据 (景观类型图 ,包含 8类型 )进行了尺度变换分析。随着尺度的增加 ,优势规则分析方法使景观中优势景观类型的面积增加 ,相反 ,面积较小的非优势景观类型的面积减少。随机规则使各景观类型的面积基本上保持不变。随着尺度的增加 ,随机 K appa指数、位置 Kappa指数和标准 Kappa指数减少。在优势规则分析法中数量 Kappa指数减少 ,但在随机规则为基础的处理中它保持 10 0 %。优势规则处理中的正确率大于随机规则处理的。由景观类型的面积百分比引起的数量正确率在优势规则处理中增加 ,但在随机规则处理中保持 9.6 4 %不变 ;相反数量错误在优势规则处理中明显增加 ,但在随机规则处理中少量增加。偶然正确率保持 12 .5 0 %不变。位置正确率减少 ,相反位置错误明显增加。层和亚层水平上的位置正确率和错误的变化不明显 ,而网格水平上的位置正确率和错误大幅度减少。网格水平上的位置正确率和错误率决定了整个位置正确率和错误率 ,同时位置正确率和错误率基本上决定了整个正确率和错误率。标准Kappa指数大于等于 70 %作为选择依据 ,认为 2 10 m是优势规则处理法的尺度阈值 ,15 0 m是随机规则处理法的尺度阈值 ,欲提高尺度阈值 ,必须改变研究范围或? 展开更多
关键词 尺度分析 优势规则 随机规则 Kappa指数
下载PDF
一个保护私有信息的布尔关联规则挖掘算法 被引量:33
15
作者 罗永龙 黄刘生 +2 位作者 荆巍巍 姚亦飞 陈国良 《电子学报》 EI CAS CSCD 北大核心 2005年第5期900-903,共4页
 本文基于随机响应技术,提出了一种在保护隐私的关联规则挖掘中对数据进行伪装的方法;设计了在伪装的数据集上进行挖掘的算法;分析了算法的效率.实验结果表明,该算法在伪装的数据集上挖掘出的规则与原始规则相比,相对误差不超过2%,并...  本文基于随机响应技术,提出了一种在保护隐私的关联规则挖掘中对数据进行伪装的方法;设计了在伪装的数据集上进行挖掘的算法;分析了算法的效率.实验结果表明,该算法在伪装的数据集上挖掘出的规则与原始规则相比,相对误差不超过2%,并给出了使得相对误差最小时相关参数的取值. 展开更多
关键词 数据挖掘 关联规则 随机响应
下载PDF
CRF与规则相结合的中文地名识别 被引量:17
16
作者 李丽双 党延忠 +2 位作者 廖文平 黄德根 张颖 《大连理工大学学报》 EI CAS CSCD 北大核心 2012年第2期285-289,共5页
采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地... 采用递增式学习策略优化条件随机域(conditional random fields,CRF)的特征模板以提高中文地名的识别效果,结合语言学相关知识构建规则库,以弥补机器学习模型获取知识不够全面导致召回率偏低的不足,最终实现了CRF与规则相结合的中文地名识别系统.实验结果表明,采用CRF与规则相结合的方法识别中文文本中的地名是有效的,对Bakeoff2007NER任务的MSRA语料进行开放测试,召回率、精确率和F值分别为94.67%、92.35%和93.50%. 展开更多
关键词 中文信息处理 中文地名识别 条件随机域 基于规则的后处理
下载PDF
基于模糊规则的大坝混凝土施工跳仓排序研究 被引量:14
17
作者 钟登华 吴康新 +1 位作者 练继亮 任炳昱 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第5期1099-1102,1166,共5页
大坝混凝土施工跳仓排序受诸多约束条件的限制,同时遵从一定的施工原则,在施工过程中具有很强的随机性和不确定性。提出了基于模糊规则的大坝混凝土施工跳仓排序方法,根据大坝仓面浇筑的约束条件和施工原则,通过问卷调查、专家咨询等方... 大坝混凝土施工跳仓排序受诸多约束条件的限制,同时遵从一定的施工原则,在施工过程中具有很强的随机性和不确定性。提出了基于模糊规则的大坝混凝土施工跳仓排序方法,根据大坝仓面浇筑的约束条件和施工原则,通过问卷调查、专家咨询等方式获取相关知识,提取大坝施工跳仓排序的模糊规则。运用Markov随机过程理论来描述混凝土坝仓面浇筑的状态转移行为和特征,以状态转移概率矩阵表示当前状态转移到其他状态的概率,通过模糊规则的矩阵化计算推理来实现跳仓排序智能推理过程。基于模糊规则的跳仓排序方法可以全面了解系统整体动态特性,提高了施工系统仿真的精度,为大坝混凝土施工管理与控制提供决策依据。 展开更多
关键词 跳仓排序 随机过程 模糊规则 计算推理
下载PDF
基于L系统的开心形苹果树枝干模型 被引量:7
18
作者 刘阁 周国民 胡林 《安徽农业科学》 CAS 北大核心 2009年第16期7795-7796,7804,共3页
虚拟植物模型即用计算机模拟植物的生长发育。本文通过虚拟植物研究方法L系统理论的介绍,结合开心形苹果树的形态结构特点,使用虚拟植物模拟软件L-studio,动态地模拟出开心形苹果树在不同生长阶段的三维形态。通过使用随机规则控制树枝... 虚拟植物模型即用计算机模拟植物的生长发育。本文通过虚拟植物研究方法L系统理论的介绍,结合开心形苹果树的形态结构特点,使用虚拟植物模拟软件L-studio,动态地模拟出开心形苹果树在不同生长阶段的三维形态。通过使用随机规则控制树枝生长方式,并使用管道模型模拟枝干的加粗生长,实现了开心形苹果树的基本形态模型。 展开更多
关键词 L系统 开心形苹果树 随机规则 管道模型
下载PDF
基于随机化属性选择和邻域覆盖约简的集成学习 被引量:26
19
作者 朱鹏飞 胡清华 于达仁 《电子学报》 EI CAS CSCD 北大核心 2012年第2期273-279,共7页
提高分类模型的分类精度和可靠性是分类建模追求的目标.针对目前规则学习方法应用于分类时稳定性差以及分类精度低的问题,本文通过随机化邻域属性约简,搜索一组分类精度较高的属性子集,在不同的属性子集上采用邻域覆盖约简方法学习分类... 提高分类模型的分类精度和可靠性是分类建模追求的目标.针对目前规则学习方法应用于分类时稳定性差以及分类精度低的问题,本文通过随机化邻域属性约简,搜索一组分类精度较高的属性子集,在不同的属性子集上采用邻域覆盖约简方法学习分类规则,得到多个规则集.最后通过简单投票融合不同规则集上的分类结果获得对象的类别.实验表明,基于随机化邻域约简的集成学习方法分类性能优于或与其它相关的分类器相当,并且在噪声扰动下具有更强的鲁棒性. 展开更多
关键词 邻域 随机约简 集成学习 规则学习 分类器
下载PDF
基于CRF与规则相结合的中文电子病历命名实体识别研究 被引量:13
20
作者 翟菊叶 陈春燕 +2 位作者 张钰 陈玉娥 刘玉文 《包头医学院学报》 CAS 2017年第11期124-125,130,共3页
目的:探讨基于条件随机场(conditional random field,CRF)与规则相结合的中文电子病历命名实体识别。方法:基于条件随机场和规则相结合的方法来识别实体,将语言、关键词、词典等作为特征,识别出的结果再利用规则进行优化。结果:与条件... 目的:探讨基于条件随机场(conditional random field,CRF)与规则相结合的中文电子病历命名实体识别。方法:基于条件随机场和规则相结合的方法来识别实体,将语言、关键词、词典等作为特征,识别出的结果再利用规则进行优化。结果:与条件随机场的方法相比,条件随机场和规则相结合的方法识别准确率提高到78.98%,召回率和F值也提高到88.37%和83.41%。结论:基于条件随机场和规则相结合的方法来识别实体,准确率和召回率满足应用需求,为电子病历后续研究奠定了基础。 展开更多
关键词 命名实体识别 条件随机场 规则
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部