期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
TF法则嵌入机制的动态局域加权网络模型
1
作者 马杰良 赵岳 《计算机应用》 CSCD 北大核心 2012年第5期1240-1243,1254,共5页
分析目前加权局域世界演化模型已取得的研究成果,在其基础上进行综合改进与完善,提出一种TF法则嵌入机制的动态局域加权网络模型(TF-DLW),该模型在演化过程中融入了TF法则和BBV权值动态演化机制。平均场理论和计算机模拟仿真均验证了该... 分析目前加权局域世界演化模型已取得的研究成果,在其基础上进行综合改进与完善,提出一种TF法则嵌入机制的动态局域加权网络模型(TF-DLW),该模型在演化过程中融入了TF法则和BBV权值动态演化机制。平均场理论和计算机模拟仿真均验证了该模型强度分布具有幂率特性。同时,计算机仿真中强度分布、边权分布以及度分布均出现了幂率肥尾现象,三角形结构的嵌入使得模型能更平稳地调节聚类系数的大小。实验表明,TF-DLW演化模型继承了许多复杂模型具有的幂率分布特性,而且可以快速平稳地调控簇系数的范围大小。 展开更多
关键词 局域加权网络 幂率肥尾 tf-DLW演化模型 BBV模型 tf法则
下载PDF
云边协同下可排序的属性基可搜索加密方案
2
作者 王正 曹素珍 +2 位作者 赵晓 周大伟 邢丹丹 《计算机工程》 CAS CSCD 北大核心 2023年第12期121-128,共8页
云计算和边缘计算技术可以有效解决网络边缘流量爆炸式增长带来的巨大存储和计算需求,但数据外包后用户的敏感信息可能会因云端和边缘设备的不完全可信出现泄露问题。为了解决该问题,提出云边协同下可排序的属性基可搜索加密方案。采用... 云计算和边缘计算技术可以有效解决网络边缘流量爆炸式增长带来的巨大存储和计算需求,但数据外包后用户的敏感信息可能会因云端和边缘设备的不完全可信出现泄露问题。为了解决该问题,提出云边协同下可排序的属性基可搜索加密方案。采用云边协同技术,将大量的密文存储到云服务器,使与其对应的加密索引上传到距离最近的边缘节点进行多关键字搜索和辅助解密,提高通信效率。采用TF-IDF规则使搜索结果中仅返回最符合用户需求的Top-k文件,从而实现多关键字排序。将用户的属性分为属性值和属性名,仅公开属性名,从而通过隐藏属性值的方式达到保护用户敏感信息的目的,同时采用在线/离线混合加密技术降低用户计算开销。基于DBDH和q-parallel DBDH假设证明了该方案在随机预言模型中的选择关键字攻击下满足不可区分性。分析结果表明,该方案在加密和陷门生成阶段的计算开销相比于次优方案降低了10%和25%,同时在解密阶段保持恒定,具有更高的密文检索效率。 展开更多
关键词 边缘计算 tf-IDF规则 可搜索加密 属性加密 策略隐藏
下载PDF
基于文本挖掘技术的高血压用药规律研究 被引量:1
3
作者 李艳红 沈瑞琪 欧敬民 《微型机与应用》 2017年第3期103-106,共4页
大数据时代的来临日益凸显数据挖掘技术的价值。文本挖掘作为数据挖掘的研究分支,对非结构化数据的知识发现有重要意义。高血压患病人群广,发病率高,治疗药物种类繁杂,寻找其中的用药规律,是临床医学的一个重要方向。基于文本挖掘技术,... 大数据时代的来临日益凸显数据挖掘技术的价值。文本挖掘作为数据挖掘的研究分支,对非结构化数据的知识发现有重要意义。高血压患病人群广,发病率高,治疗药物种类繁杂,寻找其中的用药规律,是临床医学的一个重要方向。基于文本挖掘技术,从在线医疗网站获取医患互动论坛数据,进行文本预处理,基于TF-IDF算法发现高血压常用中西药、非药物治疗、并发症用药特点等,结合关联规则算法挖掘"症-药"关系,有益于高血压的临床判断及用药研究。另外,验证了在线医疗网站医患互动数据用于疾病研究的可用性和效果。 展开更多
关键词 高血压 文本挖掘 用药规律 tf-IDF 关联规则
下载PDF
基于文本挖掘的高处坠落事故致因及关联规则分析 被引量:14
4
作者 李珏 李世杰 《长沙理工大学学报(自然科学版)》 CAS 2020年第2期61-67,74,共8页
高处坠落事故是建筑业中最常见的事故之一。为明确高处坠落事故致因,找到有效的事故预防措施,搜集了2012~2017年国内528例高处坠落事故调查报告,以R语言为平台,结合文本挖掘技术确定了事故中的32项事故致因,其中包括7项关键事故致因。利... 高处坠落事故是建筑业中最常见的事故之一。为明确高处坠落事故致因,找到有效的事故预防措施,搜集了2012~2017年国内528例高处坠落事故调查报告,以R语言为平台,结合文本挖掘技术确定了事故中的32项事故致因,其中包括7项关键事故致因。利用Apriori算法挖掘出事故致因之间的关联规则,通过可视化关联规则结果,得到了高处坠落事故发生过程中的事故致因因果关系,为高处坠落事故的预控提供参考。 展开更多
关键词 文本挖掘 高处坠落事故 事故致因 R语言 tf-IDF算法 关联规则 APRIORI算法
下载PDF
基于关联规则的铁路信号设备故障诊断方法 被引量:9
5
作者 张振海 张湘婷 《铁道标准设计》 北大核心 2022年第4期175-181,共7页
为提升铁路信号设备的故障处理效率,在对故障文本信息分析的基础上,提出一种基于关联规则的铁路信号设备故障诊断方法。由于故障文本信息存在不规范性和高维性,首先采用TF-IDF(Term Frequency and Inverted Document Frequency)算法提... 为提升铁路信号设备的故障处理效率,在对故障文本信息分析的基础上,提出一种基于关联规则的铁路信号设备故障诊断方法。由于故障文本信息存在不规范性和高维性,首先采用TF-IDF(Term Frequency and Inverted Document Frequency)算法提取故障文本信息中的故障特征,根据故障特征、故障类型、故障原因建立故障诊断模型。采用改进的FP-Growth(Frequent Pattern Growth)算法,通过权重定义项的支持度,依据频繁1-项集划分各项的数据库子库,并构造每项的条件FP-Tree,减少内存占用空间,提高运行速率,挖掘出具有维修指导意义的关联规则,进行故障诊断与维修决策。研究结果表明,本方法运行时间优于传统的FP-Growth算法,平均诊断准确率比案例推理算法和贝叶斯网络算法提高了10.35%和11.44%,可用于故障文本信息的潜在规律挖掘,简化故障诊断流程。 展开更多
关键词 铁路信号设备 故障诊断 关联规则 数据挖掘 tf-IDF算法 FP-GROWTH算法
下载PDF
关联规则在健康文本信息挖掘中的应用 被引量:1
6
作者 白玲玲 韩天鹏 《阜阳师范学院学报(自然科学版)》 2019年第3期43-48,共6页
随着计算机技术的发展,各个领域中的大多数文献都已数字化。本文主要使用健康文档作为原始数据,通过Web创建的健康数据,利用文本挖掘技术提取关联特征信息。使用Apriori挖掘算法,分析创建事务中的关键字的关联规则,并生成关联关键字。使... 随着计算机技术的发展,各个领域中的大多数文献都已数字化。本文主要使用健康文档作为原始数据,通过Web创建的健康数据,利用文本挖掘技术提取关联特征信息。使用Apriori挖掘算法,分析创建事务中的关键字的关联规则,并生成关联关键字。使用TF-C-IDF权重和关联关键字从健康数据中提取关联特征。根据在精度,召回率,F-measure和效率值方面的实验评估表明其性能很高。 展开更多
关键词 数据挖掘 文本挖掘 关联规则 APRIORI tf-IDF
下载PDF
基于微博转发的社交网络模型 被引量:2
7
作者 陈骁 黄曙光 秦李 《计算机应用》 CSCD 北大核心 2015年第3期638-642,共5页
探究微博转发网络的构建机制有助于深刻理解信息在微博平台上的传播过程,得出针对微博营销、舆论管控的有效策略和建议。针对这一问题,提出了一种有向加权网络模型。根据微博在转发过程中被多次转发的现象,在模型建立过程中,在节点间连... 探究微博转发网络的构建机制有助于深刻理解信息在微博平台上的传播过程,得出针对微博营销、舆论管控的有效策略和建议。针对这一问题,提出了一种有向加权网络模型。根据微博在转发过程中被多次转发的现象,在模型建立过程中,在节点间连边时引入三角连接机制,并且用连边的方向选择表征了活跃用户和知名用户的不同行为特征,同时考虑了权值的动态演化过程。理论分析和仿真实验表明模型的强度分布、度分布、强度-度的相关性均服从幂律分布,幂指数为1~3,而且具有高聚类、短路径的特点,平均聚类系数可达0.42,平均路径长不超过6,同时采集了微博转发的实际数据验证了模型的正确性。 展开更多
关键词 微博转发网络 有向加权网络 拓扑性质 三角构成规则 幂律分布
下载PDF
基于混合向量模型的中文评论情感分析 被引量:3
8
作者 陈曦 朱小栋 +1 位作者 高广阔 肖芳雄 《计算机工程》 CAS CSCD 北大核心 2020年第1期309-314,共6页
为解决TF-IDF模型表达情感信息不足的问题,提出一种情感Senti模型,通过该模型提取文本中的情感信息,包括句子中积极/消极的情感词、否定词、转折词以及程度副词,考虑标点符号在句子中起到的情感作用,利用情感词典和语义规则提取情感信息... 为解决TF-IDF模型表达情感信息不足的问题,提出一种情感Senti模型,通过该模型提取文本中的情感信息,包括句子中积极/消极的情感词、否定词、转折词以及程度副词,考虑标点符号在句子中起到的情感作用,利用情感词典和语义规则提取情感信息,生成相应的情感矩阵。在此基础上,与TF-IDF模型进行拼接,形成混合向量模型。实验结果表明,与只运用TF-IDF模型相比,混合向量模型精确度更高,具有较好的分类效果。 展开更多
关键词 语义规则 tf-IDF模型 混合向量化 多层感知机 汉语语料库
下载PDF
融入情感信息词向量的评论文本情感分析方法 被引量:9
9
作者 吕妹园 张永健 +1 位作者 张永强 孙胜娟 《河北科技大学学报》 CAS 北大核心 2021年第4期380-388,共9页
为了解决分布式词表示方法因忽略词语情感信息导致情感分类准确率较低的问题,提出了一种融入情感信息加权词向量的情感分析改进方法。依据专属领域情感词典构建方法,结合词典和语义规则,将情感信息融入到TF-IDF算法中,利用Word2vec模型... 为了解决分布式词表示方法因忽略词语情感信息导致情感分类准确率较低的问题,提出了一种融入情感信息加权词向量的情感分析改进方法。依据专属领域情感词典构建方法,结合词典和语义规则,将情感信息融入到TF-IDF算法中,利用Word2vec模型得到加权词向量表示方法,并运用此方法对采集到的河北省旅游景点的评论文本与对照组进行对比实验。结果表明,与基于分布式词向量表示的情感分析方法相比,采用融入情感信息加权词向量的改进方法进行情感分析,积极文本的准确率提高了6.1%,召回率提高了6.6%,F值达到了90.3%;消极评论文本的准确率提高了6.0%,召回率提高了7.2%,F值达到了89.6%。因此,融入情感信息加权词向量的情感分析改进方法可以有效提高评论文本情感分析的准确率,为用户获得更为准确的评论观点提供参考。 展开更多
关键词 自然语言处理 语义规则 情感信息 tf-IDF Word2vec 加权词向量 情感分析
下载PDF
古日古木类方剂治疗肝病的信息学研究
10
作者 刘一波 周保昌 +3 位作者 丁鑫 武昱洁 付海琪 李旻辉 《中药药理与临床》 CAS CSCD 北大核心 2023年第11期104-110,共7页
目的:对古日古木类方剂干预肝病的组方规律用药特征等进行信息学研究。方法:通过收集整理《蒙医方剂全书》中干预肝病的古日古木类方剂,运用R语言技术和TF-IDF模型等对其进行规律挖掘和分析。结果:收集73首干预肝病的古日古木方剂,涉及... 目的:对古日古木类方剂干预肝病的组方规律用药特征等进行信息学研究。方法:通过收集整理《蒙医方剂全书》中干预肝病的古日古木类方剂,运用R语言技术和TF-IDF模型等对其进行规律挖掘和分析。结果:收集73首干预肝病的古日古木方剂,涉及医书22部,药物132种,使用频率最高的为红花,高频药物(频数>10)药性以凉为主,占比69%,药味苦味占比最高为40%。对于虚损型肝病、热型肝病、血瘀型肝病、其他肝病的TF-IDF模型识别度最高的药物分别为川楝子、木香、麻黄、紫花地丁。共整理出关联规则40条,其中天竺黄配伍红花和五灵脂配伍红花的支持度最高。结论:古日古木方剂干预肝病以红花为核心,用药多苦甘合用,依据具体证型则有寒凉峻剂,温凉兼举,凉平缓剂。 展开更多
关键词 古日古木 R语言 tf-IDF 肝病 用药规律
原文传递
模糊规则算法在教育信息分类中的应用 被引量:1
11
作者 梁文超 徐朝军 沈书生 《现代图书情报技术》 CSSCI 北大核心 2011年第1期94-98,共5页
以中小学简介信息分类为例,在分析该类数据特征项少、权重不均等特点的基础上,采用去噪处理、基于模糊集的同义处理等策略构建类别特征库,并以特征库为依据,使用模糊规则构建分类模型,实现对短文本数据的分类。实验结果表明:对于类别特... 以中小学简介信息分类为例,在分析该类数据特征项少、权重不均等特点的基础上,采用去噪处理、基于模糊集的同义处理等策略构建类别特征库,并以特征库为依据,使用模糊规则构建分类模型,实现对短文本数据的分类。实验结果表明:对于类别特征项较少、权值分布不均的短文本分类,模糊规则分类优于VSM、Rocchio等分类算法。 展开更多
关键词 tf—IDF 模糊规则 分类
原文传递
基于语义匹配的外语翻译机器人自动问答检索研究 被引量:2
12
作者 李星 《自动化与仪器仪表》 2022年第2期138-141,共4页
为提高外语翻译机器人自动问答的准确率,提出一种基于TF-IDF+语义匹配+深度学习的问答匹配方法。为提高问题检索的准确率,采用TF-IDF算法关键词匹配,以筛选出问题回复集;基于seq2seq模型进行语义相似度计算,以产生问题回复集,引入Dual-E... 为提高外语翻译机器人自动问答的准确率,提出一种基于TF-IDF+语义匹配+深度学习的问答匹配方法。为提高问题检索的准确率,采用TF-IDF算法关键词匹配,以筛选出问题回复集;基于seq2seq模型进行语义相似度计算,以产生问题回复集,引入Dual-Encoder评分的方式筛选出最佳回复答案;构建检索回复的外语翻译机器人系统。通过搭建TensorFlow的测试环境进行测试结果表明,相较于其他匹配模型,构建的检索模型的匹配准确率更高,且系统性能更好,可实现外语翻译机器人的精准检索对话。 展开更多
关键词 规则匹配 外语翻译 机器人 tf-IDF算法 检索对话
原文传递
基于深度学习与需求规则融合的学术文献“目标数据”抽取模型构建与应用——以南海数字资源为例 被引量:6
13
作者 彭玉芳 陈将浩 《情报科学》 CSSCI 北大核心 2022年第1期141-147,157,共8页
【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度学习方法从大量的学术文献中... 【目的/意义】从海量的学术文献内容中,抽取科研人员所需要的目标数据,一方面有助于提高研究者的科研效率,另一方面有利于改善目前文献数据库的检索服务。【方法/过程】根据科研人员的学术需求,首先通过深度学习方法从大量的学术文献中抽取目标数据。其次使用NER和TF-IDF抽取目标数据的"5W"规则,接着对目标数据做第二层需求规则过滤,凡是满足"5W"规则的数据,被鉴定为目标数据。最后对目标数据做第三层人工校验,最终生成学术文献"目标数据"。【结果/结论】本文构建的学术文献"目标数据"抽取模型的准确率可达0.88,再融合"5W"规则的过滤和最后的人工校验,不仅有利于提高科研工作者的学术文献查准率,而且一定程度上辅助文献数据库机构的检索工作。【创新/局限】深度学习与需求规则融合,实现学术文献的检索结果从学术文献的题录信息层面到进入学术文献内容的数据层面。 展开更多
关键词 深度学习 命名实体识别 词袋模型 tf-IDF “5W”规则
原文传递
基于主题时态关联的科学领域研究演化识别 被引量:3
14
作者 田依林 李星 《情报科学》 CSSCI 北大核心 2021年第5期146-155,共10页
【目的/意义】从主题时态的角度,构建主题时态关联的科学领域研究演化的识别方法,为研究人员精准把握领域发展轨迹和科研创新提供参考。【方法/过程】提出基于主题时态关联的领域研究演化识别三阶段模型。首先利用TF-IDF模型提取领域文... 【目的/意义】从主题时态的角度,构建主题时态关联的科学领域研究演化的识别方法,为研究人员精准把握领域发展轨迹和科研创新提供参考。【方法/过程】提出基于主题时态关联的领域研究演化识别三阶段模型。首先利用TF-IDF模型提取领域文献数据集的特征词;再以特征词作为关联规则算法的挖掘条件,生成并过滤主题时态;最后,依据主题时态关联关系和强度值,构建主题时序演化路径可视化图谱进行领域研究演化识别分析。【结果/结论】以在线评论有用性领域外文科技文献为实证研究对象进行主题时态关联演化分析,识别出影响因素有用性、消费者意愿及应用、研究理论技术和有用性排序等主要领域研究的发展演化过程,验证了方法模型的有效性。【创新/局限】清晰地描绘了主题在时间序列上形成、发展和关注强度的动态演化过程,使得主题演进脉络和关联更加具有可读性,但样本数据未实现全覆盖,对领域研究的整体态势分析不够全面。 展开更多
关键词 主题时态 tf-IDF模型 关联规则 层次聚类 研究演化 在线评论
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部