关联规则在健康文本信息挖掘中的应用被引量：2

Application of association rules in health text information mining

下载PDF

导出

摘要随着计算机技术的发展,各个领域中的大多数文献都已数字化。本文主要使用健康文档作为原始数据,通过Web创建的健康数据,利用文本挖掘技术提取关联特征信息。使用Apriori挖掘算法,分析创建事务中的关键字的关联规则,并生成关联关键字。使用TF-C-IDF权重和关联关键字从健康数据中提取关联特征。根据在精度,召回率,F-measure和效率值方面的实验评估表明其性能很高。 With the development of computer technology, most of the literature in various fields has been digitized. This paper mainly uses health documents as source data, through the health data created by the Web, using text mining technology to extract the associated feature information. The Apriori mining algorithm was used to analyze the association rules for the keywords in the created transaction and generate the associated keywords. Association features are extracted from health data using TF-CIDF weights and associated keywords. Experimental evaluations based on accuracy, recall, F-measure and efficiency values indicate high performance.

作者白玲玲韩天鹏 BAI Lingling;HAN Tianpeng(Academic Affair Office,Fuyang Party Institute of CCP,Fuyang Anhui 236034,China;School of Computer and Information Engineering,Fuyang Normal University,Fuyang Anhui 236037,China)

机构地区中共阜阳市委党校教务处阜阳师范大学计算机与信息工程学院

出处《阜阳师范学院学报（自然科学版）》 2019年第3期43-48,共6页 Journal of Fuyang Normal University(Natural Science)

基金阜阳师范大学自然科学研究项目(2018FSKJ11) 阜阳市党校科研课(FYDXKT201937) 阜阳市规划课题(FSK2018051)资助

关键词数据挖掘文本挖掘关联规则 APRIORI TF-IDF data mining text mining association rules Apriori TF-IDF

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1刘博鹏,樊铁成,杨红.基于数据挖掘技术的学生成绩预警应用研究[J].四川大学学报（自然科学版）,2019,56(2):267-272. 被引量：34
2曹莹,苗志刚.基于向量矩阵优化频繁项的改进Apriori算法[J].吉林大学学报（理学版）,2016,54(2):349-353. 被引量：19
3梁珺,刘云.基于析取规则对不确定数据挖掘的优化研究[J].四川大学学报（自然科学版）,2016,53(4):788-792. 被引量：5
4刘云,向婵.基于虚构理论对不平衡数据集中少数类关联规则挖掘的研究[J].云南大学学报（自然科学版）,2017,39(1):33-38. 被引量：9
5赵官宝,刘云.一种基于位表的有效频繁项集挖掘算法[J].山东大学学报（理学版）,2015,50(5):23-29. 被引量：4
6韩天鹏,白玲玲,王浩.基于候选项集剪枝的Apriori算法的研究[J].阜阳师范学院学报（自然科学版）,2014,31(4):79-83. 被引量：4

二级参考文献54

1罗森林,马俊,潘丽敏编著.数据挖掘理论与技术[M].北京:电子工业出版社,2013.
2Ilayaraja M,Meyyappan T.Mining medical data to identify frequent diseases using Apriori algorithm[C]//2013 International Conference on Pattern Recognition,Informatics and Mobile Engineering(PRIME),2013:194-199.
3Kantardzic M.数据挖掘:概念、模型、方法和算法[M].王晓海,吴志刚.译.2版.北京:清华大学出版社,2013:1-13.
4Agrawal R,Imielinski T,Swami A.Mining association rules between sets of items in large databases.Proceedings of ACMSIGMOD Conference on Management of Data,1993:207-216.
5Park J S,Chen M S,Yu P S.An effective Hash-based algorithm for mining association rules[C]//Proceedings of ACM SIGMOD International Conference on Management of Data,1995:175-186.
6Prashant V,Mandot M.A comparative analysis of various cluster detection techniques for data mining[C]//2014 International Conference on Electronic Systems,Signal Processing and Computing Technologies,2014:357-361.
7HAN Jiawei, PEI Jian, YIN Yiwen. Mining frequent patterns without candidate generation[C]//Proceedings of the ACM SIGMOD International Conference on Management of Data. New York: ACM, 2000: 1-12.
8DONG Jie, HAN Min. BitTableFI: an efficient mining frequent itemsets algorithm[J]. Knowledge-Based Systems, 2007, 20:329-335.
9ZHANG Yan, ZHANG Fan, BAKOS J. Frequent itemset mining on large scale shared memory machines[C]//Proceedings of IEEE International Conference on Cluster Computing.Washington: IEEE Computer Society, 2011: 585-589.
10TRAN A N, DUONG H V, TRUONG T C, et al. Efficient algorithms for mining frequent itemsets with constraint[C]//Proceedings of the 3rd International Conference on Knowledge and Systems Engineering (KSE). Washington: IEEE Computer Society, 2011: 19- 25.

共引文献62

1胡世昌,李劲华,王常颖.基于二进制编码的Apriori改进算法[J].计算机应用研究,2020,37(2):398-400. 被引量：16
2齐娇娇.基于改进Apriori算法的运动员多属性训练数据挖掘模型构建及仿真[J].微型电脑应用,2018,34(12):137-139. 被引量：5
3刘云,向婵.基于虚构理论对不平衡数据集中少数类关联规则挖掘的研究[J].云南大学学报（自然科学版）,2017,39(1):33-38. 被引量：9
4白莹莹,申晨晨.基于关联规则挖掘的Apriori改进算法[J].电子技术与软件工程,2017(3):203-204. 被引量：6
5李建强,陈星旭,赵凯.基于PSO-SVR模型的凝汽器真空目标值预测[J].电力科学与工程,2017,33(2):66-72. 被引量：10
6张志宏,何海江,刘华富.由分类算法学习软件错误定位的关联测度[J].四川大学学报（自然科学版）,2017,54(4):728-734. 被引量：2
7刘云,黄亚飞.扩展算法在频繁行为模式分析中的优化研究[J].云南大学学报（自然科学版）,2018,40(2):236-242. 被引量：1
8刘庆贵,丁进良.基于改进Apriori关联规则挖掘的冷水机组故障诊断[J].暖通空调,2018,48(4):120-124. 被引量：4
9刘云,黄亚飞.可替代封闭模式对生产数据的优化分析[J].西北大学学报（自然科学版）,2018,48(2):191-198.
10杨珍,耿秀丽.考虑多粒度属性约简的关联规则挖掘研究[J].计算机工程与应用,2019,55(6):133-139. 被引量：9

同被引文献16

1郭丽.智能问答系统在校园智慧服务中的应用研究[J].轻工科技,2023,39(1):89-91. 被引量：2
2奉国和.文本分类性能评价研究[J].情报杂志,2011,30(8):66-70. 被引量：39
3韩文智.计算机文本信息挖掘技术在网络安全中的应用[J].华侨大学学报（自然科学版）,2016,37(1):67-70. 被引量：6
4邢翀.浅析计算机文本挖掘技术在网络安全中的应用[J].山东工业技术,2018(11):136-136. 被引量：4
5刘芬.计算机文本信息挖掘技术在网络安全中的应用[J].电脑迷,2018(9):32-32. 被引量：4
6卢亚辉,王辉.本科大数据公选课程群的实践与分析[J].工业和信息化教育,2019,0(8):21-26. 被引量：2
7沈婷婷.命名实体链接研究专利技术综述[J].科学与信息化,2019,0(24):14-14. 被引量：1
8杨飘,董文永.基于BERT嵌入的中文命名实体识别方法[J].计算机工程,2020,46(4):40-45. 被引量：103
9李珏,李世杰.基于文本挖掘的高处坠落事故致因及关联规则分析[J].长沙理工大学学报（自然科学版）,2020,17(2):61-67. 被引量：15
10段丹丹,唐加山,温勇,袁克海.基于BERT模型的中文短文本分类算法[J].计算机工程,2021,47(1):79-86. 被引量：77

引证文献2

1管祥甫,管子涵.计算机文本信息挖掘技术在网络安全中的应用[J].电子技术与软件工程,2019,0(21):184-185. 被引量：2
2蒋劲雨,文珊,姚曦娴,施新宇,屈璐瑶.基于BERT与关联规则的跨领域智能问答技术研究[J].信息记录材料,2024,25(11):139-141.

二级引证文献2

1王占忠.基于多文本数据的联通工单系统辅助研判技术[J].通讯世界,2020,27(2):73-75. 被引量：2
2王姝.计算机文本信息挖掘技术研究[J].数码设计,2020,9(15):4-4.

1本刊记者(整理).互联网医疗的未来[J].商周刊,2019,0(13):32-33.
2郭鑫鑫,王海燕.大数据背景下基于数据众包的健康数据共享平台商业模式构建[J].管理评论,2019,31(7):56-64. 被引量：34
3汪欣雨.基于Apriori关联规则的材料领域股票数据分析[J].全国流通经济,2019(20):161-162. 被引量：1
4金磊,高梓瀚,冯琛.情感识别算法应用现状及发展趋势研究[J].电子世界,2019,0(15):107-107. 被引量：1
5张国锋,吴国文.基于核函数的改进k-means文本聚类[J].计算机应用与软件,2019,36(9):281-284. 被引量：12
6张宁,徐敏敏.基于TF-IDF混合算法的微博舆情分析研究与应用[J].中国战略新兴产业（理论版）,2019,0(22):0124-0124.
7张孜铭,刘向,曾培春.知识发现视角下的文献量化:荟萃分析框架[J].情报杂志,2019,38(9):150-157. 被引量：4
8谢浩然,卫巍,杨志辉,邓居智,葛坤朋.基于TF-IDF的新型广播电视节目协同推荐流程[J].计算机与现代化,2019,0(9):65-71. 被引量：6
9Periyasamy Mondal,Neeraj Acharya.Method of Genetic Disease Gene Locus Analysis Based on Apriori Algorithm[J].Genetic Disease Study,2018,2(2):1-5.
10刘钰,余卓芮,李登辉,郑建业,梁天君,吴亦红.城市产业与建设用地的空间关联与影响因素[J].科技经济导刊,2019,0(19):5-6.

阜阳师范学院学报（自然科学版）

2019年第3期

浏览历史

内容加载中请稍等...

关联规则在健康文本信息挖掘中的应用被引量：2

参考文献6

二级参考文献54

共引文献62

同被引文献16

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

关联规则在健康文本信息挖掘中的应用 被引量：2

参考文献6

二级参考文献54

共引文献62

同被引文献16

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

关联规则在健康文本信息挖掘中的应用被引量：2