用关联分析技术识别不良信息特征项的新方法被引量：6

A New Method to Identify Keywords in Chinese Documents Using Association Analyzing Technology

下载PDF

导出

摘要不良信息特征项的挖掘精度制约着不良信息鉴别与过滤的效果。文章从数据挖掘的角度对不良信息特征项的识别进行研究,提出了一种自动高效地挖掘文档潜在特征项的新方法:首先对文档进行必要的预处理,包括自动分词、无用项过滤、项标引以及项的分箱操作等,然后利用数据挖掘中的关联分析技术识别文档中的特征项。试验结果验证了该方法的可行性。 The paper presents a novel data mining method to automatically identify

作者李宝林张翼英兰芸

机构地区南开大学信息技术科学学院辽宁商务职业学院天津科技大学计算机系

出处《计算机工程与应用》 CSCD 北大核心 2003年第28期39-41,共3页 Computer Engineering and Applications

基金天津自然科学基金资助(编号:023601411)

关键词信息过滤不良信息特征项关联分析 in Chinese documents.Firstly,it needs the Chinese documents to be pre -processed.Secondly,data mining technology will be used to mine strong association rules,which can acquire feature words of the document.The experiment shows that a system

分类号 TP274 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1李晓黎,刘继敏,史忠植.概念推理网及其在文本分类中的应用[J].计算机研究与发展,2000,37(9):1032-1038. 被引量：57
2刘斐.[D].山东工业大学,1999.
3Laurence A F Park et al.Internet Document Filtering Using Fourier Domain Scoring[J].PKDD 2001,LNAI 2168;2001.
4David Gilbert ,Michael Schroeder.FURY:Fuzzy unification and resolution based on edit distance[C].In:International Conference on Bioinformatics and Biomedical Egineering,IEEE,2000.
5刘斐.[D].山东工业大学,1999.

二级参考文献5

1史忠植，高级人工智能，1998年，206页
2陆汝钤，人工智能，1996年
3Lang K，Int’ l Conf on Machine Learning （ ICML ），1995年，331页
4Yang Y，Proc of the Seven-teenth Int’ l ACM SIGIR Conf on Research and Development in I，1994年，13页
5石纯一，人工智能原理，1993年

共引文献56

1张莉.网页自动分类技术概念分析[J].娄底职业技术学院学报（职教与经济研究）,2007(2):58-62.
2李莹,张晓辉,王华勇,常桂然.一种应用向量聚合技术的KNN中文文本分类方法[J].小型微型计算机系统,2004,25(6):993-996. 被引量：13
3杨创新,彭宏,杨沛.一种基于主题树模型的Web主题检索算法[J].计算机工程与应用,2004,40(16):184-187.
4杨创新.一种基于主题的Web预取算法研究[J].机电工程技术,2004,33(6):35-36.
5许增福,梁静国,田晓宇.基于FVSM和自组织映射网络的Web文本自动分类方法[J].哈尔滨工业大学学报,2004,36(9):1168-1172. 被引量：2
6张莉,康耀红,王曙光,张春元.中文网页自动分类现状的研究[J].福建电脑,2004,20(5):3-4. 被引量：1
7张晓辉,李莹,常桂然,赵宏.适于Internet新闻文本实时分类的动态向量空间模型DVSM[J].计算机科学,2004,31(6):64-67. 被引量：1
8杨创新,彭宏,莫卓斌.基于N层向量空间模型的Web主题检索算法[J].广东自动化与信息工程,2004,25(3):7-9.
9徐凤亚,罗振声.文本自动分类中特征权重算法的改进研究[J].计算机工程与应用,2005,41(1):181-184. 被引量：56
10WANGYun-hua,CHENShi-hong.Research of Web Documents Clustering Based on Dynamic Concept[J].Wuhan University Journal of Natural Sciences,2004,9(5):547-552.

同被引文献71

1温泽逢,袁华.基于内容的图像过滤新方法[J].通信学报,2006,27(z1):280-284. 被引量：3
2徐欣欣,袁华.一种基于自适应小波不变矩的色情图像过滤方法[J].清华大学学报（自然科学版）,2005,45(S1):1878-1881. 被引量：4
3杨金锋,傅周宇,谭铁牛,胡卫明.一种新型的基于内容的图像识别与过滤方法[J].通信学报,2004,25(7):93-106. 被引量：27
4朱丽红,赵燕平.Web挖掘研究综述[J].情报杂志,2004,23(7):2-5. 被引量：16
5宋华,戴一奇.一种用于内容过滤和检测的快速多关键词识别算法[J].计算机研究与发展,2004,41(6):940-945. 被引量：22
6涂承胜,陆玉昌.Web使用挖掘技术研究[J].小型微型计算机系统,2004,25(7):1177-1184. 被引量：37
7任家东,黄辉宇.基于人工神经网络的有害信息过滤智能决策系统[J].计算机工程,2004,30(16):149-150. 被引量：7
8戴稳胜,王福新,谢邦昌.数据挖掘的任务之一:分类[J].中国统计,2004,19(10):51-52. 被引量：1
9吕宏伟,唐小力,王申.网页内容过滤技术中的特征提取[J].计算机工程与应用,2004,40(31):145-146. 被引量：1
10孟小峰,周龙骧,王珊.数据库技术发展趋势[J].软件学报,2004,15(12):1822-1836. 被引量：176

引证文献6

1彭昱忠,元昌安,王艳,覃晓.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009,26(2):433-438. 被引量：19
2孙强,李建华,李生红.基于一类分类法的不良信息过滤模型[J].上海交通大学学报,2005,39(12):1993-1996. 被引量：7
3巩玉玺,张春海,韩彦稳.邮件过滤中基于关联分析的潜在特征词挖掘[J].青岛理工大学学报,2006,27(2):86-90. 被引量：2
4贾虹.基于Web使用挖掘的数字图书馆个性化服务[J].河南图书馆学刊,2006,26(4):58-62. 被引量：5
5李军,廖豪,陈洁,谭建龙.一种支持通道信息关联的多媒体数据流过滤模型[J].计算机科学,2010,37(12):22-25.
6邓一贵,伍玉英.基于文本内容的敏感词决策树信息过滤算法[J].计算机工程,2014,40(9):300-304. 被引量：32

二级引证文献63

1彭昱忠,元昌安,王艳,覃晓.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009,26(2):433-438. 被引量：19
2吴慧玲,沈建京,贺广生.基于不良文本信息过滤预处理方法的研究[J].网络安全技术与应用,2006(11):61-63. 被引量：2
3吴修琴.基于Web使用挖掘的个性化服务推荐[J].河北科技图苑,2007,20(3):4-6. 被引量：1
4王金龙.数据挖掘研究进展[J].青岛理工大学学报,2007,28(4):80-82. 被引量：11
5吴金学.基于概率潜在语义分析的文本聚类研究[J].青岛理工大学学报,2008,29(2):95-99. 被引量：3
6史嘉陵.数据挖掘在数字图书馆个性化服务中的应用[J].农业网络信息,2009(4):77-79. 被引量：9
7廖大容.知识挖掘技术在数字图书馆中的应用[J].农业网络信息,2009(4):89-91. 被引量：2
8崔虹燕.多层次多策略的主动信息安全过滤模型[J].兰州工业高等专科学校学报,2009,16(5):1-3.
9肖可,奉国和.1999～2008年国内文本分类研究文献计量分析[J].情报学报,2010,29(4):679-687. 被引量：6
10余波.微博的情报学意义探讨[J].图书情报工作,2010,54(22):57-60. 被引量：26

1李疆,张韶山.浅析企业网络安全问题及解决方案[J].民航科技,2003(3):11-12.
2侯俊谋.脸部扫描登录邮箱[J].科技创业,2012(10):20-21.
3方滨兴,郭云川,周渊.互联网信息内容安全的ICCON控制模型及评价[J].中国科学（F辑:信息科学）,2009,39(9):951-965. 被引量：10
4肖萍.圈存系统的安全性分析与防范[J].黑龙江科技信息,2008(11):71-71. 被引量：2
5陈天,刘文浩.相似度算法分析与比较研究[J].现代计算机,2012,18(12):18-20. 被引量：6
6周彦伟,吴振强,乔子芮.移动互联网可信匿名通信模型[J].计算机应用,2010,30(10):2669-2671. 被引量：2
7高良涛,杜洁.SRP协议及其安全改进[J].计算机工程与设计,2003,24(5):65-67. 被引量：2
8乐步东.分析关于电力调度与事件报警[J].山东工业技术,2017(1):165-165.
9弋英民,郑岗.一种利用字符特征变化的文本数字水印方法[J].微型电脑应用,2005,21(3):36-39. 被引量：17
10魏亮.通信网络安全分层及关键技术[J].网络电信,2004,6(9):67-70. 被引量：3

计算机工程与应用

2003年第28期

浏览历史

内容加载中请稍等...

用关联分析技术识别不良信息特征项的新方法被引量：6

参考文献5

二级参考文献5

共引文献56

同被引文献71

引证文献6

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

用关联分析技术识别不良信息特征项的新方法 被引量：6

参考文献5

二级参考文献5

共引文献56

同被引文献71

引证文献6

二级引证文献63

相关作者

相关机构

相关主题

浏览历史

用关联分析技术识别不良信息特征项的新方法被引量：6