基于层次聚类算法的WEB文本挖掘技术研究
被引量:1
摘要
本文分析了目前信息检索存在的问题,介绍了WEB文本挖掘的概念及处理过程,并提出了两种基于层次聚类的WEB文本挖掘技术并给予分析。
出处
《福建电脑》
2011年第3期40-41,共2页
Journal of Fujian Computer
参考文献5
-
1尹松,周永权,李陶深.数据聚类方法的研究与分析[J].航空计算技术,2005,35(1):63-66. 被引量:16
-
2王实,高文.数据挖掘中的聚类方法[J].计算机科学,2000,27(4):42-45. 被引量:88
-
3G.Salton,A.Wong,C.S,Yang,A Vector Space Model for Automatic Indexing.Communications of the ACM,1975,18 (5),pp613-620.
-
4王继成,潘金贵,张福炎.Web文本挖掘技术研究[J].计算机研究与发展,2000,37(5):513-520. 被引量:275
-
5Douglas Fisher.Improving Inference through Conceptual Clustering,pp.461-465,Proceedings AAAI-87 Sixth National Conference on Artificial Intelligence,July 13-17,1987,Seattle,WA.AAAI Press.
二级参考文献11
-
1Zalane O R,Proc of 1998ACM-SIGMOD Conf onManagement of Data.Seattle,1998年,581页
-
2Wang Ke,Newport Beach,1997年
-
3Salton G,Commun ACM,1975年,18卷,5期,613页
-
4HartJiaWei Kamber.数据挖掘概念与技术[M].北京:机械工业出版社,2001..
-
5Ester, Kriegel, Sander, et al. A Density - Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C].In :Proceedings of the Second International Conference on Knowledge Discovery and Data Mining (KDD'96), Portland, Oregon, 1996:226-231.
-
6Schikuta ,Erhart. The BANG - clustering System : Gridbased Data Analysis[C]. In: Proceedings of the Second International Symposium IDA - 97,Iasndon,UK, 1997.Springer - Verlag Lecture Notes in Computer Science, 1997,1280:513 - 524.
-
7Wei Wang, Jiong Yang, and Richard Muntz. STING: A statistical information grid approach to Spatial Data Mining[C].In :Proceedings of the 23rd VLDB Conference, Athens, Greece, 1997:186 - 195.
-
8邹涛,王继成,张福炎.基于WWW的资料搜集系统的设计与实现[J].情报学报,1999,18(3):195-201. 被引量:32
-
9李聪,张勇,高智.一种新的聚类算法[J].模式识别与人工智能,1999,12(2):205-209. 被引量:9
-
10王实,高文,李锦涛.Web数据挖掘[J].计算机科学,2000,27(4):28-31. 被引量:119
共引文献375
-
1兰晓芳,刘霞,肖毅.基于Django的校友在线平台的设计与实现[J].办公自动化,2021,26(18):17-18. 被引量:3
-
2王志明,沙莎.Web文本挖掘技术在新闻主题检测中的应用研究[J].长沙大学学报,2007,21(5):58-60. 被引量:2
-
3任建华,汪赫瑜.数据挖掘语言标准化的意义及应用[J].东北大学学报(自然科学版),2004,25(z1):176-178.
-
4张脂平,林世平.Web文本挖掘中特征提取算法的分析及改进[J].福州大学学报(自然科学版),2004,32(z1):63-66. 被引量:1
-
5杨斌,孟志青.一种文本分类数据挖掘的技术[J].湘潭大学自然科学学报,2001,23(4):34-37. 被引量:10
-
6赵娜,臧景才.多标记传播聚类算法在电子商务中的应用[J].青海大学学报(自然科学版),2009,27(1):85-88.
-
7李爱国,白冰.基于内容图像检索的Web搜索器[J].郑州大学学报(理学版),2009,41(2):60-62. 被引量:1
-
8周云真,舒建文,王平根.数据挖掘在基于WEB的智能远程教育中的应用[J].文教资料,2006(27):154-155. 被引量:1
-
9郑泠.Web数据挖掘技术应用[J].科技经济市场,2006(12):302-303.
-
10姚轶.浅谈网络文本挖掘分类[J].科技风,2009(3). 被引量:1
同被引文献5
-
1许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,17(6):187-190. 被引量:19
-
2Da Costa,M.G.Zhiguo Gong.Web Structure Mining:an Introduction.In:IEEE International Conference,2005(27):6.
-
3李晓黎(导师:史忠植).Web信息检索与分类中的数据采掘研究[D].中国科学院研究生院博士论文,2001.38-39.
-
4夏志禹(导师:刘应安).贝叶斯网络结构学习算法研究[D].南京林业大学硕士论文.2010-06-01.
-
5李卓君.Web文本挖掘技术探析[J].现代商贸工业,2011,23(23):327-328. 被引量:1
-
1李朝健,肖建华.常用聚类算法比较分析[J].电脑知识与技术(过刊),2007(2):471-472. 被引量:8
-
2郭月江,严馨,刘小惠,余正涛,线岩团,莫源源.融合主题和要素的汉柬可比语料获取方法[J].云南大学学报(自然科学版),2017,39(3):360-368. 被引量:3
-
3丁晓阳,罗阳,王建新.层次化聚类在分布式计算环境中的剪枝策略[J].计算机应用与软件,2017,34(5):261-267. 被引量:1