Web文本挖掘相关技术研究及应用被引量：1

Research and Application of Web Text Mining and Related Technologies

下载PDF

导出

摘要 Internet信息量迅猛增长,信息的海量化越来越突出,如何获取用户所需已日益突显出其重要性。文本挖掘技术能快速、有效地从大量数据中抽取有价值的信息,而Internet成为一个拥有大量Web文本资源的巨型数据库,大量异构、非结构化的Web文本对数据挖掘技术提出新的挑战。介绍Web文本挖掘的一般流程,重点分析Web文本挖掘中的几种关键技术。 With a great scale popularization of Internet and improvement of the information of corporation, how to obtain these big capacities of users＇s information has been the important research subject. Technologies of text mining can quickly and effectively abstract the useful information from the many data. Internet has become a giant data of Web text document, but a great scale of Isomerism and instructure Web text produces new challenge to data mining. Introduces the process of Web text mining, emphatically analyzes the related technologies.

作者金春霞

机构地区淮阴工学院计算机工程系

出处《现代计算机》 2009年第3期109-111,127,共4页 Modern Computer

关键词 WEB文本挖掘向量空间模型文本表示特征提取 Web Text Mining VSM Model Text Representation Characteristic Selection

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1曹聪聪,康耀红.Web数据挖掘研究[J].现代电子技术,2007,30(4):92-94. 被引量：9
2范亚芹,刘颖,李兴男.Web数据挖掘原理及实现[J].吉林大学学报（信息科学版）,2003,21(4):370-373. 被引量：17
3许高建.基于Web的文本挖掘技术研究[J].计算机技术与发展,2007,17(6):187-190. 被引量：19
4孙铁利,邓凯英.基于Web的文本信息检索技术[J].信息技术,2007,31(9):127-129. 被引量：3
5刘海峰,王倩,王元元.基于Web的文本检索位置加权模型研究[J].情报科学,2007,25(3):451-455. 被引量：5
6邹腊梅,肖基毅,龚向坚.Web文本挖掘技术研究[J].情报杂志,2007,26(2):53-55. 被引量：14

二级参考文献66

1金博,史彦军,滕弘飞,艾景波.自动文摘技术及应用[J].计算机应用研究,2004,21(12):13-15. 被引量：4
2杨思洛.搜索引擎的排序技术研究[J].现代图书情报技术,2005(1):43-47. 被引量：23
3侯汉清 ,章成志 ,郑红 .Web概念挖掘中标引源加权方案初探[J].情报学报,2005,24(1):87-92. 被引量：32
4易高翔,程耕国.Web文本挖掘研究[J].武汉科技大学学报,2005,28(1):72-74. 被引量：5
5许建潮,胡明.中文Web文本的特征获取与分类[J].计算机工程,2005,31(8):24-25. 被引量：24
6杨焱,孙铁利,邱春艳.个性化推荐技术的研究[J].信息工程大学学报,2005,6(2):84-87. 被引量：23
7胡健,陆一鸣,马范援.基于HTML文档结构的向量空间模型的改进[J].情报学报,2005,24(4):433-437. 被引量：10
8蒋凯,武港山.基于Web的信息检索技术综述[J].计算机工程,2005,31(24):7-9. 被引量：20
9薛为民,陆玉昌.文本挖掘技术研究[J].北京联合大学学报,2005,19(4):59-63. 被引量：63
10宋伟(SONG Wei).Internet数据挖掘原理及实现(Internet data mining principle and implementation)[J].重庆：重庆通信学院学报(Chongqing： Chongqing University of Post and Telecommunication ),2001,13(2):58-58.

共引文献56

1杨洋.Web数据挖掘的分析与探讨[J].装备制造技术,2006(5):63-64. 被引量：1
2谷兰英,王明常.多元地学信息系统的设计与实现[J].吉林大学学报（地球科学版）,2005,35(S1):155-158. 被引量：2
3曹士信,金鑫.空间军事系统综合集成研讨厅中基于移动Agent的数据挖掘结构研究[J].军事运筹与系统工程,2005,19(3):61-64.
4曼丽春,朱宏.WEB数据挖掘研究与探讨[J].西南民族大学学报（自然科学版）,2005,31(2):302-306. 被引量：10
5曼丽春,朱宏,杨全胜.Web数据挖掘研究与探讨[J].现代电子技术,2005,28(8):3-6. 被引量：29
6曹聪聪,康耀红.Web数据挖掘研究[J].现代电子技术,2007,30(4):92-94. 被引量：9
7霍丽峰.Web数据挖掘技术的研究[J].太原科技,2007(5):15-16. 被引量：2
8吴胜兵,周兴斌,胡玉娟,饶泓.基于关联规则的Web使用模式挖掘[J].计算机与现代化,2007(11):24-25. 被引量：1
9聂高辉,万常选.Web数据挖掘的原理与技术[J].科技管理研究,2008,28(1):143-144. 被引量：2
10李国慧.Web数据挖掘研究[J].电脑知识与技术,2008(2):592-594. 被引量：2

同被引文献7

1李颖,阎保平.Web文本挖掘在互联网信息统计中的研究与设计[J].微电子学与计算机,2005,22(1):62-65. 被引量：5
2鞠英杰.网络竞争情报研究——竞争者网站的挖掘与监测[J].情报理论与实践,2005,28(2):215-218. 被引量：15
3戴军湘,李陶,李燕辉.Web日志挖掘技术及其在电子商务中的应用[J].科学技术与工程,2005,5(15):1081-1086. 被引量：6
4王欣如.Web挖掘技术综述[J].计算机科学,2006,33(B12):127-129. 被引量：4
5陈荣旺,郭红.基于Web日志挖掘数据预处理技术的研究[J].福建电脑,2007(6):19-19. 被引量：1
6Jiawel Han;Micheline Kamber.数据挖掘概念与技术[M]{H}北京:机械工业出版社,2007218-230.
7张筱丹.Web文本挖掘的研究[J]{H}计算机与网络,2008(10):505-507.

引证文献1

1杨普旭.基于Web挖掘的企业竞争情报搜集工作研究[J].科技情报开发与经济,2014,24(1):109-111. 被引量：1

二级引证文献1

1胡安琪.2010-2014年我国企业竞争情报研究热点分布与趋势分析[J].图书情报研究,2016,9(1):74-79. 被引量：1

1金春霞.Web文本挖掘相关技术研究及应用[J].微型电脑应用,2009(7):54-56. 被引量：2
2邹腊梅,肖基毅,龚向坚.Web文本挖掘技术研究[J].情报杂志,2007,26(2):53-55. 被引量：14
3刘政凯.多媒体通信技术讲座──第一讲　信息高速公路[J].遥测遥控,1996,17(4):59-64.
4罗可,吴杰.巨型数据库中的数据采掘[J].计算机工程与应用,2001,37(20):88-91. 被引量：9
5赵瑞波.Oracle7 Spatial Data Option──Oracle7针对多维数据的扩展[J].电脑技术——Hello-IT,1996(2):10-11.
6史斌.大型数据库分区表研究[J].中国新通信,2016,0(11):116-117. 被引量：1
7洪禄岚.选择开放源代码数据库的考虑[J].科学时代,2004(05S):72-74.
8周傲英,周水庚,曹晶,范晔,胡运发.Approaches for Scaling DBSCAN Algorithm to Large Spatial Databases[J].Journal of Computer Science & Technology,2000,15(6):509-526. 被引量：12
9施国良,牟晓蓉,万旭.基于Web环境的企业竞争情报系统的模型设计[J].竞争情报,2010,6(1):23-27.
10唐葆君,邱菀华.企业危机预警熵模型设计及应用[J].系统工程理论与实践,2009,29(4):43-49. 被引量：1

现代计算机

2009年第3期

浏览历史

内容加载中请稍等...

Web文本挖掘相关技术研究及应用被引量：1

参考文献6

二级参考文献66

共引文献56

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

Web文本挖掘相关技术研究及应用 被引量：1

参考文献6

二级参考文献66

共引文献56

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

Web文本挖掘相关技术研究及应用被引量：1