期刊文献+

大规模网络数据的在线挖掘系统的研究与开发 被引量:2

Research and Development of Online Mining System of Large-Scale Network Data
下载PDF
导出
摘要 以网络上数据量最大、更新最快的网络新闻作为主要的数据源,对其检索与挖掘技术展开研究,构建一个大规模网络数据在线挖掘分析服务系统,以该系统作为平台,为用户提供廉价的、高可靠的、具备交互能力、实时的在线搜索和数据挖掘服务。对于该系统,主要研究其整体设计思路和各模块的算法思想。 Uses the online news which is of large amount and updated quickly as the main data source, studies the retrieval and data mining technology, and creates a platform based on large-scale network data analysis. This platform afford users cheap, reliable, interactive, and real-time data mining services. Mainly studis the overall design idea of this system and the main algorithm of the modules.
作者 陈耿锋
出处 《现代计算机》 2012年第15期8-12,共5页 Modern Computer
关键词 大规模新闻数据 分类 聚类 检索 Large-Scale Online News Data Sorting Clustering Retrieving
  • 相关文献

参考文献3

二级参考文献17

  • 1Jiawei Han, Micheline Kamber. Data Mining Concepts and Techniques[ M]. Morgan Kaufmann Publishers,2001.
  • 2S Brin, L Page. The Anatomy of a Large-seale Hypertextual Web Search Engine [ A ]. Proc of the 7th World-Wide Web Conf (WWW7) [C]. 1998.
  • 3Arul Prakash Asirvatham,Kraanthi Kumar Ravi. Web Page Classification Based on Document Structure[ EB/OL]. citeseer. ist. psu.edu/asirvatham01 web. html, 2001 - 05.
  • 4Craig Utley. SQL Server 2000 Web Application Developer's Guide [M]. McGraw-Hill, 2001.
  • 5林杰斌 刘明德 陈湘.数据挖掘与OLAP[M].北京:清华大学出版社,2003..
  • 6中文自动摘要系统的研究与实现:[哈尔滨工业大学工学博士学位论文]
  • 7McCallum A , Nigam K,Rennie J, Seymore K. Building Domain-Specific Search Engines with Machine Learning Techniques, Just Research 4616 Henry Street Pittsburgh, PA 15213, School of Computer Science Carnegie Mellon University Pittsburgh, PA15213
  • 8黄萱菁.大规模中文文本的检索、分类与摘要研究:[复旦大学博士学位论文]
  • 9Fu Weipeng, Shi Zhongzhi. Text Document Clustering and The Space of Concept on Text Document Automatically Generated.ICII 2001-Beijing, October 29-November 1, 2001
  • 10王永成.中文信息处理技术及其基础[M].上海:上海交通大学出版社,1990..

共引文献54

同被引文献17

  • 1林英.媒体新闻数据自动采集的实践与改进思路探讨[J].图书馆学研究(应用版),2010(9):38-41. 被引量:3
  • 2清华同方知网(北京)系统软件公司.kspider网络信息资源采集系统白皮书.[2013-08-18].http://www.docin.com/p-194428943.htmI.
  • 3张钰.网络舆情预测模型与平台的研究[D].北京:北京交通大学.2009.
  • 4时明达.bolg热点话题发现及其作者声誉度研究[D].大连:大连理工大学.2007.
  • 5Autonomy安全与监控[EB/OL].[2015-11-01].http://autonomy.tom.cn/content/Solutions/Security_Survellance.zh.html.
  • 6Wilson T,Hoffmann P,Somasundaran S.Opinion finder, a system for subjectivity analysis [C]//Mooney RJ,ed.Proc of the (HLT/ EMNLP 2005) Demonstration Abstracts.Morristown:ACT,2005.347-354.
  • 7Batra S,RaoD.Entity based sentiment analysis on Twitter[EB/OL]. [2016 -08 -29].http://nlp.stanford.edu/courses/c s224n/2010/ reports/drao-sidbatra.pdf.
  • 8Jiang L,Yu M,Zhou M,et al.Target-dependent Twitter sentiment classification[C]//Meeting of the Association for Computational Linguistics: Human Language Technologies.Association for Computational Linguistics,2011:151 - 160.
  • 9Meng X,Wei F,Liu X,et al.Entity-centric topic-oriented opinion summarization in twitter[C]//ACM SIGKDD International Con- ference on Knowledge Discovery and Data Mining.ACM,2012: 183-184.
  • 10赵琦,刘建华,冯浩然.从ACE会议看信息抽取技术的发展趋势[J].现代图书情报技术,2008(3):18-23. 被引量:6

引证文献2

二级引证文献9

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部