期刊文献+

基于XML的Web中文文本挖掘系统设计 被引量:3

Design of A Web Text Mining System Based on XML
下载PDF
导出
摘要 语料文本的挖掘和文本语料库的建设对语言学研究具有重要意义,因此语料文本的挖掘和文本语料库的建设就越来越值得探讨。但由于Web上文本的半结构化特征和异构文本源的问题,在Web上的文本挖掘具有很多困难。本文提出了将XML技术与Web挖掘技术相结合,根据研究者的个人需求定制个性化的Web中文文本挖掘系统框架和实现方案,并给出了面向法律领域的Web文本挖掘系统LawsMiner的实例。 Corpus plays more and more important role in the modern language studies. It's worth studying on text mining and corpus building for the linguists. This paper points out a web Chinese text mining system which uses XML technique in web mining to set a personal web text mining. A system named LawsMiner focusing on law texts is applied.
出处 《术语标准化与信息技术》 2004年第3期31-35,共5页 Terminology Standardization & Information Technology
关键词 中文文本 XML 半结构化 WEB文本挖掘 异构 语料库 定制 研究者 个人需求 建设 web, text mining, LawsMiner, XML, corpus
  • 相关文献

参考文献3

二级参考文献7

共引文献9

同被引文献7

引证文献3

二级引证文献23

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部