期刊文献+

基于PATTree的半结构化文本信息抽取范式研究 被引量:2

Pattern Discovery of Semi-structured Information Extraction Based on PATRICIA Tree
下载PDF
导出
摘要 信息抽取器在信息抽取领域是一个很重要的部分,而抽取器的研制通常要依靠抽取规则来实现。以前是利用使用者的使用模式或记录,找出相关的抽取规则。而利用PAT Tree可以直接从半结构化的Web的资料中,找出抽取规则。
作者 曹进军
出处 《情报杂志》 CSSCI 北大核心 2007年第7期55-58,共4页 Journal of Intelligence
基金 天津市"十一五"教育规划项目"本科生教学参考信息管理与服务系统"(编号:G173)研究成果
  • 相关文献

参考文献8

  • 1周慧贞,廖先军.军校图书馆统一检索系统的研究与设计[J].现代图书情报技术,2006(10):34-37. 被引量:3
  • 2C H Chang,S C Lui.IEPAD:Information Extraction Based on Pattern Discovery.In the Proceedings of the Tenth International Conference on World Wide Web,2001;(6)
  • 3N Ashish,C A Knoblock.Semi-automatic Wrapper Generation for Internet Information Sources.Second IFCIS Conference on Cooperative Information Systems (CoopIS),South Carolina,June 1997
  • 4S Brin.Extracting Patterns and Relations from the World Wide Web.International Workshop on the Web and Databases (WebDB'98),1998;(3)
  • 5Morrison D R.PATRICIA-Practical Algorithm to Retrieve Information Coded in Alphanumeric.Journal of the Association for Computing Machinery,1968;15(4)
  • 6杨文峰,李星.基于PAT TREE统计语言模型与关键词自动提取[J].计算机工程与应用,2001,37(15):17-19. 被引量:12
  • 7杜可亮,李星,杨文峰.用PAT Tree构建Internet搜索引擎分布式数据库[J].计算机应用,2002,22(9):4-6. 被引量:2
  • 8R Gaizauskas,Y Wilks.Information Extraction:Beyond Document Retrieval.Computational Linguistics and Chinese Language Processing,1998;(2)

二级参考文献8

共引文献14

同被引文献11

引证文献2

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部