期刊文献+

基于规则的中文时间词和数词的自动识别算法 被引量:2

Chinese Time Words and Numerals Automatic Segmentation Method Based on Rules
下载PDF
导出
摘要 对中文时间词和数词在文本中的常见形式进行归纳,以此为基础构建用于识别时间词、数词的规则集,提出一个基于规则的时间词和数词自动识别算法,并对该算法在竞争情报分析领域和机器翻译领域中的应用价值进行论述。 This paper firstly generalizes the formats of Chinese time words and numerals appearing in the text. Based on them, this paper then sets up a rule sets for recognition, proposes a method about Chinese time words and numnerals based on rules and discusses its application value in competitive intelligence analysis as well as machine translation field at last.
出处 《现代图书情报技术》 CSSCI 北大核心 2007年第3期46-50,共5页 New Technology of Library and Information Service
关键词 词语切分 信息抽取 规则 Word segmentation Information extraction Rule
  • 相关文献

参考文献7

二级参考文献88

共引文献196

同被引文献21

  • 1李君婵,谭红叶,王风娥.中文时间表达式及类型识别[J].计算机科学,2012,39(S3):191-194. 被引量:9
  • 2车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量:63
  • 3李向阳,苗壮,肖江.无结构文本信息抽取综述[J].军事通信技术,2004,25(2):31-36. 被引量:3
  • 4贺瑞芳,秦兵,刘挺,潘越群,李生.基于依存分析和错误驱动的中文时间表达式识别[J].中文信息学报,2007,21(5):36-40. 被引量:21
  • 5Zhang Y M, Zhou J F. A Trainable Method for Extracting Chinese Entity Names and Their Relations. In:Proceedings of the Second Chinese Language Processing Workshop, Hong Kong,2000.
  • 6Barzilay R, Lee L. Catching the Drift: Probabilistic Content Models. with Application to Generation and Summarization, HLT - NAACL 2004:113 - 120.
  • 7菅小艳,郑家恒.基于HMM的农作物信息抽取:自然语言理解与大规模内容计算.,2005(10).25—28.
  • 8Sigz.垂直搜索引擎技术.http://www.fullsearcher.com/n20051112144420735.asp(Accessed Sept.10,2006).
  • 9Available at http://crfpp.googlecode.com/svn/trunk/doc/index.html.
  • 10Mingli Wu,Wenjie Li,Qin Lu,et al.A Chinese Temporal Parser for Extracting And Normalizing Temporal Information[C] //Proceedings of international Joint Conference on Natural Language Processing (IJC-NLP),2005(3651):694-706.

引证文献2

二级引证文献15

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部