期刊文献+

汉语文本中特殊符号串的自动识别技术 被引量:2

Technique of Special Strings Automatic Recognition in Chinese Texts
下载PDF
导出
摘要 提出从组成形式和上下文语境两个方面来自动识别汉语文本中的各种特殊符号串。其组成形式用包含约束式的上下文无关文法来描述,改进的LR分析方法进行形式识别;上下文语境采用基于知网概念的特征向量来表达,向量间的欧式距离表示语境间的相似度。实践证明该技术方案是相当有效的。 This paper puts forward two ways: the formalization and context to recognize the special strings in Chinese texts. Context free grammar extended by constrained formula and an improved LR parser are adopted to formalize and recognize the special strings. The context is represented by the eigenvector based on Hownet and their similarity is measured by Euclid distance between their eigenvectors. This technique is proved to be quite effective in practice.
出处 《计算机工程》 CAS CSCD 北大核心 2004年第12期114-115,180,共3页 Computer Engineering
关键词 特殊符号串 约束式 上下文语境 特征向量 Special strings Constrained formula Context Eigenvector
  • 相关文献

参考文献3

  • 1Brown P, Della Pietra V, De SouZa P.Class-based n-gram Models of Natural Language. Computational Linguistics, 1992, 18(4): 480-567
  • 2董振东 董强.知网[EB/OL].http:∥www.keenage.com.,.
  • 3史忠值.知识发现[M].北京:清华大学出版社,2002..

共引文献9

同被引文献42

引证文献2

二级引证文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部