期刊文献+

利用标点符号自动识别分句 被引量:1

On Making Use of Punctuation Marks to Identify Clauses Automatically
下载PDF
导出
摘要 为了建设一个面向中文信息处理的大规模复句"精加工"语料库,首先要完成自动分词和词性标注工作,在此基础上进行分句层次和关系的自动划分和标注。由于标点符号是最直观而明晰的断句标记,我们编制的初始程序让计算机一"碰到"标点符号就把它前后的语言片段都判定为分句。这就为今后基于句法和语义知识的非分句识别奠定了良好的基础。 In order to build an "advanced" compound-sentence corpus for Chinese Information Process,automatic word segmentation and POS tagging work should be completed first of all.Then on this basis,automatic classification and labeling of levels and relationship between clauses should be conducted.As punctuation marks are the most intuitive and clear marks,we programmed the computer to regard the language fragments between punctuation as clauses.Doing so much is risking,because it will "victimize" a lot of non-clause language fragments which are subject to be identified through other means.
作者 李琼
出处 《皖西学院学报》 2011年第1期108-110,共3页 Journal of West Anhui University
基金 教育部人文社会科学研究青年基金项目"汉语复句书读前后语言片段的非分句识别"(09YJC740032)
关键词 标点符号 断句标记 自动识别 分句 非分句 punctuation punctuation mark automatic identification clause non-clause
  • 相关文献

参考文献4

二级参考文献8

共引文献43

同被引文献4

引证文献1

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部