期刊文献+

先秦文献《孟子》自动分词方法研究 被引量:16

Methodological Study of Automatic Word Segmentation in Pre-Qin Document Mencius
下载PDF
导出
摘要 自动分词是中文信息处理重要的基础课题。文章主要探讨了先秦文献《孟子》基于条件随机场统计模型的自动分词方法和利用相关注疏文献的自动分词方法等自动分词技术。自动分词实验结果表明,这两种分词方法效果显著,词语F值和小句F值均达到了较高的水平。在用不同的方法对《孟子》进行自动分词时,在词语F值的统计指标外,首次尝试引入了小句F值这一统计指标。 The automatic word segmentation is a basic subject in Chinese language information processing. This paper discusses the automatic word segmentation technology applied in the pre - Qin text Mencius. It is based on condition random field statistic model and utilizes the relevant ancient annotations and comments. The effect of these two methods is significant. The F values of both words and short sentences have reached higher levels. When using different method in automatic segmentation on Mencius, we are the first to introduce the statistic indicator of the F value of short sentences besides that of words.
出处 《南京师范大学文学院学报》 CSSCI 2013年第3期175-182,共8页 Journal of School of Chinese Language and Culture Nanjing Normal University
基金 江苏省教育厅高校哲学社会科学基金项目(编号:2011SJB740010) 教育部人文社会科学研究项目(编号:12YJCZH121) 江苏高校重点研究基地重大项目(编号:2010JDXM023) "江苏高校优势学科建设工程资助项目"资助
关键词 先秦文献《孟子》 自动分词 条件随机场 注疏文献 pre - Qin text Mencius automatic word segmentation condition random field annotations and comment
  • 相关文献

参考文献5

二级参考文献35

  • 1张恒,杨文昭,屈景辉,卢虹冰,张亮,赵飞.基于词典和词频的中文分词方法[J].微计算机信息,2008,24(3):239-240. 被引量:19
  • 2尉迟治平.计算机技术和汉语史研究[J].古汉语研究,2000(3):56-60. 被引量:19
  • 3李宇明.关于《中国语言生活绿皮书》[J].语言文字应用,2007(1):12-19. 被引量:22
  • 4常娥,侯汉清,曹玲.古籍自动校勘的研究和实现[J].中文信息学报,2007,21(2):83-88. 被引量:15
  • 5白拴虎.汉语词切分及词性标注一体化方法[C]//计算语言学进展与应用.北京:清华大学出版社,1995:56-61.
  • 6Hwee Tou Ng and Jin Kiat Low. Chinese Part-of- Speech Tagging: One at-a-Time or All-at-Once? Word-Based or Character-Based? [C]//Proceedings of ACL-04: 277-284.
  • 7Yue Zhang and Stephen Clark. Joint Word Segmentation and POS Tagging using a Single Perceptron[C]// Proceedings of ACL-08 : 888-896.
  • 8魏培泉 黄居仁 等.建构一个以共时与历时语言研究为导向的历史语料库.中文计算语言学期刊,1997,2(1):131-145.
  • 9第一部《中国语言生活绿皮书》-《中国语言生活状况报告(2005)》,2006年9月18日出版.
  • 10俞士汶,朱学锋.语文现代化与汉语信息处理技术[A].苏培成.语文现代化论丛(第六辑)[C].北京:语文出版社,2006:176-189.

共引文献105

同被引文献274

引证文献16

二级引证文献203

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部