期刊文献+

基于统计的汉语组块分析 被引量:27

Statistics Based Chinese Chunk Parsin
下载PDF
导出
摘要 组块分析是一种大大降低句法分析难度的有效手段。本文针对汉语普遍规律 ,提出了一套符合汉语语言特点的汉语组块体系 ,并在此基础上设计实现了一种统计与错误驱动相结合的、能够分析有限层次的组块自动识别算法。实验证明 ,该方法能够有效地处理真实文本中的浅层分析问题 ,具有较好的准确率和鲁棒性。 Chunk parsing is an effective method to decrease the difficulty of language parsing.This paper proposes a formal description representing the characteristics of Chinese chunks.Based on the description,a statistical algorithm is accomplished to recognize definite levels of Chinese chunks.The experiments have proved that the algorithm gives a high accuracy for shallow parsing of real Chinese texts with robustness.
出处 《中文信息学报》 CSCD 北大核心 2000年第6期28-32,39,共6页 Journal of Chinese Information Processing
基金 国家 8 6 3课题!(86 3 - 30 6 -ZT0 3- 0 6 - 3 86 3 - 30 6 -ZD13 - 0 4- 4) 自然科学基金项目!(6 9775 0 17)
关键词 组块分析 汉语句法分析 统计方法 组块识别 chunk Chinese parsing statistical method
  • 相关文献

参考文献3

二级参考文献18

  • 1马真,陆俭明.“名词+动词”词语串浅析[J].中国语文,1996(3):183-188. 被引量:14
  • 2周强,俞士汶.汉语短语标注标记集的确定[J].中文信息学报,1996,10(4):1-11. 被引量:35
  • 3张卫国.三种定语、三类意义及三个槽位[J].中国人民大学学报,1996,(4):97-100.
  • 4李文捷 潘海华 等.基于语料库的中文最长名词短语的自动抽取.计算语言学进展与应用[M].北京:清华大学出版社,1995.119-125.
  • 5邵敬敏 郑定欧.双音节V+N结构的配价分析.现代汉语配价语法研究[M].北京:北京大学出版社,1995..
  • 6张卫国,中国人民大学学报,1996年,4卷,97页
  • 7马真,中国语文,1996年,3期,183页
  • 8李文捷,计算语言学进展与应用,1995年,119页
  • 9邵敬敏,现代汉语配价语法研究,1995年
  • 10周强,智能技术与系统国家重点实验室技术报告(TR98003),1998年

共引文献38

同被引文献285

引证文献27

二级引证文献199

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部