《现代汉语语法信息词典》的概率化改造及其应用

Probability transformation and application of grammatical knowledge-base of contemporary Chinese

下载PDF

导出

摘要针对《现代汉语语法信息词典》不能准确描述真实语料的缺陷,设计了构建概率型语法信息词典名词库的存储结构,提出利用统计模型概率化词语属性的方法,建立完整的名词概率化语法信息词典,设计并实现了概率型语法词典应用于语法词典自纠错的算法,实验证明其具有自纠错能力。 In order to overcome the deficiency that the＂grammatical knowledge-base of contemporary Chinese＂（GKB） cannot describe the real corpus,a storage structure to store the probability grammar knowledge-base of nouns is designed.In this paper,a method using statistical model is proposed to establish nouns probability grammar dictionary.Finally,the error correction method making use of nouns probability grammar knowledge-base is designed and implemented and the experimental result proves its ability on correction of itself.

作者吴林张仰森王璐

机构地区北京信息科技大学智能信息处理研究所

出处《北京信息科技大学学报（自然科学版）》 2011年第6期57-61,共5页 Journal of Beijing Information Science and Technology University

基金国家自然科学基金资助项目(60873013 61070119) 北京大学计算语言学教育部重点实验室开放课题基金项目(KLCL-1005) 北京市属市管高等学校人才强教计划资助项目(PHR201007131)

关键词语法信息词典概率化查错纠错 grammatical knowledge-base of contemporary Chinese probability error-detecting correction

分类号 TP317 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1曾彪.Solr学术索引应用显身手[J].中国教育网络,2010(10):62-64. 被引量：1
2哈工大计算信息检索中心.依存句法工具[EB/OL].[2011-09-25].http://ir.hit.edu.cn/demo/ltp.
3郭充,张仰森.基于《知网》义原搭配的中文文本语义级自动查错研究[J].计算机工程与设计,2010,31(17):3924-3928. 被引量：12
4语言文字应用研究所.语料库在线[EB/OL].[2011-09-25].http://www.cncorpus.org/.

二级参考文献10

1张仰森,俞士汶.文本自动校对技术研究综述[J].计算机应用研究,2006,23(6):8-12. 被引量：39
2张仰森,曹元大,俞士汶.基于规则与统计相结合的中文文本自动查错模型与算法[J].中文信息学报,2006,20(4):1-7. 被引量：34
3Dang H,Palmer M.Simple feature for Chinese word sense disambiguation[C].Taipei,Taiwan:Proceedings of the 19th International Conference on Computational Linguistics,2002.
4董振东董强.[EB/OL].知网http://www.keenage.com,2000.
5徐南轩,邹恒明.一种反映词语相关度语义库的构建方法[J].上海交通大学学报,2008,42(7):1129-1132. 被引量：3
6尹邦才.试论“语义搭配的可能性”[J].理论观察,2008(6):134-135. 被引量：6
7张仰森.中文校对系统中纠错知识库的构造及纠错建议的产生算法[J].中文信息学报,2001,15(5):33-39. 被引量：11
8张昱琪,周强.汉语基本短语的自动识别[J].中文信息学报,2002,16(6):1-8. 被引量：41
9骆卫华,罗振声,龚小谨.中文文本自动校对的语义级查错研究[J].计算机工程与应用,2003,39(12):115-118. 被引量：13
10郑逢斌,陈志国,姜保庆,乔保军.语义校对系统中的句子语义骨架模糊匹配算法[J].电子学报,2003,31(8):1138-1140. 被引量：7

共引文献11

1熊晶,钟珞,王爱民.甲骨文本体构建方法研究及应用[J].武汉理工大学学报（信息与管理工程版）,2011,33(6):953-957. 被引量：5
2张仰森,黄改娟,苏文杰.基于隐最大熵原理的汉语词义消歧方法[J].中文信息学报,2012,26(3):72-78. 被引量：8
3吴林,张仰森.基于知识库的多层级中文文本查错推理模型[J].计算机工程,2012,38(20):21-25. 被引量：10
4王璐,张仰森,吴林.基于多知识源的语义搭配知识获取及表示方法[J].计算机工程,2012,38(20):109-112. 被引量：2
5管君,谢玮,张仰森.基于多知识源的语义搭配知识库的构建及应用[J].计算机工程与设计,2013,34(6):2136-2140. 被引量：3
6王秀慧,王丽珍,麻淑芳.结合语义的改进FTC文本聚类算法[J].计算机工程与设计,2014,35(2):515-519. 被引量：5
7王秀慧,殷旭彪,薄文彦.改进的基于FIHC的科学数据聚类算法[J].山西大同大学学报（自然科学版）,2014,30(1):4-7. 被引量：1
8姜赢,庄润钹,吴烨凡,朱玲萱.基于描述逻辑本体推理的语义级中文校对方法[J].计算机系统应用,2017,26(4):224-229. 被引量：6
9张芙蓉,罗志娟.基于深度学习的语义级中文文本自动校对研究[J].长沙航空职业技术学院学报,2022,22(3):33-37.
10李云汉,施运梅,李宁,田英爱.中文文本自动校对综述[J].中文信息学报,2022,36(9):1-18. 被引量：1

1俞士汶,朱学锋,王惠,张芸芸.现代汉语语法信息词典规格说明书[J].中文信息学报,1996,10(2):1-22. 被引量：34
2王斯日古楞.《蒙古语语法信息词典》管理平台的设计与实现[J].内蒙古师范大学学报（自然科学汉文版）,2009,38(4):417-420. 被引量：1
3张潇,李郝林.基于信息冗余的条形码容错技术研究[J].精密制造与自动化,2007(4):26-27.
4才藏太.班智达藏文语料切分词典的建立与算法研究[J].计算机应用,2009,29(7):2019-2021. 被引量：4
5俞士汶,朱学锋,王惠.《现代汉语语法信息词典》的新进展[J].中文信息学报,2001,15(1):59-64. 被引量：9
6许大好,丁永前.数字罗盘在足球机器人守门员位姿控制中的应用[J].国外电子测量技术,2008,27(10):50-52. 被引量：1
7梁夏.具有自纠错功能的人工神经网络在股票滚动预测上的应用[J].计算机应用研究,1999,16(1):76-80. 被引量：8
8孙吉利,张平.基于FPGA的星载计算机自检EDAC电路设计[J].微计算机信息,2009,25(23):131-133. 被引量：9
9王非,马雁,郭琳.基于simstore自纠错倒闸操作仿真系统设计[J].自动化技术与应用,2014,33(12):52-55. 被引量：1
10李文华,罗改龙.基于NLP的OCR后处理方法[J].软件导刊,2010,9(10):35-36. 被引量：1

北京信息科技大学学报（自然科学版）

2011年第6期

浏览历史

内容加载中请稍等...

《现代汉语语法信息词典》的概率化改造及其应用

参考文献4

二级参考文献10

共引文献11

相关作者

相关机构

相关主题

浏览历史