基于语料库的关联词识别方法被引量：5

The Method of Identifying Discourse Maker Based on Corpus

下载PDF

导出

摘要关联词语的出现在汉语文章中占有很大的比重,它们可以在复句分析中起到非常重要的作用。该文主要讨论如何在语料库中提取反映关联词语用法的各种特征信息,再通过数据挖掘算法将这些信息整理为关联词语的知识库,作为关联词识别的依据,并对有歧义的关联词语提出了基于决策树的消歧方法。最后,通过开放测试证明了该方法的有效性。 With the high occurrence rate in Chinese articles,discourse maker plays a significant role in automatic processing of sentences.This article elaborates on how to obtain characteristic information for discourse maker from corpus,and builds knowledge base with data mining algorithm as the basis for discourse maker identification.Also it proposes the method of identifying ambiguous discourse maker with decision-tree.At last,the validity of the method is proved by test.

作者李文翔晏蒲柳张滨夏德麟

机构地区武汉大学电信学院

出处《计算机工程与应用》 CSCD 北大核心 2004年第7期50-52,共3页 Computer Engineering and Applications

基金国家自然科学基金项目"大型复杂网络智能管理的基本理论与技术研究"(编号:90204008)的子课题:面向主题的知识学习器

关键词关联词语料库决策树 Discourse Maker,Corpus,Decision-Tree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献2

1张华平,刘群.基于N-最短路径方法的中文词语粗分模型[J].中文信息学报,2002,16(5):1-7. 被引量：99
2俞士汶等.现代汉语语法信息词典．规格说明书[Z].,2000-01..

二级参考文献1

1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43

共引文献98

1战疆,冯月利,王珊.PostgreSQL中文全文索引技术研究与实现[J].华中科技大学学报（自然科学版）,2005,33(z1):213-216. 被引量：3
2隋丽萍,徐承韬,李瑞芳.一个中文全文检索系统的设计与实现[J].科技资讯,2007,5(18):244-245. 被引量：1
3张素娟,郑庆华,胡云华,孙霞.一种面向网络答疑的汉语切分歧义消除算法[J].计算机工程与应用,2004,40(25):55-58. 被引量：4
4王朝静,郑庆华.面向答疑文本的词类标注方法的研究与实现[J].计算机工程与应用,2004,40(16):57-60. 被引量：2
5刘群,张华平,俞鸿魁,程学旗.基于层叠隐马模型的汉语词法分析[J].计算机研究与发展,2004,41(8):1421-1429. 被引量：198
6李文翔,晏蒲柳,夏德麟,张滨.基于差异相似矩阵算法的词语用法知识发现[J].计算机应用与软件,2005,22(1):90-92.
7刘新斌,李俊.一种基于N-gram组合的中文垃圾邮件过滤方法[J].微电子学与计算机,2004,21(12):85-91. 被引量：5
8黄建中,王肖雷.Katz平滑算法在中文分词系统中的应用[J].计算机工程,2004,30(B12):371-372. 被引量：5
9夏天,樊孝忠,刘林.利用JNI实现ICTCLAS系统的Java调用[J].计算机应用,2004,24(B12):177-178. 被引量：24
10刘群,张浩,白硕.自然语言处理开放资源平台[J].语言文字应用,2002(4):50-56. 被引量：9

同被引文献68

1姚双云.小句中枢理论的应用与复句信息工程[J].汉语学报,2005(4):71-79. 被引量：17
2姚亚平.多重复句的分析模型——兼淡语法分析的作用与目的[J].汉语学习,1990(3):8-14. 被引量：9
3陆俭明.关于句处理中所要考虑的语义问题[J].语言研究,2001,21(1):1-12. 被引量：25
4王立霞,孙宏林.现代汉语介词短语边界识别研究[J].中文信息学报,2005,19(3):80-86. 被引量：11
5陈振宇,陈振宁.怎样计算现代汉语句子的时间信息[J].中文信息学报,2005,19(3):94-104. 被引量：6
6张仕仁.汉语复句的结构分析[J].中文信息学报,1994,8(4):43-54. 被引量：13
7张文国.古汉语的“N+N”结构及其发展[J].长安大学学报（社会科学版）,2006,8(2):80-83. 被引量：1
8封春升,郝爱民.基于模式匹配的自然语言识别[J].计算机工程与应用,2006,42(19):144-146. 被引量：8
9李幸,宗成庆.引入标点处理的层次化汉语长句句法分析方法[J].中文信息学报,2006,20(4):8-15. 被引量：23
10常娥,侯汉清,曹玲.古籍自动校勘的研究和实现[J].中文信息学报,2007,21(2):83-88. 被引量：17

引证文献5

1黄建年,侯汉清.农业古籍断句标点模式研究[J].中文信息学报,2008,22(4):31-38. 被引量：28
2吴锋文.面向信息处理的汉语复句研究现状及其展望[J].宁夏大学学报（人文社会科学版）,2013,35(4):29-33.
3杨进才,谢芳,胡金柱.汉语复句关系词自动标识中规则引擎的研究[J].计算机科学,2014,41(B11):25-28. 被引量：3
4吴锋文.汉语复句信息处理研究二十年[J].中文信息学报,2015,29(1):13-18. 被引量：4
5吴锋文.基于模式识别的四句式复句句法语义关系判定[J].汉语学报,2017(3):17-26. 被引量：4

二级引证文献39

1程宁,李斌,葛四嘉,郝星月,冯敏萱.基于BiLSTM-CRF的古汉语自动断句与词法分析一体化研究[J].中文信息学报,2020(4):1-9. 被引量：24
2吴锋文.“搭配标+搭配标”四句式复句的句法层构与语义关联[J].华中学术,2021(1):186-198.
3吴锋文.汉语“三标四句式”充盈态复句的句法语义关系判定[J].华中学术,2020(1):189-200.
4常娥,黄建年,侯汉清.古籍智能整理与开发系统构建研究[J].情报资料工作,2009,30(4):43-47. 被引量：14
5张开旭,夏云庆,宇航.基于条件随机场的古汉语自动断句与标点方法[J].清华大学学报（自然科学版）,2009(10):1733-1736. 被引量：35
6吴慰慈,谷秀洁.2008年国内图书馆学学术进展[J].图书馆论坛,2009,29(6):19-24. 被引量：2
7赵阳,顾磊.基于中文信息处理的古籍整理研究评述[J].图书情报工作,2010,54(3):116-119. 被引量：8
8顾磊,赵阳.古籍智能信息处理的研究现状及展望[J].科技信息,2013(8):3-3.
9毛建军.古籍电子文献出版策略及趋势研究[J].图书馆论坛,2014,34(4):115-119. 被引量：3
10杨清虎,伍双林.中文古籍在线智能标点系统原理初探[J].兰台世界（中旬）,2015,0(7):32-33.

1唐德合.计算机汉语文章评价系统[J].情报探索,1995(1):38-41.
2黄朝晖.高考热点追踪[J].时代英语（高三版）,2009(2):8-10.
3高维君,姚天顺,黎邦洋,陈伟光,邹嘉彦.机器学习在汉语关联词语识别中的应用[J].中文信息学报,2000,14(3):1-8. 被引量：7
4计算机及软件[J].中国高校科技,1998(8):19-21.
5“即”“既”如何区别?[J].中华活页文选（高一年级版）,2012(3):77-77.
6徐涛,加羊吉,于洪志.统计与规则相结合的藏文句子自动断句方法[J].云南大学学报（自然科学版）,2012,34(6):653-657. 被引量：7
7刘曜,原苏荣.认知语言学视角下汉英情感域内的副词性关联词语识解[J].文教资料,2017(3):28-29.
8张裔平.复句关联词不影响主语的存在[J].中学语文教学参考,2014(5):64-64.
9师越,师海忠.自然语言是正则语言[J].计算机科学,2014,41(B11):51-54. 被引量：1
10快速进行大小写转换[J].电脑爱好者,2012(18):42-42.

计算机工程与应用

2004年第7期

浏览历史

内容加载中请稍等...

基于语料库的关联词识别方法被引量：5

参考文献2

二级参考文献1

共引文献98

同被引文献68

引证文献5

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于语料库的关联词识别方法 被引量：5

参考文献2

二级参考文献1

共引文献98

同被引文献68

引证文献5

二级引证文献39

相关作者

相关机构

相关主题

浏览历史

基于语料库的关联词识别方法被引量：5