基于词分布表征的汉语框架排歧研究被引量：4

Chinese Frame Disambiguation Base on Word Distributed Representations

下载PDF

导出

摘要框架排歧目的在于根据句子中目标词的上下文环境,从现有的框架库中为该目标词自动标注一个合适的框架.将框架排歧任务看作分类问题,首次将词的低维分布表征信息作为模型特征引入到汉语框架排歧研究中,来探讨仅从词特征出发,不同的特征表示对框架排歧模型的影响.实验选取了88个词元中2 077条例句为数据集,并将目标词周围的词分布表征信息加入到最大熵算法中进行建模.实验结果表明,使用词分布表征信息的框架排歧模型可以达到58.11%的精度,该结果与传统的仅使用词特征时(47.47%)的结果相比有大幅度提高.这说明词分布表征对汉语框架排歧任务是有重要作用的. The purpose of frame disambiguation is to select a proper frame from all frames in CFN for a target word of a Chinese sentence,based on the context of the target word.Frame disambiguation is regarded as a classification task between frames,and we firstly introduce word low dimension distributed representations as features to investigate the influence of different feature representations on frame disambiguation model only proceed from the word feature.We selected 2 077 annotated sentences from 88 lexical units as our dataset,and introduced the distributed representations of words around the target word into maximum entropy algorithm for the model building.Experimental results show that the accuracy of our proposed frame disambiguation model reaches 58.11%.Compared with the result（47.47%）that only use word features,this result get increased significantly,and it shows that word distributed representations is so important to frame disambiguation.

作者党帅兵李国臣王瑞波李济洪

机构地区山西大学计算机与信息技术学院太原工业学院计算机工程系山西大学软件学院

出处《中北大学学报（自然科学版）》 CAS 北大核心 2015年第3期328-332,337,共6页 Journal of North University of China(Natural Science Edition)

关键词框架排歧最大熵模型词分布表征汉语框架语义知识库 frame disambiguation maximum entropy model word distributed representations Chinese frame net

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1Ken Litkowski. CLP: Integration of frame net in a text representation systemEC]. Proceedings of the 4th In- ternational Workshop on Semantic Evaluations, 2007: 113-116.
2Cosmin Adrian Bejan, Hathaway Chris. UTD-SRL: a pipeline architecture for extracting frame semantic structures[C. Proceedings of the 4th International Workshop on Semantic Evaluations, 2007: 460-463.
3李济洪,高亚慧,王瑞波,李国臣.汉语框架自动识别中的歧义消解[J].中文信息学报,2011,25(3):38-44. 被引量：11
4李国臣,张立凡,李茹,刘海静,石佼.基于词元语义特征的汉语框架排歧研究[J].中文信息学报,2013,27(4):44-51. 被引量：7
5Berger A L, Pietra V J, Pietra S A. A maximum en- tropy approach to natural language processing I J-1. Computational Linguistic, 1996, 22(1) : 39-71.
6Bengio Y, Ducharme R, Vincent P, et al. A neural probabilistic language model[J]. Journal of Machine Learning Research (JMLR), 2003(3): 1137-1155.
7Collobert R, Weston J, Bottou L, et al. Natural lan- guage processing (almost) from scratch[J]. Journal of Machine Learning Research (JMLR), 2011 (12) : 2493-2537.
8Mikolov T, Chen K, Corrado G, et al. Efficient Esti- mation of Word Representations in Vector Space [DB]. arXiv preprint arXiv,2013: 1301-3781.
9Mikolov T, Sutskever I, Chen K, et al. Distributed representations of words and phrases and their com- positi- onality [DB]. arXiv preprint arXiv, 2013. 1310- 4546.
10Mikolov T, Yih W, Zweig G. Linguistic Regularities in Continuous Space Word Representations[C]. In NAACL-HLT-2013,2013.

二级参考文献37

1陈浩,何婷婷,姬东鸿.基于k-means聚类的无导词义消歧[J].中文信息学报,2005,19(4):10-16. 被引量：16
2刘冬明,杨尔弘,方莹.汉英双语平行语料库的词义标注[J].中文信息学报,2005,19(6):50-56. 被引量：4
3由丽萍,范开泰,刘开瑛.汉语语义分析模型研究述评[J].中文信息学报,2005,19(6):57-63. 被引量：22
4刘风成,黄德根,姜鹏.基于AdaBoost.MH算法的汉语多义词消歧[J].中文信息学报,2006,20(3):6-13. 被引量：7
5吴云芳,金澎,郭涛.基于词典属性特征的粗粒度词义消歧[J].中文信息学报,2007,21(2):3-8. 被引量：10
6周强.汉语基本块描述体系[J].中文信息学报,2007,21(3):21-27. 被引量：25
7Collin Baker, Michael Ellsworth, Katrin Erk, SemE- vale07 Task 19.. Frame Semantic Structure Extraction [C]//Proceedings of the 4th International Workshop on Semantic Evaluations Prague, Czech Republic, June 23-24 2007: 99-104.
8Surdeanu M, Johansson R, Meyers A, Marquez L, Nivre J. The CoNLL 2008 Shared Task on Joint Par- sing of Syntactic and Semantic Dependencies [C]// Clark A, Toutanova K, eds. Proc. of the CoNLL- 2008. Manchester; ACL Press, 2008; 159-177.
9Hajic J, Ciaramita M, Johansson R, Kawahara D, Marti MA, Marquez L, Meyers A, Nivre J, Pado S, Stepdnek J, Stranak P, Surdeanu M, Xue NW, Zhang Y. The CoNLL-2009 shared task: Syntactic and Se- mantic Dependencies in Multiple Languages [C]//Ste- venson S, Carreras X, eds. Proc. of the CoNLL- 2009. Boulder:ACL Press, 2009.
10Josef Ruppenhofer,Caroline Sporleder and Roser Mo- rante. SemEval-2010 Task 10: Linking Events and Their Participants in Discourse [C]//Boulder: ACL Press, 2010: 45-50.

共引文献13

1刘开瑛.汉语框架语义网构建及其应用技术研究[J].中文信息学报,2011,25(6):46-52. 被引量：23
2张禄彭,易绵竹,周云.中文歧义研究25年——以《中文信息学报》论文为例[J].中文信息学报,2012,26(4):73-84. 被引量：4
3李国臣,张立凡,李茹,刘海静,石佼.基于词元语义特征的汉语框架排歧研究[J].中文信息学报,2013,27(4):44-51. 被引量：7
4石佼,李茹,王智强.汉语核心框架语义分析[J].中文信息学报,2014,28(6):48-55. 被引量：6
5赵红燕,李茹,张晟,张力文.基于DNN的汉语框架识别研究[J].中文信息学报,2016,30(6):75-83. 被引量：8
6路佳佳,李晓芳.神经语言模型在框架排歧中的应用[J].广西民族师范学院学报,2017,34(3):127-130. 被引量：1
7张力文,王瑞波,李茹,张晟.基于词分布式表征的汉语框架排歧模型[J].中文信息学报,2017,31(6):50-57. 被引量：7
8门宇鹏,郝晓燕,董嘉敏.基于语义依存分析的CFN框架排歧[J].计算机工程与设计,2019,40(9):2654-2659. 被引量：2
9郭宇飞,郝晓燕.基于卷积神经网络的FrameNet框架消歧研究[J].中北大学学报（自然科学版）,2020,41(4):346-351. 被引量：2
10侯运瑶,曹学飞,崔军,王瑞波,李济洪,李茹.基于框架表示学习的汉语框架排歧[J].计算机应用研究,2020,37(12):3640-3644. 被引量：2

同被引文献16

1丁伟伟,常宝宝.基于最大熵原则的汉语语义角色分类[J].中文信息学报,2008,22(6):20-26. 被引量：11
2李国臣,王瑞波,李济洪.基于条件随机场模型的汉语功能块自动标注[J].计算机研究与发展,2010,47(2):336-343. 被引量：7
3李济洪,王瑞波,王蔚林,李国臣.汉语框架语义角色的自动标注[J].软件学报,2010,21(4):597-611. 被引量：42
4李济洪,高亚慧,王瑞波,李国臣.汉语框架自动识别中的歧义消解[J].中文信息学报,2011,25(3):38-44. 被引量：11
5王智强,李茹,阴志洲,刘海静,李双红.基于依存特征的汉语框架语义角色自动标注[J].中文信息学报,2013,27(2):34-40. 被引量：8
6李国臣,张立凡,李茹,刘海静,石佼.基于词元语义特征的汉语框架排歧研究[J].中文信息学报,2013,27(4):44-51. 被引量：7
7宋毅君,王瑞波,李济洪,李国臣.基于条件随机场的汉语框架语义角色自动标注[J].中文信息学报,2014,28(3):36-47. 被引量：8
8陈学丽,李茹,王赛,王智强.汉语框架网中未登录词元的框架选择[J].中文信息学报,2014,28(3):48-54. 被引量：2
9刘焱青,王钰,李济洪.基于组块3×2交叉验证t检验的模型选择算法[J].陕西科技大学学报（自然科学版）,2015,35(1):179-183. 被引量：2
10武仲波.框架语义学和框架网络对格语法的继承与发展[J].外语研究,2015,32(6):22-27. 被引量：16

引证文献4

1赵红燕,李茹,张晟,张力文.基于DNN的汉语框架识别研究[J].中文信息学报,2016,30(6):75-83. 被引量：8
2张力文,王瑞波,李茹,张晟.基于词分布式表征的汉语框架排歧模型[J].中文信息学报,2017,31(6):50-57. 被引量：7
3门宇鹏,郝晓燕,董嘉敏.基于语义依存分析的CFN框架排歧[J].计算机工程与设计,2019,40(9):2654-2659. 被引量：2
4宋毅君,王瑞波.汉语框架语义角色标注中特征模板选择法比较[J].山西大学学报（自然科学版）,2021,44(5):907-914.

二级引证文献11

1程磊,高茂庭.基于深度神经网络的推荐算法[J].现代计算机,2018,24(15):3-7. 被引量：4
2王睿怡,罗森林,吴舟婷,潘丽敏.深度学习在汉语语义分析的应用与发展趋势[J].计算机技术与发展,2019,29(9):110-116. 被引量：3
3门宇鹏,郝晓燕,董嘉敏.基于语义依存分析的CFN框架排歧[J].计算机工程与设计,2019,40(9):2654-2659. 被引量：2
4郭宇飞,郝晓燕.基于卷积神经网络的FrameNet框架消歧研究[J].中北大学学报（自然科学版）,2020,41(4):346-351. 被引量：2
5李玉亭.云计算环境下分布式大数据多信道并行控制系统[J].计算机测量与控制,2020,28(10):116-119. 被引量：2
6侯运瑶,曹学飞,崔军,王瑞波,李济洪,李茹.基于框架表示学习的汉语框架排歧[J].计算机应用研究,2020,37(12):3640-3644. 被引量：2
7王燕,吕国英,李茹,任国华.面向篇章的框架关系预测的表示学习[J].计算机应用与软件,2023,40(4):128-133.
8郭哲铭,张虎,崔军,王笑月.融合全局和局部注意力机制的自然语言框架识别方法[J].计算机应用与软件,2023,40(8):167-173.
9闫智超,李茹,苏雪峰,李欣杰,柴清华,韩孝奇,赵云肖.融合目标词上下文序列与结构信息的框架识别方法[J].中文信息学报,2024,38(1):86-96.
10游亚男,李茹,苏雪峰,闫智超,孙民帅,王超.基于GCN和门机制的汉语框架排歧方法[J].中文信息学报,2024,38(3):33-41.

1李国臣,党帅兵,王瑞波,李济洪.基于字的分布表征的汉语基本块识别[J].中文信息学报,2014,28(6):18-25. 被引量：6
2胡茂海,谢仁龙,高万荣.薄雾模糊图像的恢复算法研究[J].红外技术,2004,26(6):76-78. 被引量：1
3吕雷.基于CRFsuite分类器的汉语框架语义角色标注[J].电脑开发与应用,2014,27(4):8-11.
4李国臣,刘展鹏,王瑞波,李济洪.融合分词隐层特征的汉语基本块识别[J].中文信息学报,2016,30(2):12-17.
5倪培君,李旭东,张维国,张晨东.工业X射线CT的应用[J].CT理论与应用研究（中英文）,1997,6(3):36-42. 被引量：12
6李济洪,高亚慧,王瑞波,李国臣.汉语框架自动识别中的歧义消解[J].中文信息学报,2011,25(3):38-44. 被引量：11
7王文渊,王芳梅.改进的最大熵算法在图像分割中的应用[J].计算机仿真,2011,28(8):291-294. 被引量：11
8汪四仙,刘金阁,王勇飞,丁江林.基于马尔可夫过程的边缘描述符提取算法[J].科技视界,2015(14):151-151.
9崔宁海,刘丽萍.马尔可夫边缘描述符的图像特征提取算法[J].计算机应用,2012,32(4):1104-1107. 被引量：1
10李济洪,王瑞波,王蔚林,李国臣.汉语框架语义角色的自动标注[J].软件学报,2010,21(4):597-611. 被引量：42

中北大学学报（自然科学版）

2015年第3期

浏览历史

内容加载中请稍等...

基于词分布表征的汉语框架排歧研究被引量：4

参考文献13

二级参考文献37

共引文献13

同被引文献16

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于词分布表征的汉语框架排歧研究 被引量：4

参考文献13

二级参考文献37

共引文献13

同被引文献16

引证文献4

二级引证文献11

相关作者

相关机构

相关主题

浏览历史

基于词分布表征的汉语框架排歧研究被引量：4