期刊文献+

基于潜在语义特性的语义双关语检测及双关词定位 被引量:2

Homographic Puns Detection and Puns Location Based on Latent Semantic Characteristics
下载PDF
导出
摘要 语义双关语是幽默、笑话和喜剧等作品的来源之一,在人类写作的发展进程中具有重要的历史地位。由于语义双关语存在歧义难懂的特点,因此难以挖掘语义双关语的潜在语义信息,故目前语义双关语的检测和双关词的定位是自然语言处理任务中的一项困难和挑战。该文在语义双关语的理论基础上,挖掘了一系列的潜在语义特性,并构建了对应每个特性的特征集,用以检测语义双关语;同时从潜在语义特性出发,提出了一种基于词向量和同义词融合的语义相似度匹配算法实现语义双关词的定位。在SemEval 2017Task 7和Pun of the Day数据集上均取得了较好的实验结果,验证了该文所提出的检测算法和定位算法。 Homographic pun,as a common source of humor in jokes and other comedic word,is hard to detect and locate the homographic pun words.We design a series of latent semantic characteristics and corresponding features to detect homographic puns.Then,a semantic similarity matching algorithm is proposed to locate pun words based on the fusion of Word Embedding and Sysnet.Experiment results on SemEval 2017 Task 7 and Pun of the Day demonstrate the effectiveness of the proposed method.
作者 刁宇峰 杨亮 林鸿飞 吴迪 樊小超 徐博 许侃 DIAO Yufeng;YANG Liang;LIN Hongfei;WU Di;FAN Xiaochao;XU Bo;XU Kan(Institute of Computer Science and Technology, Dalian University of Technology, Dalian, Liaoning 116024, China;College of Computer Science and Technology, Inner Mongolia University for Nationalities, Tongliao, Inner Mongolia 028043, China;College of Computer Science and Technology, Xinjiang Normal University, Urumqi, Xinjiang 830054, China)
出处 《中文信息学报》 CSCD 北大核心 2019年第4期12-19,28,共9页 Journal of Chinese Information Processing
基金 国家自然科学基金(61632011 61572102 61702080 61602079 61602078) 中央高校基本科研业务费专项资金(DUT18ZD102) 中国博士后科学基金(2018M631788)
关键词 语义双关句 潜在语义特性 双关词定位 词向量 同义词 homographic latent semantic characteristics homographic puns detection word embedding sysnet
  • 相关文献

参考文献1

二级参考文献1

  • 1Raskin Victor.Semantic Mechanisms of Humor,1985.

共引文献14

同被引文献15

引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部