期刊文献+

汉语委婉语语言资源建设 被引量:1

Construction of Chinese Euphemism Resources
下载PDF
导出
摘要 委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类。该文提出了利用同类委婉语的上下文语境辅助进行标注的方法。经过实验,对简单语义委婉语的语义判别准确率达89.71%,对语义复杂的兼类委婉语的语义判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可行性。 Euphemism is an indispensable method of language communication.It has always been one of the hottest issue in linguistics.However,this issues is hardly addressed in natural language processing community.In this paper,a corpus of euphemism(about 63,000 sentences)is collected and identified manually,with a reference to existing dictionaries.According to the dictionaries’definition and the requirements of the related natural language processing work,euphemisms are classified at the semantic level.With the collected corpus and classification,we attempted to identify polysemous euphemisms automatically and achieved an accuracy of 89.71%for simple euphemisms and 74.65%for complex ones.
作者 张辰麟 王明文 谭亦鸣 肖文艳 ZHANG Chenlin;WANG Mingwen;TAN Yiming;XIAO Wenyan(School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China;School of Cyberspace Security,Southeast University,Nanjing,Jiangsu 211189,China)
出处 《中文信息学报》 CSCD 北大核心 2020年第8期32-40,共9页 Journal of Chinese Information Processing
基金 国家自然科学基金(61876074)。
关键词 委婉语 语义辨析 语言资源构建 euphemism semantic discrimination language resource construction
  • 相关文献

参考文献22

二级参考文献125

共引文献1344

同被引文献9

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部