期刊文献+

英语网络非正规语言表达的自动识别与术语库构建 被引量:1

Automatic Recognition and Terminology Database Construction of English Network Informal Language Expressions
下载PDF
导出
摘要 网络非正规语言表达(Network Informal Language Expression, NILE)具有的创新性强、超常规化、表达方式口语化等特点,为许多自然语言处理任务带来了挑战。在使用网络语言进行交流的过程中,部分网络非正规语言表达逐渐标准化和规范化,形成网络非正规语言表达术语。通过对46万余条Twitter数据的收集、处理和分析,英语网络非正规语言表达可以在音、形、义层面划分为13类,并对其特征进行分析和总结。结合统计方法和规则方法的优点,设计了统计和规则融合的英语网络非正规语言表达自动识别方法。最终构建规模为7000余条的网络非正规语言表达术语库。 Network Informal Language Expression(NILE) has the characteristics of novelty, unconventionality and colloquialism, which poses a challenge to many natural language processing tasks. In the process of using online language for communication, some NILEs are gradually standardized and normalized, forming a crucial part of the NILE terminology. By collecting, processing and analyzing more than 460 000 tweets, we divide English NILEs into 13 categories from the perspectives of sound, form and sense, and further analyzed their characteristics. Taking the advantage of statistic-based approach and rule-based approach, we design an automatic English NILE recognition system based on the integration of statistical techniques and linguistic rules, and thereupon build a terminology database of 7000 NILE items.
作者 夏榕璟 张克亮 XIA Rongjing;ZHANG Keliang
出处 《中国科技术语》 2022年第1期36-44,共9页 CHINA TERMINOLOGY
基金 国家自然科学基金重大项目课题“多语言言语数据的获取、标注和分析研究”(11590771) 教育部首批新文科研究与改革实践项目“语言和技术相结合的国防语言人才培养创新与实践”(2021100089)。
关键词 网络非正规语言表达 自动识别 术语库 Network Informal Language Expression(NILE) automatic recognition terminology database
  • 相关文献

参考文献10

二级参考文献51

共引文献140

同被引文献28

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部