期刊文献+

三词型术语抽取研究

Research on Tri-word Term Extraction
下载PDF
导出
摘要 主要讨论了由三个词组成的术语的抽取问题。首先从实验语料中抽取了三个词组成的词串,利用语法规则剔除了不符合要求的三词串,最后对剩下的三词串进行了人工判别,判断其是否为术语。研究发现:1)由三个词组成的术语数量相对较少;2)所获得术语中被赋予新含义的术语占多数;3)同一领域术语间的流通性不同;4)三个以上的词组成的术语仍然存在,只是数量直线下降。 This paper mainly discussed the topic of tri-word ter^n extraction. We extracted all the linguistic strings for^ned by three words from the corpus, and filtered those illegal phrases based on the rule of grammar, and judge whether the rest of tri-word linguistic strings could be identified as terms. Our conclusions a re: 1) there are a relatively small number of tri-word terms in the corpus; 2) many tri-word terms have been given new meanings; 3) terms in the same field have different negotiability; 4) there are terms formed by more than three words in the corpus,but the number of this kind term is falling sharply.
作者 那日松 刘青
出处 《中国科技术语》 2017年第3期10-13,共4页 CHINA TERMINOLOGY
基金 国家自然科学基金项目"基于语料库的术语自动处理关键技术研究"(J1025001)
关键词 三词型术语 术语抽取 法律术语 tri-word temi,term extraction, legal term
  • 相关文献

参考文献1

二级参考文献6

  • 1Miller G. WordNet:An On - Line Lexical Database[J]. International Journal of Lexicograhy, 1990,3(4):235- 312.
  • 2董振东 董强.Hoywnet[EB/OL].www.keenage.com,1999.
  • 3陈文亮 朱靖波 姚天顺 孙茂松 陈群秀.基于Bootstrapping的领域词汇自动获取[A].孙茂松,陈群秀.语言计算与基于内容的文本处理[C].北京:清华大学出版社,2003..
  • 4Riloff E, Jones R. Learning Dictionaries for Information Extraction by Multi - Level Bootstrapping[A]. Proceedings of the Sixteenth National Conference on Artificial Intelligence(AAAI -99)[C].US:The Mit Press, 1999.
  • 5郑家恒,杜永萍,刘昌钰.基于语料的动态获取专业词汇方法初探[J].计算机工程,2002,28(5):64-66. 被引量:4
  • 6王强军,李芸,张普.信息技术领域术语提取的初步研究[J].术语标准化与信息技术,2003(1):32-33. 被引量:23

共引文献5

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部