期刊文献+

基于SVM和特征相关性的微博新词发现研究

下载PDF
导出
摘要 为了对微博语料中的新词进行有效的识别,针对微博语料独有的文本特性,该文提出基于SVM和特征相关性的微博新词发现方法。采用N元递增模型得到候选词集合以及每个候选词的基础特征向量,并结合已有的词典和部分人工标注进行正负样本的标注。通过相关性分析构造新的候选词特征,并构造新的特征向量。然后利用SVM模型训练得到最大间隔分离超平面并对测试集中的语料进行新词判定。通过对比实验验证了该方法的有效性。
作者 韩修龙
出处 《电脑知识与技术》 2018年第1Z期174-176,共3页 Computer Knowledge and Technology
  • 相关文献

参考文献3

二级参考文献30

  • 1李丽双,黄德根,陈春荣,杨元生.用支持向量机进行中文地名识别的研究[J].小型微型计算机系统,2005,26(8):1416-1419. 被引量:10
  • 2李丽双,黄德根,陈春荣,杨元生.SVM与规则相结合的中文地名自动识别[J].中文信息学报,2006,20(5):51-57. 被引量:32
  • 3Frantzi K, Ananiadou S, Mima H. Automatic recognition of multi-word terms: The C-value/NC-value method [J]. International Journal on Digital Libraries, 2000, 3(2): 115- 130
  • 4Justeson J, Katz S. Technical terminology: Some linguistic properties and an algorithm for identification in text [J]. Natural Language Engineering, 1995, 1(1): 9-27
  • 5Maynard D, Ananiadou S. Identifying terms by their family and friends [C] //Proc of the 18th Int Conf on Computational Linguistics (COLING). Morristown, N J: ACI., 2000: 530- 536
  • 6Wermter J, Hahn U. Paradigmatic modifiability statistics for the extraction of complex multi-word terms [C] //Proc of the 5th Human Language Technology Conference and 2005 Conf on Empirical Methods in Natural Language Processing. Morristown, NJ: ACL, 2005:843-850
  • 7Argamon S, Dagan I, Krymolowski Yuval. A memory-based approach to learning shallow natural language patterns [C] // Proc of the 17th COLING and the 36th Annual Meeting of ACL. Morristown, NJ: ACI., 1999: 67-73
  • 8Xun E, Ge S, Zhang R. Internet based Chinese term definition extraction research [C] //Proc of the 3rd Int Conf on Terminology, Standardization and Technology Transfer (TSTT'2006). Beijing: Encyclopedia of China Publishing House. 2006:382-389
  • 9Nenadice G, Ananiadou S, McNaught J. Enhancing automatic term recognition through recognition of variation [C] //Proc of the 20th Int Conf on Computational Linguistics (COLING). Morristown, NJ : ACL, 2004 : 604-610
  • 10Bourigault D. Surface grammatical analysis for the extraction of terminological noun phrases [C] //Proc of the 14th Int Conf on Computational Linguistics (COLING). Morristown, NJ: ACL, 1992:977-981

共引文献74

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部