-
题名融合多特征的越南语新闻文本词汇链构建方法
- 1
-
-
作者
陈杨
周枫
周兰江
严馨
-
机构
昆明理工大学信息工程与自动化学院
-
出处
《计算机工程与设计》
北大核心
2017年第6期1536-1540,共5页
-
基金
国家自然科学基金项目(61562049)
-
文摘
为帮助读者更快掌握新闻文本的主旨,确定篇章结构,使用维基百科语义资源库,基于文档链接信息图和分类结构图两大特征计算候选词的路径信息和节点深度以及文档分类信息,利用语关相似度和语似相关度进行初步词汇链的构建,结合越南语特征,提出5个特征项对初建词汇链优化加权处理,实现词汇链最终构建。实验结果表明,对比使用HowNet、WordNet语料库的方法,该方法在准确率和召回率上有显著提高。
-
关键词
维基百科
词汇链构建
语义相似度
语义相关度
融合多特征
-
Keywords
Wikipedia
lexical chain construction
semantic similarity
semantic relatedness
fusion multi characteristics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-