-
题名融合文本概念化与网络表示的观点检索
被引量:6
- 1
-
-
作者
廖祥文
刘德元
桂林
程学旗
陈国龙
-
机构
福州大学数学与计算机科学学院
福建省网络计算与智能信息处理重点实验室(福州大学)
网络数据科学与技术重点实验室(中国科学院)
-
出处
《软件学报》
EI
CSCD
北大核心
2018年第10期2899-2914,共16页
-
基金
国家自然科学基金(61772135
U1605251)
+4 种基金
中国科学院网络数据科学与技术重点实验室开放基金(CASNDST 201708
CASNDST201606)
可信分布式计算与服务教育部重点实验室主任基金(2017KF01)
福建省自然科学基金(2017J01755)
赛尔网络下一代互联网技术创新项目(NGII20160501)~~
-
文摘
观点检索是自然语言处理领域中的一个热点研究课题.现有的观点检索模型在检索过程中往往无法根据上下文将词汇进行知识、概念层面的抽象,在语义层面忽略词汇之间的语义联系,观点层面缺乏观点泛化能力.因此,提出一种融合文本概念化与网络表示的观点检索方法.该方法首先利用知识图谱分别将用户查询和文本概念化到正确的概念空间,并利用网络表示将知识图谱中的词汇节点表示成低维向量,然后根据词向量推出查询和文本的向量,并用余弦公式计算用户查询与文本的相关度,接着引入基于统计机器学习的分类方法挖掘文本的观点.最后,利用概念空间、网络表示空间以及观点分析结果构建特征,并服务于观点检索模型.相关实验结果表明,所提出的检索模型可以有效提高多种检索模型的观点检索性能.其中,基于统一相关模型的观点检索方法在两个实验数据集上相比于基准方法,在MAP评价指标上分别提升了6.1%和9.3%,基于排序学习的观点检索方法在两个实验数据集上相比于基准方法,在MAP评价指标上分别提升了2.3%和14.6%.
-
关键词
信息检索
观点检索
知识图谱
文本概念化
网络表示
-
Keywords
information retrieval
opinion retrieval
knowledge graph
text conceptualization
network embedding
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-