-
题名一种结合标签分类和语义查询扩展的文本素材推荐方法
- 1
-
-
作者
孟怡悦
彭蓉
吕其标
-
机构
武汉大学计算机学院
-
出处
《计算机科学》
CSCD
北大核心
2023年第1期76-86,共11页
-
基金
教育部-中国移动联合基金项目(MCM2020J01)。
-
文摘
在各类规划、调研报告的编制过程中,编制人员往往需要根据拟定的目录或标题去收集、阅读大量文本素材,分类整理后再甄选使用,不仅工作量大而且质量无法得到保障。为此,在数字政府规划文档编制领域中提出了一种结合标签分类和语义查询扩展的文本素材推荐方法,从信息检索的角度出发,将目录中的各级标题视为查询语句,将参阅的文本素材作为目标文档,从而进行文本素材检索与推荐。该方法基于差分进化算法,将基于词向量平均的文本素材推荐方法、基于语义查询扩展的文本素材推荐方法和基于标签分类的文本素材推荐方法有机结合,弥补了传统的文本素材推荐方法的不足,实现了通过目录结构的标题检索以段落为粒度的文本素材。在10个数据集上的实验验证结果表明,该方法的性能提升显著,能够大大减少人工素材选择的工作量,同时减少素材分类的工作量,降低文档编制的难度。
-
关键词
文本素材推荐
信息检索
数字政府
查询扩展
差分进化算法
-
Keywords
Text material recommendation
Information retrieval
Digital government
Query expansion
Differential evolution algorithm
-
分类号
TP311.5
[自动化与计算机技术—计算机软件与理论]
-