期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
查询歧义性程度自动标注指标的替代性验证研究 被引量:3
1
作者 桂思思 张晓娟 王鑫 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第2期79-89,共11页
【目的】针对查询歧义性程度的标注问题,通过分析自动标注指标间的相关性及自动标注指标与人工标注指标的一致性,以期获得在一定程度上能替代其他自动标注指标和人工标注的自动标注指标。【方法】分别选取基于文档、用户以及查询词项特... 【目的】针对查询歧义性程度的标注问题,通过分析自动标注指标间的相关性及自动标注指标与人工标注指标的一致性,以期获得在一定程度上能替代其他自动标注指标和人工标注的自动标注指标。【方法】分别选取基于文档、用户以及查询词项特征的自动标注指标,依据查询词项对应类目的频率改进一种基于查询词项特征的自动标注指标;利用皮尔逊相关系数与对称AP相关系数分析自动标注结果之间的相关性,利用宏平均F1与宏平均准确率分析自动标注指标与人工标注结果的一致性。【结果】自动标注指标之间相关性较弱;本文改进的自动标注指标与人工标注指标之间一致性最高:宏平均F1值与宏平均准确率分别为0.623与0.707。【局限】限于目录型网站的查询词项覆盖率,部分自动标注指标无法用于所有歧义性查询,导致用于检验替代性的歧义查询数量较少。【结论】自动标注指标之间的替代性较弱;查询词项对应类目的频率能提高基于查询词项特征的自动标注指标间一致性;与已有自动标注指标相比,本文改进的自动标注指标与人工标注结果一致性最高,在一定程度上可替代人工标注。 展开更多
关键词 查询歧义性程度 自动标注 人工标注 替代 相关 一致
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部