期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
查询歧义性程度自动标注指标的替代性验证研究
被引量:
3
1
作者
桂思思
张晓娟
王鑫
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019年第2期79-89,共11页
【目的】针对查询歧义性程度的标注问题,通过分析自动标注指标间的相关性及自动标注指标与人工标注指标的一致性,以期获得在一定程度上能替代其他自动标注指标和人工标注的自动标注指标。【方法】分别选取基于文档、用户以及查询词项特...
【目的】针对查询歧义性程度的标注问题,通过分析自动标注指标间的相关性及自动标注指标与人工标注指标的一致性,以期获得在一定程度上能替代其他自动标注指标和人工标注的自动标注指标。【方法】分别选取基于文档、用户以及查询词项特征的自动标注指标,依据查询词项对应类目的频率改进一种基于查询词项特征的自动标注指标;利用皮尔逊相关系数与对称AP相关系数分析自动标注结果之间的相关性,利用宏平均F1与宏平均准确率分析自动标注指标与人工标注结果的一致性。【结果】自动标注指标之间相关性较弱;本文改进的自动标注指标与人工标注指标之间一致性最高:宏平均F1值与宏平均准确率分别为0.623与0.707。【局限】限于目录型网站的查询词项覆盖率,部分自动标注指标无法用于所有歧义性查询,导致用于检验替代性的歧义查询数量较少。【结论】自动标注指标之间的替代性较弱;查询词项对应类目的频率能提高基于查询词项特征的自动标注指标间一致性;与已有自动标注指标相比,本文改进的自动标注指标与人工标注结果一致性最高,在一定程度上可替代人工标注。
展开更多
关键词
查询歧义性程度
自动标注
人工标注
替代
性
相关
性
一致
性
原文传递
题名
查询歧义性程度自动标注指标的替代性验证研究
被引量:
3
1
作者
桂思思
张晓娟
王鑫
机构
武汉大学信息管理学院
武汉大学信息检索与知识挖掘研究所
西南大学计算机与信息科学学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019年第2期79-89,共11页
基金
国家社会科学基金青年项目"融合用户个性化与实时性意图的查询推荐模型研究"(项目编号:15CTQ019)的研究成果之一
文摘
【目的】针对查询歧义性程度的标注问题,通过分析自动标注指标间的相关性及自动标注指标与人工标注指标的一致性,以期获得在一定程度上能替代其他自动标注指标和人工标注的自动标注指标。【方法】分别选取基于文档、用户以及查询词项特征的自动标注指标,依据查询词项对应类目的频率改进一种基于查询词项特征的自动标注指标;利用皮尔逊相关系数与对称AP相关系数分析自动标注结果之间的相关性,利用宏平均F1与宏平均准确率分析自动标注指标与人工标注结果的一致性。【结果】自动标注指标之间相关性较弱;本文改进的自动标注指标与人工标注指标之间一致性最高:宏平均F1值与宏平均准确率分别为0.623与0.707。【局限】限于目录型网站的查询词项覆盖率,部分自动标注指标无法用于所有歧义性查询,导致用于检验替代性的歧义查询数量较少。【结论】自动标注指标之间的替代性较弱;查询词项对应类目的频率能提高基于查询词项特征的自动标注指标间一致性;与已有自动标注指标相比,本文改进的自动标注指标与人工标注结果一致性最高,在一定程度上可替代人工标注。
关键词
查询歧义性程度
自动标注
人工标注
替代
性
相关
性
一致
性
Keywords
Query Ambiguity Rating
Automatic Rating
Human Rating
Alternativeness
Correlation
Agreement
分类号
G354 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
查询歧义性程度自动标注指标的替代性验证研究
桂思思
张晓娟
王鑫
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2019
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部