-
题名基于屏幕视觉热区的中文短文本关键词实时提取方法
被引量:2
- 1
-
-
作者
张婷婷
王伟军
黄英辉
刘凯
胡祥恩
-
机构
华中师范大学信息管理学院
华中师范大学青少年网络心理与行为教育部重点实验室
上海外国语大学国际工商管理学院
美国孟菲斯大学智能系统研究所&心理学系
-
出处
《情报学报》
CSSCI
北大核心
2016年第12期1313-1322,共10页
-
基金
国家自然科学基金项目(71571084
71271099
+1 种基金
71471019)
国家留学基金资助项目(201506775025)的研究成果之一
-
文摘
准确地获取用户偏好信息是个性化推荐的基础,而关键词提取技术则是用户偏好信息提取技术的关键。区别于传统的对整个网页页面进行关键词提取,本文提出的基于屏幕视觉热区的中文短文本关键词实时提取方法,主要针对用户浏览网页存在的屏幕视觉热区内的短文本进行关键词提取。首先,人工抽取屏幕视觉热区中的中文短文本作为原始数据,针对实时性的要求,选取TF-IWF、位置统计性分布、词距三个特征项构建中文短文本提取模型。实验数据表明,位置统计性分布及词距对关键词提取的准确率并没有显著提高,仅TF-IWF一种特征,准确率就能达到70%,同时经过实际验证本方法具有良好的稳定性,且实时性已经达到用户满意的程度,远远小于用户所能接受的容忍时域。
-
关键词
屏幕视觉热区
中文短文本
关键词提取
用户偏好
实时偏好
-
Keywords
visual hotspot on screen, Chinese short text, keywords extraction, user preference, real-time preference
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-