期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
网页质量评价体系的研究
被引量:
4
1
作者
魏超
陈飞
+3 位作者
许丹青
张敏
刘奕群
马少平
《中文信息学报》
CSCD
北大核心
2011年第5期3-8,共6页
网络数据的飞速增长为搜索引擎带来了巨大的存储和网络服务压力,大量冗余、低质量乃至垃圾数据造成了搜索引擎存储与运算能力的巨大浪费,在这种情况下,如何建立适合万维网实际应用环境的网页数据质量评估体系与评估算法成为了信息检索...
网络数据的飞速增长为搜索引擎带来了巨大的存储和网络服务压力,大量冗余、低质量乃至垃圾数据造成了搜索引擎存储与运算能力的巨大浪费,在这种情况下,如何建立适合万维网实际应用环境的网页数据质量评估体系与评估算法成为了信息检索领域的重要研究课题。在前人工作的基础上,通过网络用户及网页设计人员的参与,文章提出了包括权威知名度、内容、时效性和网页外观呈现四个维度十三个因素的网页质量评价体系;标注数据显示我们的网页质量评价体系具有较强的可操作性,标注结果比较一致;文章最后使用Ordinal Logistic Regres-sion模型对评价体系的各个维度的重要性进行了分析并得出了一些启发性的结论:互联网网页内容和实效性能否满足用户需求是决定其质量的重要因素。
展开更多
关键词
信息检索
网页质量评价
ORDINAL
LOGISTIC
Regression
下载PDF
职称材料
基于日志挖掘的搜索引擎用户行为分析
被引量:
31
2
作者
岑荣伟
刘奕群
+2 位作者
张敏
茹立云
马少平
《中文信息学报》
CSCD
北大核心
2010年第3期49-54,共6页
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日...
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同类型的查询集合,考察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都具有一定的参考意义。
展开更多
关键词
计算机应用
中文信息处理
用户行为分析
搜索引擎
网络信息检索
下载PDF
职称材料
文本可视化研究综述
被引量:
53
3
作者
唐家渝
刘知远
孙茂松
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2013年第3期273-285,共13页
随着海量文本的涌现,信息超载和数据过剩等问题促使了文本可视化技术的出现.文本可视化技术综合了文本分析、数据挖掘、数据可视化、计算机图形学、人机交互、认知科学等学科的理论和方法,为人们提供了一种理解复杂文本的内容、结构和...
随着海量文本的涌现,信息超载和数据过剩等问题促使了文本可视化技术的出现.文本可视化技术综合了文本分析、数据挖掘、数据可视化、计算机图形学、人机交互、认知科学等学科的理论和方法,为人们提供了一种理解复杂文本的内容、结构和内在规律等信息的有效手段.文中首先阐述了文本可视化的概念和重要性,然后按照不同可视化对象类型综述了文本可视化的研究现状,并介绍了典型的文本可视化方法与方案;最后,对文本可视化的未来研究方向进行了展望.
展开更多
关键词
信息可视化
可视分析
文本分析
信息抽取
人机交互界面
下载PDF
职称材料
面向用户互联网访问日志的异常点击分析
被引量:
5
4
作者
王倩
刘奕群
+1 位作者
马少平
茹立云
《中文信息学报》
CSCD
北大核心
2010年第3期44-48,61,共6页
随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用...
随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用户以及单用户多IP等可能的异常点击,从访问集中度,用户平均访问量等方面进行了分析。我们认为对于连续点击,用户行为分析研究人员可以分情况滤去多余点击或该用户所有点击,而对于单IP多用户和单用户多IP的点击,我们建议不做处理。
展开更多
关键词
计算机应用
中文信息处理
用户行为分析
互联网访问日志
异常点击
下载PDF
职称材料
题名
网页质量评价体系的研究
被引量:
4
1
作者
魏超
陈飞
许丹青
张敏
刘奕群
马少平
机构
智能
技术与
系统
国家
重点
实验室
清华
信息科学
与技术
国家
实验室
(
筹
)
清华大学
计算机
科学与
技术
系
出处
《中文信息学报》
CSCD
北大核心
2011年第5期3-8,共6页
基金
自然科学基金资助项目(60736044
60903107
+1 种基金
61073071)
高等学校博士学科点专项科研基金资助项目(20090002120005)
文摘
网络数据的飞速增长为搜索引擎带来了巨大的存储和网络服务压力,大量冗余、低质量乃至垃圾数据造成了搜索引擎存储与运算能力的巨大浪费,在这种情况下,如何建立适合万维网实际应用环境的网页数据质量评估体系与评估算法成为了信息检索领域的重要研究课题。在前人工作的基础上,通过网络用户及网页设计人员的参与,文章提出了包括权威知名度、内容、时效性和网页外观呈现四个维度十三个因素的网页质量评价体系;标注数据显示我们的网页质量评价体系具有较强的可操作性,标注结果比较一致;文章最后使用Ordinal Logistic Regres-sion模型对评价体系的各个维度的重要性进行了分析并得出了一些启发性的结论:互联网网页内容和实效性能否满足用户需求是决定其质量的重要因素。
关键词
信息检索
网页质量评价
ORDINAL
LOGISTIC
Regression
Keywords
information retrieval
web page quality evaluation
Ordinal Logistic Regression
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于日志挖掘的搜索引擎用户行为分析
被引量:
31
2
作者
岑荣伟
刘奕群
张敏
茹立云
马少平
机构
智能
技术与
系统
国家
重点
实验室
清华
信息科学
与技术
国家
实验室
(
筹
)
清华大学
计算机
科学与
技术
系
出处
《中文信息学报》
CSCD
北大核心
2010年第3期49-54,共6页
基金
国家自然科学基金项目资助(60736044
60903107)
高等学校博士学科点专项科研基金资助(20090002120005)
文摘
随着网络搜索用户的大规模增加,网络用户行为分析已成为网络信息检索系统进行架构分析、性能优化和系统维护的重要基石,是网络信息检索和知识挖掘的重要研究领域之一。为更好理解网络用户的搜索行为,该文基于7.56亿条真实网络用户行为日志,对用户行为进行分析和研究。我们主要考察了用户搜索行为中的查询长度、查询修改率、相关搜索点击率、首次/最后一次点击位置分布以及查询内点击数分布等信息。该文还基于不同类型的查询集合,考察用户在不同查询需求下的行为差异性。相关分析结果对搜索引擎算法优化和系统改进等都具有一定的参考意义。
关键词
计算机应用
中文信息处理
用户行为分析
搜索引擎
网络信息检索
Keywords
computer application
Chinese information processing
user behavior analysis
search engine
web information retrieval
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
文本可视化研究综述
被引量:
53
3
作者
唐家渝
刘知远
孙茂松
机构
智能
技术与
系统
国家
重点
实验室
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2013年第3期273-285,共13页
基金
国家自然科学基金重点项目(61133012)
文摘
随着海量文本的涌现,信息超载和数据过剩等问题促使了文本可视化技术的出现.文本可视化技术综合了文本分析、数据挖掘、数据可视化、计算机图形学、人机交互、认知科学等学科的理论和方法,为人们提供了一种理解复杂文本的内容、结构和内在规律等信息的有效手段.文中首先阐述了文本可视化的概念和重要性,然后按照不同可视化对象类型综述了文本可视化的研究现状,并介绍了典型的文本可视化方法与方案;最后,对文本可视化的未来研究方向进行了展望.
关键词
信息可视化
可视分析
文本分析
信息抽取
人机交互界面
Keywords
information visualization, visual analytics, text analysis, information extraction, human-computer interaction interface
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向用户互联网访问日志的异常点击分析
被引量:
5
4
作者
王倩
刘奕群
马少平
茹立云
机构
智能
技术与
系统
国家
重点
实验室
清华
信息科学
与技术
国家
实验室
(
筹
)
清华大学
计算机
科学与
技术
系
出处
《中文信息学报》
CSCD
北大核心
2010年第3期44-48,61,共6页
基金
国家自然科学基金项目资助(60736044
60903107)
高等学校博士学科点专项科研基金资助(20090002120005)
文摘
随着互联网用户人数的日益增长,用户行为分析已经成为互联网技术领域重要的研究方法之一。在日志中去除异常点击,对于准确挖掘用户行为的意图和习惯十分重要。该文采用某公司提供的真实用户互联网访问日志,对日志中的连续点击,单IP多用户以及单用户多IP等可能的异常点击,从访问集中度,用户平均访问量等方面进行了分析。我们认为对于连续点击,用户行为分析研究人员可以分情况滤去多余点击或该用户所有点击,而对于单IP多用户和单用户多IP的点击,我们建议不做处理。
关键词
计算机应用
中文信息处理
用户行为分析
互联网访问日志
异常点击
Keywords
computer application
Chinese information processing
user behavior analysis
web user access logs
abnormal click
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
网页质量评价体系的研究
魏超
陈飞
许丹青
张敏
刘奕群
马少平
《中文信息学报》
CSCD
北大核心
2011
4
下载PDF
职称材料
2
基于日志挖掘的搜索引擎用户行为分析
岑荣伟
刘奕群
张敏
茹立云
马少平
《中文信息学报》
CSCD
北大核心
2010
31
下载PDF
职称材料
3
文本可视化研究综述
唐家渝
刘知远
孙茂松
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2013
53
下载PDF
职称材料
4
面向用户互联网访问日志的异常点击分析
王倩
刘奕群
马少平
茹立云
《中文信息学报》
CSCD
北大核心
2010
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部