期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于文献计量学的管理学学科半衰期研究 被引量:16
1
作者 卓可秋 《图书与情报》 CSSCI 北大核心 2014年第4期55-60,共6页
文章以CNKI收录管理学发文、引用和被引信息作为数据来源,从学科引用半衰期、学科被引半衰期指标及被引时序变化,分析了我国管理学学科知识老化现状。分析结果表明,管理学引用半衰期为5.80年,被引半衰期为3.45年,由此反映出目前管理学... 文章以CNKI收录管理学发文、引用和被引信息作为数据来源,从学科引用半衰期、学科被引半衰期指标及被引时序变化,分析了我国管理学学科知识老化现状。分析结果表明,管理学引用半衰期为5.80年,被引半衰期为3.45年,由此反映出目前管理学的文献老化速度偏快现象。同时发现,理论型子学科文献老化较慢,而应用型子学科文献老化速度较快。 展开更多
关键词 学科半衰期 管理学 被引半衰期 引用半衰期 文献计量学 引文分析
下载PDF
IPTV中基于使用体验的用户流失预测和挽留方法 被引量:2
2
作者 舒文丽 卓可秋 《信息通信》 2020年第8期244-246,共3页
目前各大电信运营商的业务形态越来越呈现同质化的趋势,如何有效地控制用户离网、增加客户粘度是运营商非常关注的领域,前提是需要提前甄别出高风险流失用户,进而通过运营或客服策略进行干预,才能有效减低用户流失率。由此,通过在用户... 目前各大电信运营商的业务形态越来越呈现同质化的趋势,如何有效地控制用户离网、增加客户粘度是运营商非常关注的领域,前提是需要提前甄别出高风险流失用户,进而通过运营或客服策略进行干预,才能有效减低用户流失率。由此,通过在用户体验和用户行为中,引入二次特征提取的方法,从多个维度描述用户体验和行为,并针对多个维度分别建模,以提高流失与非流失用户体验的可分性;然后再使用强化学习方法,以可挽留的、高价值用户为参考基准,调整流失预测模型,使得预测出的高风险流失用户更具商业价值。此外,还从运营策略和视频网络服务质量两个层面进行优化,从而提高挽留高风险流失用户的可能性。 展开更多
关键词 二次特征 强化学习 分类器 预测模型
下载PDF
一种基于Spark的论文相似性快速检测方法 被引量:2
3
作者 卓可秋 童国平 虞为 《图书情报工作》 CSSCI 北大核心 2015年第11期134-142,共9页
[目的/意义]从大规模已知文本集中检测出与待检测论文的相似文本并计算相似度大小,用于满足在线论文相似性检测秒级响应需求。[方法/过程]采用分治法策略,对已知文本句集进行基于正交基的软聚类预处理,并对软聚类后的每个簇建立倒排索... [目的/意义]从大规模已知文本集中检测出与待检测论文的相似文本并计算相似度大小,用于满足在线论文相似性检测秒级响应需求。[方法/过程]采用分治法策略,对已知文本句集进行基于正交基的软聚类预处理,并对软聚类后的每个簇建立倒排索引。接着在快数据处理平台Spark上执行相似性检测,采用字符结合词组形式计算出待检测论文与已知文本的相似度大小。[结果/结论]通过200万规模的已知文本集实验结果显示,综合4种类型的待检测论文,所提出的倒排索引结合软聚类算法准确率P为100.0%,召回率R为93.6%,调和平均值F为96.7%。调和平均值F比相似性检测算法LCS高10%左右,比Simhash算法高约23%。在检测速度上,对于一篇字数为5 000左右的待检测论文,检测时间约为6.5秒,比Simhash算法快近300倍,比LCS算法快约4 000倍,此外,实验结果还表明基于Spark的分布式并行相似性检测算法具有较好的可扩展性。 展开更多
关键词 论文相似性检测 Spark快数据处理 正交基软聚类 倒排索引
原文传递
突发事件检测的MapReduce并行化实现 被引量:3
4
作者 卓可秋 虞为 苏新宁 《现代图书情报技术》 CSSCI 2015年第2期46-54,共9页
【目的】在大数据环境下,从文本流中准确且快速地检测出特定领域的突发事件。【方法】利用Kleinberg突发检测方法和LDA主题模型方法,将其扩展到Map Reduce并行框架中,实现并行语料预处理、并行突发词检测、并行突发文档过滤和并行主题... 【目的】在大数据环境下,从文本流中准确且快速地检测出特定领域的突发事件。【方法】利用Kleinberg突发检测方法和LDA主题模型方法,将其扩展到Map Reduce并行框架中,实现并行语料预处理、并行突发词检测、并行突发文档过滤和并行主题提取。【结果】对新闻文本流进行模拟仿真实验,结果表明,该并行方法在特定领域突发事件检测中准确率P、召回率R和调和平均值F分别最高可达87.50%、77.78%和82.35%。【局限】基于Map Reduce的并行方法难以实现大规模动态文本流在线(Online)实时(Real-time)突发事件检测。【结论】与传统串行突发事件检测方法相比,所构建的分布式并行化方法在保证检测结果正确性的同时,具有良好的可扩展性,性能得到较大提升。 展开更多
关键词 突发事件检测 MAPREDUCE 分布式处理 LDA 主题模型
原文传递
自有知识增强下的学术全文本关系抽取研究 被引量:1
5
作者 卓可秋 沈思 王东波 《图书情报工作》 CSSCI 北大核心 2022年第7期120-131,共12页
[目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。[方法... [目的/意义]学术全文本下的关系抽取是学术全文本知识图谱构建的关键技术,所构建的学术知识图谱能够实现文献的结构化、知识化,提高研究人员检索文献、分析文献和把握科研动态的效率,以及通过图谱的认知推理,有助于隐式知识发现。[方法/过程]通过外部知识来增强关系抽取已在不少研究取得成果,但针对特定领域的关系抽取往往缺少可用的外部知识。研究发现,全文本中自有的高置信度的知识也可以用来辅助全文本关系抽取。受认知过程双系统理论(系统1为直觉认知,系统2为推理认知)启发,设计一个句子级模型来获取知识,并通过远程监督方式获取高置信度知识,然后将高置信度知识融入到全文本级深度学习模型最后分类的一层上。[结果/结论]在生物医学学术全文本数据集(CDR-revised)上,比当前最先进的模型在F1上提高11.13%。 展开更多
关键词 学术全文本 关系抽取 自有知识增强 知识图谱
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部