期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于日志挖掘的检索推荐系统 被引量:3
1
作者 朱鲲鹏 刘文涵 +1 位作者 王晓龙 刘远超 《沈阳建筑大学学报(自然科学版)》 CAS 北大核心 2009年第2期366-370,共5页
目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率... 目的为了有效地预测用户在信息检索过程中可能点击的检索结果,从而进行网页的智能推荐.方法采取网络日志挖掘的技术,通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为网页推荐的依据.结果提出了一种检索推荐统计模型,并构建了相应的原型系统,实验表明该方法显著提高了推荐系统的准确率.结论这项技术有效地提高了推荐结果与用户信息需求的相关程度,使推荐系统的性能获得了较大地提高,可以很好的应用于信息检索的智能推荐服务领域. 展开更多
关键词 网页推荐 信息检索 日志挖掘 文档相关度
下载PDF
软件开发和管理过程中的演化分析和设计 被引量:2
2
作者 杨萍 徐良贤 陈英 《计算机应用与软件》 CSCD 北大核心 2002年第3期1-4,37,共5页
本文首先介绍了软件过程的概念,提出了软件过程中演化研究的重要性,然后按演化产生的原因对软件演化进行了分类,并分别讨论了软件开发过程中固有的需求演化、分工演化、调试演化、重用演化和工具环境演化以及软件过程管理中的个体视图... 本文首先介绍了软件过程的概念,提出了软件过程中演化研究的重要性,然后按演化产生的原因对软件演化进行了分类,并分别讨论了软件开发过程中固有的需求演化、分工演化、调试演化、重用演化和工具环境演化以及软件过程管理中的个体视图演化和模板类演化,分析了这些演化之间的关系,简要地介绍了我们设计的文档日志以及如何利用文档日志确定演化范围。 展开更多
关键词 演化 文档日志 演化范围 软件开发 软件管理过程 软件工程 计算机
下载PDF
Web挖掘技术研究 被引量:21
3
作者 张蓉 《计算机工程》 EI CAS CSCD 北大核心 2006年第15期4-6,共3页
随着互联网的飞速发展,Web挖掘技术已成为数据挖掘技术的一个研究热点。该文对Web挖掘的特点、方法进行了讨论,设计了一种快速有效的Web文档聚类方法,给出了实际测试结果,验证了Web挖掘技术的有效性。提出的Web挖掘技术有效地提高了该... 随着互联网的飞速发展,Web挖掘技术已成为数据挖掘技术的一个研究热点。该文对Web挖掘的特点、方法进行了讨论,设计了一种快速有效的Web文档聚类方法,给出了实际测试结果,验证了Web挖掘技术的有效性。提出的Web挖掘技术有效地提高了该系统的协作能力。 展开更多
关键词 WEB挖掘 日志文件 文档聚类 矢量空间模型 关联规则
下载PDF
基于用户浏览时间的点击模型 被引量:3
4
作者 何靖 袁文清 闫宏飞 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第4期26-31,37,共7页
用户的点击行为会受到用户的浏览行为、周围文档的特征等因素的影响,故在分析用户点击日志时不能直接将用户点击解释为文档相关性.为了更加准确地获得文档的相关性特征,文中提出了基于用户浏览时间的点击模型.假设文档原文的相关性会影... 用户的点击行为会受到用户的浏览行为、周围文档的特征等因素的影响,故在分析用户点击日志时不能直接将用户点击解释为文档相关性.为了更加准确地获得文档的相关性特征,文中提出了基于用户浏览时间的点击模型.假设文档原文的相关性会影响用户浏览该文档原文的时间,即文档越相关用户浏览文档的耗时越长,这样便可利用用户浏览文档的时间来推测文档的相关程度;经过分析,确定使用指数分布来描述浏览时间;最后通过实验验证了该模型的有效性.结果表明,所提出的模型能够比较好地估计文档的相关性,更加准确地预测用户的点击情况,其性能优于现有的点击模型. 展开更多
关键词 搜索引擎日志 点击模型 文档相关性特征 浏览时间
下载PDF
基于文档相关度计算的网页预测模型 被引量:3
5
作者 朱鲲鹏 魏芳 《计算机应用与软件》 CSCD 北大核心 2012年第2期109-112,189,共5页
基于网络日志挖掘的网页预测系统可以有效地分析用户未来的网络访问请求,从而达到智能推荐、改善网络性能等目的。针对目前的预测模型缺乏有效的语义处理的问题,将词语语义信息和统计语言模型相结合,提出一种基于文档相关度计算的网页... 基于网络日志挖掘的网页预测系统可以有效地分析用户未来的网络访问请求,从而达到智能推荐、改善网络性能等目的。针对目前的预测模型缺乏有效的语义处理的问题,将词语语义信息和统计语言模型相结合,提出一种基于文档相关度计算的网页统计预测模型。通过词频信息和知网(HowNet)中词的概念计算模型计算网页文档间的主题相关度,再将该语义信息与统计模型计算的条件概率值相结合,以此作为预测的依据。实验表明,该技术使预测模型的性能获得了较大的提高。 展开更多
关键词 网页预测 统计语言模型 日志挖掘 文档相关度
下载PDF
《明史》正误四则
6
作者 王毓蔺 尹钧科 《北京社会科学》 CSSCI 北大核心 2012年第3期87-92,共6页
现存殿本《明史》中的若干失误或待勘之处,多由《明史》成书时征引原始史料的失误或不审慎所致。本文追源朔流,查考《明史》纂修所依据的若干原始文献,并认真覆核殿本《明史》的相关内容,发现其中的错漏或待勘之处,为进一步研究和利用... 现存殿本《明史》中的若干失误或待勘之处,多由《明史》成书时征引原始史料的失误或不审慎所致。本文追源朔流,查考《明史》纂修所依据的若干原始文献,并认真覆核殿本《明史》的相关内容,发现其中的错漏或待勘之处,为进一步研究和利用《明史》提供参考。 展开更多
关键词 《明史》勘误 采木 原始文献
下载PDF
基于查询与内容的文档表示模型 被引量:1
7
作者 阳小华 周座 《南华大学学报(自然科学版)》 2010年第1期39-42,共4页
在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一.根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈.该... 在信息检索中,文档表示模型的优劣是影响检索性能的重要因素之一.根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体.当前主流的文档表示模型主要利用语法和语义信息,造成语用信息的缺失,成为改善检索性能的瓶颈.该文提出了一种整合用户查询行为与文档内容的文档表示模型,将用户隐性反馈的语用信息和文档自身的语义、语法信息相结合,动态调整索引库关键词权重,从而提高信息检索的查全率和查准率. 展开更多
关键词 文档表示模型 用户查询日志 隐性反馈
下载PDF
互联网软件错误日志聚类 被引量:6
8
作者 程世文 裴丹 王长进 《小型微型计算机系统》 CSCD 北大核心 2018年第5期865-870,共6页
互联网内容提供商在实际运营过程中,所维护的各项业务随时可能会遇到各种各样的问题,将相应的大量错误日志经过聚类后及时反馈给相应的研发人员是排除问题的首要因素.为了有效解决海量非规范的错误日志的聚类问题,本文提出互联网软件错... 互联网内容提供商在实际运营过程中,所维护的各项业务随时可能会遇到各种各样的问题,将相应的大量错误日志经过聚类后及时反馈给相应的研发人员是排除问题的首要因素.为了有效解决海量非规范的错误日志的聚类问题,本文提出互联网软件错误日志聚类方法.该方法通过引入日志模板提取、日志压缩方法降低日志规模;通过引入计算文档频率提取特征词方法提高聚类准确性并降低数据维度;结合Canopy聚类和K-means聚类算法提升聚类效果.通过在某互联网公司运维中实际系统的检验,本文提出的方法不但具有比较理想的聚类效果,而且满足生产环境中的性能要求. 展开更多
关键词 聚类 错误日志 文档频率 Canopy算法 K-MEANS算法
下载PDF
唐代的更簿与直簿——以吐鲁番所出《唐某年二月西州高昌县更簿》为中心
9
作者 黄楼 《吐鲁番学研究》 2015年第1期46-64,共19页
《新获吐鲁番出土文献》收录一组吐鲁番所出唐前期西州高昌县直更的名簿,整理者命名为《唐某年二月西州高昌县更簿》。通过对文书的重新拼合、复原及深入研究,我们可以考知本组文书制作年代为唐高宗永徽、显庆年间。唐代户籍三年一造,... 《新获吐鲁番出土文献》收录一组吐鲁番所出唐前期西州高昌县直更的名簿,整理者命名为《唐某年二月西州高昌县更簿》。通过对文书的重新拼合、复原及深入研究,我们可以考知本组文书制作年代为唐高宗永徽、显庆年间。唐代户籍三年一造,在造籍之年的二月,各乡里正白日到县衙制作户籍,晚上则轮流宿直一更。更簿就是造籍期间各乡里正及典狱夜间轮流宿直的更次安排。唐代官衙官吏宿直皆有直簿,更簿就是造籍期间特殊的"直簿"。作为造籍过程中产生的原始文档,更簿具有很高的学术价值。对更簿的研究表明,造籍期间里正轮流直更,与官员宿直一样,是其本职工作,而不是衍生的职役。 展开更多
关键词 唐代 吐鲁番文书 更簿 直簿 里正 户籍制作
下载PDF
用户信息安全浅析
10
作者 陈华 《武汉冶金管理干部学院学报》 2009年第2期71-72,76,共3页
本文探讨了在计算机使用过程中由于用户疏忽所致的安全隐患,以加强用户的自我防范意识。论文重点从机密性、完整性、可用性三方面叙述了计算机安全的含义。从密码、登录过程、离开系统的安全隐患讨论了访问权限问题;还详细论述了文件、... 本文探讨了在计算机使用过程中由于用户疏忽所致的安全隐患,以加强用户的自我防范意识。论文重点从机密性、完整性、可用性三方面叙述了计算机安全的含义。从密码、登录过程、离开系统的安全隐患讨论了访问权限问题;还详细论述了文件、电子邮件的安全隐患问题。 展开更多
关键词 计算机安全 用户信息 访问权限 密码 登录 文件
下载PDF
基于Web日志挖掘的Web文档聚类 被引量:5
11
作者 高哲 魏海平 +1 位作者 王福威 赵晓碧 《计算机工程与设计》 CSCD 北大核心 2008年第18期4708-4710,共3页
Web日志挖掘是Web挖掘的一种,介绍了Web日志挖掘的一般过程,研究了k-means聚类算法,并分析了k-means聚类算法的不足。k-means聚类算法迭代过程中每次都需要计算每个数据对象到簇质心的距离,使得聚类效率不高,针对这个问题,提出了k-mean... Web日志挖掘是Web挖掘的一种,介绍了Web日志挖掘的一般过程,研究了k-means聚类算法,并分析了k-means聚类算法的不足。k-means聚类算法迭代过程中每次都需要计算每个数据对象到簇质心的距离,使得聚类效率不高,针对这个问题,提出了k-means聚类算法的改进算法,该算法避免了重复计算数据对象到簇质心的距离,并用这两种算法实现了Web文档的聚类。试验结果表明,该改进算法提高了聚类效率。 展开更多
关键词 日志挖掘 WEB日志 K-MEANS 文档聚类 日志预处理
下载PDF
数控测井仪程序带的目录结构分析
12
作者 孙新 《石油仪器》 1996年第2期34-36,共3页
文中讨论了CSU数控测井仪的程序带结构,介绍其中的文件目录与程序目录,分析了CSU是如何通过文件目录与程序目录管理程序带上的文件的。并在微机上实现了列目录功能,验证了我们的分析。
关键词 数控测井仪 程序设计 文件系统
下载PDF
我国图书馆、情报与文献学论文的引文分布研究 被引量:3
13
作者 王超 《情报杂志》 CSSCI 北大核心 2013年第1期68-72,共5页
以2001-2010年CSSCI收录的图书馆、情报与文献学论文引文数据为基础,分析了10年间篇均引文量、无引文论文数的变化;分析有引文论文的引文量分布特征,提出最可几引文量的概念。数据分析显示,10年间有引文论文的引文量分布呈相对一致的趋... 以2001-2010年CSSCI收录的图书馆、情报与文献学论文引文数据为基础,分析了10年间篇均引文量、无引文论文数的变化;分析有引文论文的引文量分布特征,提出最可几引文量的概念。数据分析显示,10年间有引文论文的引文量分布呈相对一致的趋势,可由对数正态分布函数近似表征。有引文论文引文量分布的中位数及最可几引文量绝对值的偏小,显示图情领域的研究者尚需更重视参考文献或进一步加强学术规范。 展开更多
关键词 图书馆 情报与文献学 篇均引文量 最可几引文量 CSSCI 对数正态分布
下载PDF
结合内容挖掘的事务识别改进 被引量:1
14
作者 苏晶 潘蕾 徐汀荣 《计算机应用》 CSCD 北大核心 2006年第6期1411-1414,共4页
把对网页内容挖掘中的文本聚类算法引入到事务识别的过程中。改进后的算法考虑了用户的浏览方式,消除了缓存、网络延迟等外界因素的影响,能更好的满足个性化推荐对事务识别的要求。
关键词 WEB日志挖掘 事务识别 数据预处理 文本聚类
下载PDF
RBS2000无线基站隐性故障的分析
15
作者 梁胜 裴红津 +1 位作者 尹旭 于德志 《现代电子技术》 2006年第6期76-78,85,共4页
介绍了GSM网络的基本结构及RBS2000的基本原理、各单元的基本功能。针对GSM网络规模不断扩大,系统故障量相应增大。根据日常网络维护经验及系统原理,对系统各种类型的故障进行分析,介绍系统故障的几种处理方法,并深入对系统隐性故障进... 介绍了GSM网络的基本结构及RBS2000的基本原理、各单元的基本功能。针对GSM网络规模不断扩大,系统故障量相应增大。根据日常网络维护经验及系统原理,对系统各种类型的故障进行分析,介绍系统故障的几种处理方法,并深入对系统隐性故障进行分析及排除隐性故障的处理方法,对加快网络故障抢修及提高网络维护技能具有指导作用。 展开更多
关键词 隐性故障 故障码 TRU 网络 log文件
下载PDF
基于安全文档的日志系统管理与分析
16
作者 王睦 《现代电子技术》 2011年第20期27-28,32,共3页
为了解决否认、伪造、篡改及冒充等问题,安全文档的日志系统管理已成为保护个人隐私的重要技术手段。在此,主要通过模块分析,运用Struts框架设计,实现了一个安全文档的日志管理,它主要通过因果顺序方法,对模块、系统构架、密钥等几方面... 为了解决否认、伪造、篡改及冒充等问题,安全文档的日志系统管理已成为保护个人隐私的重要技术手段。在此,主要通过模块分析,运用Struts框架设计,实现了一个安全文档的日志管理,它主要通过因果顺序方法,对模块、系统构架、密钥等几方面分析展示了数字签名技术在保证信息完整性和可靠性方面的作用。日志系统可以记录系统使用者的操作记录,可以通过它来检查错误发生的原因,或者受到攻击时攻击者留下的痕迹,使之可以对误操作予以及时的纠正,实现日志信息的数字签名。 展开更多
关键词 日志系统 安全文档 数字签名 strut框架
下载PDF
录井审核信息统计软件的设计开发 被引量:1
17
作者 王重云 《录井工程》 2022年第3期89-93,共5页
为规范完井后各种报表填写,提高资料处理效率,开发了录井审核信息统计软件。通过对用户业务现状和需求进行调研,开展软件需求分析,设计了软件的多层级架构和运行流程,并对基础应用层的工作原理进行了重点介绍。在此基础上,阐述了软件的... 为规范完井后各种报表填写,提高资料处理效率,开发了录井审核信息统计软件。通过对用户业务现状和需求进行调研,开展软件需求分析,设计了软件的多层级架构和运行流程,并对基础应用层的工作原理进行了重点介绍。在此基础上,阐述了软件的实现技术和功能特点,以及部分具体功能的实现原理和方法,验证了软件各项功能的有效性。利用软件输出报表与人工填写报表过程相比,具有速度快、准确性高等特点,有利于提高工作效率,降低人工成本,实现报表填写的规范化和自动化。 展开更多
关键词 软件开发 报表填写 录井报表 文档生成
下载PDF
卫星气象数据业务系统上行信息传输数据流程 被引量:2
18
作者 艾艳 张颖 王敏 《河南气象》 2002年第2期39-40,共2页
介绍了卫星气象数据业务系统中上行气象信息的具体数据流程及有关上行传输设置。
关键词 卫星 气象数据 信息传输 数据流程 文件名命名规定 路由 日志 9210工程
下载PDF
一种个性化信息检索服务界面的设计与实现 被引量:5
19
作者 古可 李广建 《图书情报工作》 CSSCI 北大核心 2012年第9期37-41,共5页
设计一种个性化的信息检索服务界面,介绍实现该界面的主要支撑模块,阐述数据异步处理、聚类计算方法、检索日志挖掘以及相关文献推荐技术的应用,给出界面的实现形式。在具体实现中,采用后台脱机计算和前台联机计算相结合的方式,并使用... 设计一种个性化的信息检索服务界面,介绍实现该界面的主要支撑模块,阐述数据异步处理、聚类计算方法、检索日志挖掘以及相关文献推荐技术的应用,给出界面的实现形式。在具体实现中,采用后台脱机计算和前台联机计算相结合的方式,并使用异步处理技术,减少时间延迟,保证实用性。 展开更多
关键词 检索服务 主题聚类 检索日志挖掘 相关文献推荐
原文传递
QQ即时通讯软件的计算机取证研究 被引量:1
20
作者 李星翚 刘佳佳 《心智与计算》 2010年第3期203-209,共7页
QQ已成为国内主流的在线即时通讯软件。由于QQ巨大的用户规模,很多不法分子以QQ作为媒介来进行违法犯罪活动,因此分析QQ好友列表和聊天内容中的信息是计算机调查取证的一个重要研究方向。本文分别深入研究了中国最流行的即时通讯软件QQ... QQ已成为国内主流的在线即时通讯软件。由于QQ巨大的用户规模,很多不法分子以QQ作为媒介来进行违法犯罪活动,因此分析QQ好友列表和聊天内容中的信息是计算机调查取证的一个重要研究方向。本文分别深入研究了中国最流行的即时通讯软件QQ好友列表和聊天内容的信息存储结构和有效数据的加密方式,并提出了一种基于复合文档格式的QQ客户端好友列表文件和聊天记录文件的全面解析方案。从而,为计算机调查取证工作提供了有力的工具。 展开更多
关键词 复合文档格式 数据段 好友列表 聊天记录 解密分析
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部