期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
Intelligent Agent-Based System for Digital Library Information Retrieval 被引量:1
1
作者 师雪霖 牛振东 +1 位作者 宋瀚涛 宋丽哲 《Journal of Beijing Institute of Technology》 EI CAS 2003年第4期450-454,共5页
A new information search model is reported and the design and implementation of a system based on intelligent agent is presented. The system is an assistant information retrieval system which helps users to search wha... A new information search model is reported and the design and implementation of a system based on intelligent agent is presented. The system is an assistant information retrieval system which helps users to search what they need. The system consists of four main components: interface agent, information retrieval agent, broker agent and learning agent. They collaborate to implement system functions. The agents apply learning mechanisms based on an improved ID3 algorithm. 展开更多
关键词 intelligent agent information retrieval agent cooperation machine learning
下载PDF
基于推荐列表的缺陷文件识别
2
作者 王昭丹 邹卫琴 刘文杰 《计算机科学》 CSCD 北大核心 2024年第S01期802-809,共8页
缺陷定位是缺陷修复的关键步骤,同时也是一项繁琐的软件活动。现有的静态缺陷定位技术通常将缺陷定位视为一个检索任务,即为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排列的可疑文件推荐列表。然而,开发人员仍需人工一一审查... 缺陷定位是缺陷修复的关键步骤,同时也是一项繁琐的软件活动。现有的静态缺陷定位技术通常将缺陷定位视为一个检索任务,即为每个缺陷报告生成一份按照程序实体与缺陷相关度降序排列的可疑文件推荐列表。然而,开发人员仍需人工一一审查从而找到真正有缺陷的文件,这增加了定位的时间和成本。为解决这个问题,提出了一个相应的解决方案。首先运行主流的基于信息检索的静态缺陷定位技术来获得一个初始的可疑文件推荐列表;然后依据问题特性提出3类领域特征,并基于这3类特征构建一个机器学习模型,尝试从列表中识别出真正有缺陷(Truly Buggy)的源代码文件。在4个开源项目(Zoo-Keeper,OpenJPA,Tomcat,AspectJ)的2558个bug上进行了实验,结果表明,在最初可疑文件推荐列表上可以获得72.6%~80.7%的真正有缺陷的文件预测准确率。同时探究了3类特征子集及各个特征在预测真正有缺陷的文件上的重要性,发现缺陷报告与源代码的关系特征更重要。 展开更多
关键词 缺陷报告 缺陷定位 机器学习 信息检索 缺陷文件
下载PDF
人口普查中行业和职业编码智能化——国际经验与中国进程
3
作者 孙望书 孙旭 《统计研究》 北大核心 2023年第3期151-160,共10页
行业和职业编码是人口普查中行业和职业信息采集与量化分析之间必要的资料整理环节。随着信息技术的快速发展及其在社会管理工作中的广泛应用,人口普查行业和职业编码走上了智能化探索之路。智能化计算机编码极大减少编码工作对人工的依... 行业和职业编码是人口普查中行业和职业信息采集与量化分析之间必要的资料整理环节。随着信息技术的快速发展及其在社会管理工作中的广泛应用,人口普查行业和职业编码走上了智能化探索之路。智能化计算机编码极大减少编码工作对人工的依赖,显著降低编码成本,提高数据的时效性,控制编码环节的再生性误差。本文结合国内外相关研究,总结计算机编码的两种基本实现思路,阐述字典编码方法和模型编码方法的原理、技术及其在人口普查编码实践中的应用。我国在前六次人口普查中,行业和职业编码均由人工完成,第七次全国人口普查采用计算机辅助编码技术,初步实现行业和职业编码智能化。未来可以有针对性地借鉴其他国家社会调查编码工作的先进经验,向全面智能化方向迈进,进一步提高计算机编码方式在我国社会精准化管理中的服务水平。 展开更多
关键词 行业和职业编码 人口普查 信息技术 文本检索 机器学习
下载PDF
A New Enhanced Arabic Light Stemmer for IR in Medical Documents
4
作者 Ra’ed M.Al-Khatib Taha Zerrouki +2 位作者 Mohammed M.Abu Shquier Amar Balla Asef Al-Khateeb 《Computers, Materials & Continua》 SCIE EI 2021年第7期1255-1269,共15页
This paper introduces a new enhanced Arabic stemming algorithm for solving the information retrieval problem,especially in medical documents.Our proposed algorithm is a light stemming algorithm for extracting stems an... This paper introduces a new enhanced Arabic stemming algorithm for solving the information retrieval problem,especially in medical documents.Our proposed algorithm is a light stemming algorithm for extracting stems and roots from the input data.One of the main challenges facing the light stemming algorithm is cutting off the input word,to extract the initial segments.When initiating the light stemmer with strong initial segments,the final extracting stems and roots will be more accurate.Therefore,a new enhanced segmentation based on deploying the Direct Acyclic Graph(DAG)model is utilized.In addition to extracting the powerful initial segments,the main two procedures(i.e.,stems and roots extraction),should be also reinforced with more efficient operators to improve the final outputs.To validate the proposed enhanced stemmer,four data sets are used.The achieved stems and roots resulted from our proposed light stemmer are compared with the results obtained from five other well-known Arabic light stemmers using the same data sets.This evaluation process proved that the proposed enhanced stemmer outperformed other comparative stemmers. 展开更多
关键词 machine learning information retrieval systems medical documents stemming algorithms arabic light stemmer natural language processing
下载PDF
Human-Centered A.I. and Security Primitives
5
作者 Alex Mathew 《Journal of Computer Science Research》 2020年第4期32-35,共4页
The paper reviews how human-centered artificial intelligence and securityprimitive have influenced life in the modern world and how it’s useful inthe future. Human-centered A.I. has enhanced our capabilities by the w... The paper reviews how human-centered artificial intelligence and securityprimitive have influenced life in the modern world and how it’s useful inthe future. Human-centered A.I. has enhanced our capabilities by the wayof intelligence, human informed technology. It has created a technologythat has made machines and computer intelligently carry their function.The security primitive has enhanced the safety of the data and increasedaccessibility of data from anywhere regardless of the password is known.This has improved personalized customer activities and filled the gapbetween the human-machine. This has been successful due to the usageof heuristics which solve belowems by experimental, support vector machinewhich evaluates and group the data, natural language processingsystems which change speech to language. The results of this will lead toimage recognition, games, speech recognition, translation, and answeringquestions. In conclusion, human-centered A.I. and security primitivesis an advanced mode of technology that uses statistical mathematicalmodels that provides tools to perform certain work. The results keep onadvancing and spreading with years and it will be common in our lives. 展开更多
关键词 Artificial Intelligence Deep learning Digital signatures machine learning Private information retrieval
下载PDF
基于关键词聚类和节点距离的网页信息抽取 被引量:8
6
作者 邓健爽 郑启伦 +1 位作者 彭宏 林旭东 《计算机科学》 CSCD 北大核心 2007年第4期213-216,共4页
大部分网页信息抽取方法都针对特定的网站,例如基于网站抽取规则和基于训练网页样例的方法。这些方法在某一个网站上可以很好地应用。但当遇到新的网站时,必须人为地增加抽取规则或者提供新的训练网页集。而且,当网站的模版改变时,也要... 大部分网页信息抽取方法都针对特定的网站,例如基于网站抽取规则和基于训练网页样例的方法。这些方法在某一个网站上可以很好地应用。但当遇到新的网站时,必须人为地增加抽取规则或者提供新的训练网页集。而且,当网站的模版改变时,也要重新设计这些规则或重新输入训练网页集。这些方法难以维护,因此不能应用到从大量不同的网站上进行信息抽取。本文提出了一种新的网页信息抽取方法,该方法基于特定主题的关键词组和节点距离,能够不加区分地对不同的网站页面信息自动抽取。对大量网站的网页进行信息抽取的实验显示,该方法能够不依赖网页的来源而正确和自动地抽取相关信息,并且已经成功应用到电子商务智能搜索和挖掘系统中。 展开更多
关键词 聚类 信息抽取 机器学习 节点距离
下载PDF
基于改进决策树算法的网络关键资源页面判定 被引量:11
7
作者 刘奕群 张敏 马少平 《软件学报》 EI CSCD 北大核心 2005年第11期1958-1966,共9页
关键资源页面是网络信息环境中一种重要的高质量页面,是用户进行网络信息检索的主要目标.决策树算法是机器学习中应用最广的归纳推理算法之一,适用于关键资源页面的判定.然而由于Web数据均一采样的困难性,算法缺乏有足够代表性的反例进... 关键资源页面是网络信息环境中一种重要的高质量页面,是用户进行网络信息检索的主要目标.决策树算法是机器学习中应用最广的归纳推理算法之一,适用于关键资源页面的判定.然而由于Web数据均一采样的困难性,算法缺乏有足够代表性的反例进行训练.为了解决这个问题,提出一种利用训练样例的统计信息而非个体信息进行学习的改进决策树算法,并利用这种算法实现了独立用户查询的关键资源页面判定.在2003年文本信息检索会议(TextRetrievalConference,简称TREC)标准的评测条件下,基于此种改进决策树算法的大规模网络信息检索实验获得了超过基本算法40%的性能提高.这不仅提供了一种查找Web关键资源页面的有效方式,也给出了提高决策树算法性能的一个可行途径. 展开更多
关键词 网络信息检索 关键资源页面 机器学习 决策树
下载PDF
用户模型及其学习方法 被引量:26
8
作者 李广建 黄崑 《现代图书情报技术》 CSSCI 北大核心 2002年第6期24-27,共4页
主要通过分析检索中影响个体用户满意度的用户相关度 ,指出了利用用户模型可以对用户的检索行为、信息需求喜好等进行学习和推导。然后重点阐述了在信息检索过程中 ,用户需求的特点及针对用户建模的方式和学习的方法 。
关键词 用户模型 信息检索 用户学习 机器学习 个性化信息服务 个性化信息检索
下载PDF
个性化Web信息代理的研究与开发 被引量:6
9
作者 陈世平 丁山山 +1 位作者 胡成梅 游方强 《上海理工大学学报》 CAS 北大核心 2004年第6期575-579,共5页
介绍了在Web信息检索过程中通过个性化信息代理(Agent)实现个性化信息反馈的工作.提出了信息Agent模型,涉及元搜索引擎的实现和个性化偏好模型的建立,且通过主动服务代理实现个人偏好查询结果的推送.提高了在Web信息检索过程中系统随用... 介绍了在Web信息检索过程中通过个性化信息代理(Agent)实现个性化信息反馈的工作.提出了信息Agent模型,涉及元搜索引擎的实现和个性化偏好模型的建立,且通过主动服务代理实现个人偏好查询结果的推送.提高了在Web信息检索过程中系统随用户关注程度和关注领域不断变化而调整信息反馈的能力,并在此设计基础上实现了一个原型系统. 展开更多
关键词 信息AGENT 个性化检索 元搜索引擎 向量空间模型 机器学习
下载PDF
面向信息检索需要的网络数据清理研究 被引量:5
10
作者 刘奕群 张敏 马少平 《中文信息学报》 CSCD 北大核心 2006年第3期70-77,共8页
W eb数据中的质量参差不齐、可信度不高以及冗余现象造成了网络信息检索工具存储和运算资源的极大浪费,并直接影响着检索性能的提高。现有的网络数据清理方式并非专门针对网络信息检索的需要,因而存在着较大不足。本文根据对检索用户的... W eb数据中的质量参差不齐、可信度不高以及冗余现象造成了网络信息检索工具存储和运算资源的极大浪费,并直接影响着检索性能的提高。现有的网络数据清理方式并非专门针对网络信息检索的需要,因而存在着较大不足。本文根据对检索用户的查询行为分析,提出了一种利用查询无关特征分析和先验知识学习的方法计算页面成为检索结果页面的概率,从而进行网络数据清理的算法。基于文本信息检索会议标准测试平台的实验结果证明,此算法可以在保留近95%检索结果页面的基础上清理占语料库页面总数45%以上的低质量页面,这意味着使用更少的存储和运算资源获取更高的检索性能将成为可能。 展开更多
关键词 计算机应用 中文信息处理 网络信息检索 数据清理 机器学习
下载PDF
代码注释自动生成方法综述 被引量:10
11
作者 陈翔 杨光 +2 位作者 崔展齐 孟国柱 王赞 《软件学报》 EI CSCD 北大核心 2021年第7期2118-2141,共24页
在软件的开发和维护过程中,与代码对应的注释经常存在缺失、不足或者与代码实际内容不匹配等问题,但手工编写代码注释对开发人员来说费时费力,且注释质量难以保证,因此亟需研究人员提出有效的代码注释自动生成方法.代码注释自动生成问... 在软件的开发和维护过程中,与代码对应的注释经常存在缺失、不足或者与代码实际内容不匹配等问题,但手工编写代码注释对开发人员来说费时费力,且注释质量难以保证,因此亟需研究人员提出有效的代码注释自动生成方法.代码注释自动生成问题是当前程序理解研究领域的一个研究热点,对该问题进行了系统综述.主要将已有的自动生成方法细分为3类:基于模板的方法、基于信息检索的方法和基于深度学习的方法.依次对每一类方法的已有研究成果进行了系统的梳理、总结和点评.随后分析了已有的实证研究中经常使用的语料库和主要的注释质量评估方法,以利于针对该问题的后续研究可以进行合理的实验设计.最后进行总结,并对未来值得关注的研究方向进行了展望. 展开更多
关键词 程序理解 代码注释自动生成 模板 信息检索 深度学习 机器翻译
下载PDF
生物信息学中的文本挖掘方法 被引量:2
12
作者 邹权 林琛 +1 位作者 刘晓燕 郭茂祖 《计算机工程与设计》 CSCD 北大核心 2011年第12期4075-4078,共4页
从两个角度讨论应用于生物信息学中的文本挖掘方法。以搜索生物知识为目标,利用文本挖掘方法进行文献检索,进而构建相关数据库,如在PubMed中挖掘蛋白质相互作用和基因疾病关系等知识。总结了可以应用文本挖掘技术的生物信息学问题,如蛋... 从两个角度讨论应用于生物信息学中的文本挖掘方法。以搜索生物知识为目标,利用文本挖掘方法进行文献检索,进而构建相关数据库,如在PubMed中挖掘蛋白质相互作用和基因疾病关系等知识。总结了可以应用文本挖掘技术的生物信息学问题,如蛋白质结构与功能的分析。探讨了文本挖掘研究者可以探索的生物信息学领域,以便更多的文本挖掘研究者可以将相关成果应用于生物信息学的研究中。 展开更多
关键词 生物信息学 文本挖掘 机器学习 蛋白质相互作用 文献检索
下载PDF
ISeeker——一个高效的元搜索引擎 被引量:4
13
作者 彭洪汇 林作铨 《计算机工程》 CAS CSCD 北大核心 2003年第10期41-42,52,共3页
介绍了一个高效的元搜索引擎系统ISeeker,提出了一套全面的搜索引擎评价和选择算法,在对检索结果进行融合处理时尽可能选择最好的结果,而且在用户察看结果时进行在线学习和调整。
关键词 INTERNET 按索引擎 元搜索引擎 信息获取 机器学习
下载PDF
榜样信息干预下用户检索方法决策的观察学习研究 被引量:2
14
作者 甘利人 冯颖 白晨 《情报学报》 CSSCI 北大核心 2012年第7期770-784,共15页
随着网络发展,人机交互越来越成为人们网络活动的重要内容,因此关注不同环境因素刺激下的人机交互效率成为有意义的研究课题,本文在之前对无干预①以及模拟网络系统帮助干预。条件下人们通过人机交互界面学习检索功能操作研究基础上... 随着网络发展,人机交互越来越成为人们网络活动的重要内容,因此关注不同环境因素刺激下的人机交互效率成为有意义的研究课题,本文在之前对无干预①以及模拟网络系统帮助干预。条件下人们通过人机交互界面学习检索功能操作研究基础上,进一步对榜样信息干预下的观察学习进行研究,具体探索了观察学习理论及学习模型,并尝试通过控制实验分析、数学模型拟合等方法观察基于榜样信息干预下,用户在连续执行多轮检索任务中是如何跟随榜样学习选择合适的检索方法,最后得到的主要结论有:①在缺乏相关知识与经验的情况下用户行为的“跟随效应”明显,即表现出替代强化学习现象;②当出现与检索任务匹配的刺激信息时,比如界面信息,用户会摆脱榜样干预进行独立思考,即表现出了强化学习特征;③观察学习外部影响因素主要有:榜样人数、榜样评价,对用户学习直接产生影响作用的是检索界面;④观察学习中场依存认知风格的用户比场独立用户的替代性强化学习特点更突出。这些结论为人机交互平台人性化设计、以及为新手用户重点打造一个友好的交互式e一学习环境提供了启示。 展开更多
关键词 信息干预 检索方法 人机交互界面 观察学习 学习模型 实验分析
下载PDF
智能移动式定题检索Agent的研究与设计 被引量:2
15
作者 杨清 杨岳湘 瞿国平 《计算机应用与软件》 CSCD 2000年第12期1-6,44,共7页
本文详细介绍Mobile Agent的系统结构和技术特点,提出了一种基于该模式的智能定题检索Mobile Agent,并且对此智能Agent的原理以及关键技术作了较为详细的剖析。
关键词 信息查询 移动式定题检索 AGENT 人工智能
下载PDF
基金项目评审管理中智能交互式文档检索 被引量:5
16
作者 李智 李敏强 《研究与发展管理》 CSSCI 北大核心 2005年第3期106-110,共5页
讨论了非结构化文档信息的检索模型,分析了传统交互式信息检索方法,提出了面向基金项目文档查询的智能交互式信息检索过程和处理流程。基于用户评价项目文档的反馈信息,采用ID3算法、CLCC算法和SVM分类函数分别学习用户查询的潜在意图... 讨论了非结构化文档信息的检索模型,分析了传统交互式信息检索方法,提出了面向基金项目文档查询的智能交互式信息检索过程和处理流程。基于用户评价项目文档的反馈信息,采用ID3算法、CLCC算法和SVM分类函数分别学习用户查询的潜在意图和目标,并应用所学习的规则知识或分类函数支持项目文档查询。以某基金评审管理中项目文档的查询为例进行了实验计算与分析。 展开更多
关键词 基金评审管理 机器学习 项目文档检索 智能交互式检索
下载PDF
网上高质量智能信息检索系统的实现 被引量:5
17
作者 蒋晓冬 金宇晖 谈征 《计算机工程与科学》 CSCD 1999年第4期49-53,共5页
本文提出了Web智能化检索系统WebAcess。这是一个网上智能信息检索系统的原型,它应用了机器学习、自然语言处理、信息检索与超文本等技术与方法。
关键词 信息检索系统 INTERNET网 人工智能 机器学习
下载PDF
由排序支持向量机抽取博客文章的摘要 被引量:2
18
作者 何海江 陈姝 《电子科技大学学报》 EI CAS CSCD 北大核心 2010年第4期593-597,共5页
提出了一种用平滑型排序支持向量机(Rank-sSVM)抽取博客文章摘要的方法。使用该排序算法抽取的摘要,反映了评论者的意见和博客文集的特性。自动摘要过程中,首先经人工从文章选择重要句子标记为摘要,作为训练对象;再由机器生成表示文章... 提出了一种用平滑型排序支持向量机(Rank-sSVM)抽取博客文章摘要的方法。使用该排序算法抽取的摘要,反映了评论者的意见和博客文集的特性。自动摘要过程中,首先经人工从文章选择重要句子标记为摘要,作为训练对象;再由机器生成表示文章语句的特征集,共14个特征,包含标签、评论等博客文章独有的信息;最后用Rank-sSVM学习人工摘要后,将文章所有句子排序,选取最靠前的若干语句构成摘要。该方法在一个中文博客数据集上取得良好效果。 展开更多
关键词 博客 评论 信息检索 排序学习 支持向量机 摘要
下载PDF
基于用户信息检索相关性反馈模型的研究 被引量:5
19
作者 程娟 《图书馆杂志》 CSSCI 北大核心 2008年第4期52-55,共4页
提出通过获取用户建立和更新信息相关反馈模型的思想。通过观察用户在浏览Web页面时所采取的动作来获取的反馈信息,利用检索算法将用户信息量化,并利用这些信息建立与更新用户模型.一方面用户对检索结果的评价输入到用户模型上,另一方面... 提出通过获取用户建立和更新信息相关反馈模型的思想。通过观察用户在浏览Web页面时所采取的动作来获取的反馈信息,利用检索算法将用户信息量化,并利用这些信息建立与更新用户模型.一方面用户对检索结果的评价输入到用户模型上,另一方面,检索系统通过机器学习跟踪用户信息并优化用户模型。 展开更多
关键词 信息检索 相关性反馈 用户需求 机器学习
下载PDF
基于Yahoo的信息自动分类器的原理与设计 被引量:1
20
作者 杨清 杨岳湘 瞿国平 《计算机工程与科学》 CSCD 1999年第4期54-58,共5页
本文介绍了一种基于Yahoo层次的自动分类器,此分类器主要是把基于文本数据的机器学习技巧用于Yahoo的层次结构;讨论了分类文档过程中的文档表示、功能选择和学习方法及相关的算法。
关键词 信息自动分类 YAHOO 信息检索 INTERNET网
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部