期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
AnswerSeeker:基于互联网挖掘的智能问答系统 被引量:4
1
作者 阴红志 张帆 +1 位作者 丁鼎 赵斌 《计算机系统应用》 2010年第1期6-17,共12页
智能问答系统是一种处理自然语言的新型的信息检索系统。介绍了AnswerSeeker智能问答系统,该系统采用了模块化和可扩展的框架,以便整合多种智能问答技术和多样化数据源。通过将与语言无关的代码和语言相关的代码分离,并且将语言相关的... 智能问答系统是一种处理自然语言的新型的信息检索系统。介绍了AnswerSeeker智能问答系统,该系统采用了模块化和可扩展的框架,以便整合多种智能问答技术和多样化数据源。通过将与语言无关的代码和语言相关的代码分离,并且将语言相关的代码封装为组件,只要替换相应的组件,该系统可以适用于多种语言。由于很多自然语言处理技术还没有针对中文的,目前为止,我们系统的内核只支持英文,所以将以英语自然语言为例介绍AnswerSeeker的架构和工作原理。该系统采用了两种互联网挖掘的方法来寻找问题的答案:知识挖掘和知识诠释。AnswerSeeker使用网络作为一个知识源,当然它也可以使用其他小的语料库或面向专业领域的知识库作为知识源。此外,提出了一种新的问题的表示和答案提取的方法一文本模式,文本模式分为问题模式和答案模式;其中问题模式用来表示问题,答案模式用来提取精确的答案。AnswerSeeker通过将问题-答案对作为训练数据,自动学习答案模式。实验表明将互联网作为知识源,将模式学习和知识诠释的技术集成在同一系统中进行答案挖掘是一种这种很有前途的方法。 展开更多
关键词 互联网挖掘 知识挖掘 知识诠释 模式学习 智能问答
下载PDF
基于互联网文本挖掘的用户意图感知 被引量:3
2
作者 杨贤 何汉武 《广东工业大学学报》 CAS 2017年第3期54-58,共5页
能否准确感知用户意图是创新设计的关键,传统用户意图研究方法费时费力且容易忽略重要因素.论文提出,用户意图表达的是用户对一个对象的期望集合,而基于该对象分布在互联网的海量数据隐藏着这个集合的所有因素.通过互联网文本挖掘技术... 能否准确感知用户意图是创新设计的关键,传统用户意图研究方法费时费力且容易忽略重要因素.论文提出,用户意图表达的是用户对一个对象的期望集合,而基于该对象分布在互联网的海量数据隐藏着这个集合的所有因素.通过互联网文本挖掘技术获取该用户意图有关的因素,并把这些因素与用户意图等价起来.为了验证它们的等价关系,论文以可穿戴智能设备为研究对象,采用正反问卷法对因素集合的真实度进行测量.同时,论文从多个维度分析了文本挖掘获取因素的科学性,并与传统用户意图研究方法进行交叉对比,研究结果表明基于互联网文本挖掘技术的用户意图求解方案具有可行性且优点较多.论文所用方法适用于所有类似用户意图这种复杂对象的建模与求解. 展开更多
关键词 互联网文本挖掘 因素集合 用户意图 认知科学
下载PDF
互联网上主题信息的一种收集与处理模型及其应用 被引量:12
3
作者 李晓明 朱家稷 闫宏飞 《计算机研究与发展》 EI CSCD 北大核心 2003年第12期1667-1671,共5页
互联网上的信息是社会状况的一种反映 ,可以被人们从多种不同的角度来关心 而有了计算机作为工具 ,这种“关心”的深度和广度就能够大大地拓展 提出一种模型 ,基于它实现的一套程序和过程能够针对人们关心的热点主题 ,系统地对网上的... 互联网上的信息是社会状况的一种反映 ,可以被人们从多种不同的角度来关心 而有了计算机作为工具 ,这种“关心”的深度和广度就能够大大地拓展 提出一种模型 ,基于它实现的一套程序和过程能够针对人们关心的热点主题 ,系统地对网上的信息进行收集和分析 ,从不同的角度和层次得出互联网对该主题报道的强度 ,对社会科学类研究具有一定的参考价值 利用这个模型 (和相应的系统 ) ,以 2 0 0 2年 11月 8日为中心 ,以“十六大”为主题 ,前后分别扩展半个月 ,对中国互联网上的信息进行了跟踪研究 ,得出了在这些天里和“十六大”相关信息占总信息量的 7 3% ;从 2 0 0 2年 11月2日开始 ,“十六大”相关信息量逐日递增 ,在 2 0 0 2年 11月 2 展开更多
关键词 互联网信息挖掘 模型 “十六大”
下载PDF
语义Web与下一代互联网搜索引擎
4
作者 胡世港 《软件导刊》 2008年第4期71-72,共2页
阐述了语义网的理论基础,对语义网的层次模型、逻辑基础和服务描述等进行了简要介绍,并对基于语义网的搜索引擎技术进行了综合的分析说明。
关键词 语义网 WEB服务 互联网数据挖掘 搜索引擎
下载PDF
数据挖掘专利综述 被引量:8
5
作者 刘晓东 刘大有 《电子学报》 EI CAS CSCD 北大核心 2003年第z1期1989-1993,共5页
尽管科学研究专利是反映科学研究成果的一个重要方面 ,专利申请本身是一项重要的科学研究工作 ,但是长期以来 ,专利所包含的科学研究成果在文献中却没有得到充分的反映 .由此 ,对著名的美国专利和商标委员会数据库 (USPATENT&TRADEM... 尽管科学研究专利是反映科学研究成果的一个重要方面 ,专利申请本身是一项重要的科学研究工作 ,但是长期以来 ,专利所包含的科学研究成果在文献中却没有得到充分的反映 .由此 ,对著名的美国专利和商标委员会数据库 (USPATENT&TRADEMARKOFFICEDATABASE)中数据挖掘专利的授权情况进行了分析 .对于专利授权比较集中的领域—关联规则、互联网挖掘、聚类算法和并行数据挖掘等方面中的代表性专利进行了总结和分析 .最后 。 展开更多
关键词 数据挖掘 专利 关联规则 互联网挖掘 聚类算法 并行数据挖掘
下载PDF
半结构化网页中多记录信息的自动抽取方法 被引量:2
6
作者 朱明 王庆伟 《计算机仿真》 CSCD 2005年第12期95-97,142,共4页
从多记录网页中准确的自动抽取出需要的信息,是Web信息处理中的一个重要研究课题。针对现有方法对噪声敏感的缺点,该文提出了基于记录子树的最大相似度发现记录模式的思想,以在同类记录的表现模式存在一定差异的情况下正确识别记录。在... 从多记录网页中准确的自动抽取出需要的信息,是Web信息处理中的一个重要研究课题。针对现有方法对噪声敏感的缺点,该文提出了基于记录子树的最大相似度发现记录模式的思想,以在同类记录的表现模式存在一定差异的情况下正确识别记录。在此基础上,实现了多记录网页自动抽取系统,该系统可以从多个学术论文检索网站中,自动获取结果网页,并自动抽取其中的记录。对常见论文检索网站的实验表明了该系统具有较好的有效性和准确性。 展开更多
关键词 互联网挖掘 信息集成 自动信息抽取
下载PDF
Web用户行为预测的一种新模型及算法 被引量:8
7
作者 高卫华 谢康林 《计算机应用与软件》 CSCD 北大核心 2007年第3期142-144,162,共4页
有效地预测互联网用户在浏览过程中的行为方向,尽可能有针对性的提供其感兴趣的信息,有助于提高网站的服务质量,最大限度地留住客户。马尔科夫模型是解决这一问题的一种有效建模方式。但是该模型,尤其是高阶马尔科夫模型的指数级复杂度... 有效地预测互联网用户在浏览过程中的行为方向,尽可能有针对性的提供其感兴趣的信息,有助于提高网站的服务质量,最大限度地留住客户。马尔科夫模型是解决这一问题的一种有效建模方式。但是该模型,尤其是高阶马尔科夫模型的指数级复杂度大大影响了其实际的应用。建立新的模型需要权衡自身的预测准确度与复杂度,尽可能保持前者,同时降低后者。结合马尔科夫模型和有向图特点,提出了一种新的建模方式。新模型具有与马尔科夫模型相同的预测准确度,但是各种时间、空间复杂度相对较低,综合性能良好。 展开更多
关键词 马尔科夫 有向图 互联网使用挖掘 互联网用户行为预测
下载PDF
一种新的基于交叉性Web日志的事务识别算法 被引量:3
8
作者 高卫华 谢康林 《计算机仿真》 CSCD 2005年第7期51-53,74,共4页
该文提出一种新的Web使用记录挖掘过程中的事务识别算法。该算法提出的背景是在采用基于最大向前引用和频繁遍历路径的方法进行Web用户访问模式挖掘时,通过对实验结果数据、源日志文件、用户使用互联网的特点以及互联网本身的局限进行... 该文提出一种新的Web使用记录挖掘过程中的事务识别算法。该算法提出的背景是在采用基于最大向前引用和频繁遍历路径的方法进行Web用户访问模式挖掘时,通过对实验结果数据、源日志文件、用户使用互联网的特点以及互联网本身的局限进行了详细地分析和考察,发现了交叉性日志的存在。源数据新特性的出现,使得原算法在性能上有了明显的下降,因此,提出了新的基于有向图深度优先遍历的算法思想。该文设计了有针对性的模拟实验,实验结果无论从冗余事务的减少量或者事务的平均长度上都证明了新算法的优越性。 展开更多
关键词 互联网使用记录挖掘 交叉性日志 最大向前引用 频繁遍历路径
下载PDF
医疗健康大数据研究进展剖析 被引量:11
9
作者 丁凤一 刘婷 陈静 《信息资源管理学报》 CSSCI 2017年第4期5-16,共12页
本文从科学研究基本构成角度,对Web of Science中有关医疗健康大数据的文献进行了全面梳理。首先通过文献计量分析了开展医疗健康大数据研究的国家、学科领域、机构和资助来源;接着通过内容分析总结了这些文献的主要研究对象及其特征,... 本文从科学研究基本构成角度,对Web of Science中有关医疗健康大数据的文献进行了全面梳理。首先通过文献计量分析了开展医疗健康大数据研究的国家、学科领域、机构和资助来源;接着通过内容分析总结了这些文献的主要研究对象及其特征,介绍了世界范围内较为著名的开放医学数据资源;最后,从基础研究、应用研究和开发研究三方面剖析了医疗健康大数据研究现状,并归纳了各类研究的主要内容和主题。 展开更多
关键词 医疗健康大数据 开放医学数据 电子病历 医疗信息 医疗保险数据 互联网医疗数据挖掘
下载PDF
工业无线通信技术讲座 第六十二讲 供电服务一体化平台技术设计 被引量:1
10
作者 王茜 胡博 +2 位作者 葛维春 周小明 王忠锋 《仪器仪表标准化与计量》 2017年第2期14-17,共4页
随着"互联网+"概念的兴起,供电服务迎来了新的机遇。未来的供电服务,将会利用物联网和互联网并融合先进技术如大数据等,打破现阶段各系统各部门之间的壁垒,实现下到用户终端、上到电力生产的全产业链信息的互联互通;利用云计... 随着"互联网+"概念的兴起,供电服务迎来了新的机遇。未来的供电服务,将会利用物联网和互联网并融合先进技术如大数据等,打破现阶段各系统各部门之间的壁垒,实现下到用户终端、上到电力生产的全产业链信息的互联互通;利用云计算技术,搭建电力行业云效力平台,提供跨系统、跨平台、跨地域的标准化一致性效力;利用大数据技术,对整个系统的数据信息进行综合分析计算,为供电服务提供高智能、高效率的决策结果,形成"互联网+"下的新型供电服务形态。本文搭建售电效力平台技术框架。根据售电侧开放环境下新型供电业务变化和管理需求,确定新型供电业务模式。根据现有供电相干业务系统建设及应用情况,确定新型供电业务应用系统定位,规划现有供电相干业务系统应性调整和场化售电业务应用业务模型和需求。开放环境售电效力平台支持技术,提高开放环境下售电效力能力和水平。 展开更多
关键词 互联网+数据挖掘 供电服务 行为分析
下载PDF
网络舆论对股市收益影响实证研究——基于投资者情绪视角 被引量:2
11
作者 吕永霞 《财会通讯(中)》 北大核心 2018年第4期13-17,共5页
本文基于互联网数据挖掘的方法,使用R软件对东方财富网股吧的信息进行挖掘和统计,并以其作为投资者情绪指标,使用2014年7月至2016年6月相关数据为样本,分析投资者情绪对股市收益的影响。结果表明:加入投资者情绪因子后,Fama-French三因... 本文基于互联网数据挖掘的方法,使用R软件对东方财富网股吧的信息进行挖掘和统计,并以其作为投资者情绪指标,使用2014年7月至2016年6月相关数据为样本,分析投资者情绪对股市收益的影响。结果表明:加入投资者情绪因子后,Fama-French三因子模型的解释能力明显提高;小规模上市公司股票价格更易受到投资者情绪的影响;投资者情绪对于高市盈率风格、高价风格或小盘风格股票收益的影响更为显著。 展开更多
关键词 互联网数据挖掘 投资者情绪 Fama—French 三因子模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部