期刊文献+
共找到846篇文章
< 1 2 43 >
每页显示 20 50 100
Invisible Web研究综述 被引量:19
1
作者 黄晓冬 《情报科学》 CSSCI 北大核心 2004年第9期1144-1148,共5页
本文对有关 Invisible Web的内容进行了全面、详细地介绍。首先论述了什么是 Invisible Web以及为什么要研究 Invisible Web,同时介绍了两个相关概念 ;其次对 Invisible Web不可见的原因加以分析 ;对 Invisible Web的类型进行了划分 ;... 本文对有关 Invisible Web的内容进行了全面、详细地介绍。首先论述了什么是 Invisible Web以及为什么要研究 Invisible Web,同时介绍了两个相关概念 ;其次对 Invisible Web不可见的原因加以分析 ;对 Invisible Web的类型进行了划分 ;介绍了 Invisible Web的检索工具 ;最后总结了 Invisible Web研究的方向。 展开更多
关键词 invisible web DEEP web 信息检索 搜索引擎
下载PDF
The ideas and methods of structural monitoring of the scientific and technical information resources on the Web
2
作者 Zhixiong ZHANG Xiaolin ZHANG +4 位作者 Jianhua LIU Yimin ZOU Jing XIE Li QIAN Ying WANG 《Journal of Library Science in China》 2014年第1期5-20,共16页
Due to its openness and timeliness,the S&T Web information has become one of the most important resources for strategic intelligence monitoring.However,since S&T Web information is unstructured and lack of sem... Due to its openness and timeliness,the S&T Web information has become one of the most important resources for strategic intelligence monitoring.However,since S&T Web information is unstructured and lack of semantic description,it is a challenge to transfer the unstructured Web information into structured semantic knowledge.To solve this problem,the authors propose a method for structural monitoring of the S&T Web information resources.By using the knowledge extraction technologies,the authors firstly extract the knowledge objects as well as the relationship between objects from the Web resources and convert the free text into calculable structured knowledge units.Based on those extracted structured information,the authors build various kinds of monitoring models to realize research profiling for specific research fields.Based on those ideas,the authors implement the automated Web information monitoring system suitable for research field monitoring.A research profiling experiment also is carried out based on the semantic resources which are converted from the monitored Web data. 展开更多
关键词 S&T web information Structural MONITORING Monitored content OBJECT Knowledge extraction Automatic MONITORING system Field MONITORING
原文传递
An Informetric analysis of web citation in Chinese journals of Library and Information Science in recent years
3
作者 ZHANG Yang ZHANG Jie 《Chinese Journal of Library and Information Science》 2010年第3期46-62,共17页
This paper selects 998 articles as its data sources from four Chinese core journals in the field of Library and Information Science from 2003 to 2007.Some pertinent aspects of reference citations particularly from web... This paper selects 998 articles as its data sources from four Chinese core journals in the field of Library and Information Science from 2003 to 2007.Some pertinent aspects of reference citations particularly from web resources are selected for a focused analysis and discussion.This includes primarily such items as the number of web citations,web citations per each article,the distribution of domain names of web citations and also certain aspects about the institutional and/or geographical affiliations of the author.The evolving situation of utilizing online networked academic information resources in China is the central thematic discussion of this study.The writing of this paper is augmented by the explicatory presentation of 3 graphic figures,6 tables and 18 references. 展开更多
关键词 web information resource Network document web citation Informetrics Citation analysis Library and information science
下载PDF
基于Web的数字化资源共享信息查询系统设计 被引量:1
4
作者 肖朝晖 《微型电脑应用》 2024年第2期192-196,共5页
数字化资源增多使得共享信息查询难度增加,为此,设计了基于Web的数字化资源共享信息查询系统。通过统一用户接口,实现数字化资源共享信息的交互和集成,构建查询系统管理平台。连接外部共享信息提供程序和服务执行个体,利用Web服务器的... 数字化资源增多使得共享信息查询难度增加,为此,设计了基于Web的数字化资源共享信息查询系统。通过统一用户接口,实现数字化资源共享信息的交互和集成,构建查询系统管理平台。连接外部共享信息提供程序和服务执行个体,利用Web服务器的索引服务,完成信息局部查询。管理远程信息查询节点服务的请求,改变创建端点的新路由,防止信息丢失,结合语义相关优化系统,根据关键字的反向资源频次,获得辨识能力,实现数字化资源共享信息全局查询。实验结果表明,基于Web的信息查询系统的查询处理能力较强,能够提高查询准确率和查询效率。 展开更多
关键词 web服务器 数字化资源 共享信息 信息查询系统 语义相关
下载PDF
计算机网络中Web信息智能抽取系统的设计及测试分析
5
作者 任娟 《科学技术创新》 2024年第1期110-113,共4页
文章利用模板化信息提取算法,在规则生成器识别出目标实体分隔符后,运用模板生成器实现分割标记在模板中的有效配置,而后再运用信息抽取器按照生成的模板提取所需的信息。而后对Web信息智能抽取系统进行了测试分析,通过与其他信息抽取... 文章利用模板化信息提取算法,在规则生成器识别出目标实体分隔符后,运用模板生成器实现分割标记在模板中的有效配置,而后再运用信息抽取器按照生成的模板提取所需的信息。而后对Web信息智能抽取系统进行了测试分析,通过与其他信息抽取系统对比发现,此系统可根据模板完成各类网页信息的快捷、准确抽取,具有信息抽取精准、信息召回率高、信息提取高效的优势。 展开更多
关键词 计算机网络 web信息 智能信息抽取系统
下载PDF
如何利用Invisible-web获取更多的网络信息资源
6
作者 生修雯 《科技广场》 2008年第7期155-157,共3页
在浩瀚如海的网络世界里,信息资源犹如海洋生物,大大小小,无孔不入,如何能够快速而准确地找到并获取自己所需的信息,成为我们这个时代最需解决的根本问题之一。当然,利用各种搜索引擎可以查找到很多信息资源,但是也有一些信息通过搜索... 在浩瀚如海的网络世界里,信息资源犹如海洋生物,大大小小,无孔不入,如何能够快速而准确地找到并获取自己所需的信息,成为我们这个时代最需解决的根本问题之一。当然,利用各种搜索引擎可以查找到很多信息资源,但是也有一些信息通过搜索引擎是无法找到的,它们隐藏在这个网络世界的某个角落,因为某种原因而不为大多人所熟知,但是这些信息本身却有着很高的使用价值。美国的Sherman·C等人把这些资源命名为"看不见的网站(Invisible—web)"。"看不见的网站"里拥有信息检索人员难以置信的有价值的资源。本文阐述了"看不见的网站"的含义及价值,指出信息检索人员应该如何有效利用"看不见的网站"资源,最后提供一些查找"看不见网站"的途径与工具。 展开更多
关键词 网络信息资源 搜索引擎 看不见的网站
下载PDF
基于Web网页的DOM树链接预分类、信息抽取方法研究
7
作者 罗莎 《长江信息通信》 2023年第11期133-135,共3页
为满足Web网页的数据记录、自动抽取需求,提出依托DOM树特征的网页信息链接预分类、领域本体的Web信息抽取方法,根据HTML、XML网页文档结构设置DOM对象节点树,标记网页页码导航节点、前导符节点、数据特征节点,用DOM根节点到目标节点的... 为满足Web网页的数据记录、自动抽取需求,提出依托DOM树特征的网页信息链接预分类、领域本体的Web信息抽取方法,根据HTML、XML网页文档结构设置DOM对象节点树,标记网页页码导航节点、前导符节点、数据特征节点,用DOM根节点到目标节点的标签序列计算树路径,根据各网页链接的XPATH树路径进行分组,DOM树特征预分类模块完成站点信息链接预分类,采用SVM分类器、支持向量机SVM算法,将网页的数据记录样本作出数据信息抽取、属性特征提取计算,从而抽取出满足用户需求的数据文本、数据记录信息。 展开更多
关键词 web网页 DOM树特征 信息链接预分类 信息抽取方法
下载PDF
Web Block Extraction System Based on Client-Side Imaging for Clickable Image Map
8
作者 Hiroyuki Sano Shun Shiramatsu Tadachika Ozono Toramatsu Shintani 《通讯和计算机(中英文版)》 2013年第6期815-822,共8页
关键词 提取系统 客户端 网页 地图 成像 web页面 web信息 web模块
下载PDF
Implementation of a weblog extraction system with an improved template extraction technique
9
作者 E CHANG 《Chinese Journal of Library and Information Science》 2013年第1期52-63,共12页
Purpose: The objectives of this study are to explore an effective technique to extract information from weblogs and develop an experimental system to extract structured information as much as possible with this techni... Purpose: The objectives of this study are to explore an effective technique to extract information from weblogs and develop an experimental system to extract structured information as much as possible with this technique. The system will lay a foundation for evaluation, analysis, retrieval, and utilization of the extracted information.Design/methodology/approach: An improved template extraction technique was proposed.Separate templates designed for extracting blog entry titles, posts and their comments were established, and structured information was extracted online step by step. A dozen of data items, such as the entry titles, posts and their commenters and comments, the numbers of views, and the numbers of citations were extracted from eight major Chinese blog websites,including Sina, Sohu and Bokee.Findings: Results showed that the average accuracy of the experimental extraction system reached 94.6%. Because the online and multi-threading extraction technique was adopted, the speed of extraction was improved with the average speed of 15 pages per second without considering the network delay. In addition, entries posted by Ajax technology can be extracted successfully.Research limitations: As the templates need to be established in advance, this extraction technique can be effectively applied to a limited range of blog websites. In addition, the stability of the extraction templates was affected by the source code of the blog pages.Practical implications: This paper has studied and established a blog page extraction system,which can be used to extract structured data, preserve and update the data, and facilitate the collection, study and utilization of the blog resources, especially academic blog resources.Originality/value: This modified template extraction technique outperforms the Web page downloaders and the specialized blog page downloaders with structured and comprehensive data extraction. 展开更多
关键词 weblog(Blog) web information extraction extraction template
下载PDF
金属矿山深部资源三维智能预测理论与方法
10
作者 毛先成 邓浩 +2 位作者 陈进 刘占坤 韩小文 《矿产勘查》 2024年第8期1365-1378,共14页
当前,中国主要矿产大多面临后备资源不足问题,在大中型矿山深部寻找可接替资源已成为保障主要矿产的战略措施。然而,金属矿山深部找矿预测面临着矿床深部结构不清、深部控矿规律隐蔽、深部矿体空间定位难度大等关键问题,亟须建立适应矿... 当前,中国主要矿产大多面临后备资源不足问题,在大中型矿山深部寻找可接替资源已成为保障主要矿产的战略措施。然而,金属矿山深部找矿预测面临着矿床深部结构不清、深部控矿规律隐蔽、深部矿体空间定位难度大等关键问题,亟须建立适应矿山真三维空间要求的矿产资源预测与评价新理论并取得关键技术突破。针对这些问题,自20世纪80年代开始,笔者通过持续的探索和研究创新,先后提出隐伏矿体立体定量预测、深部资源三维可视化预测,最终提出并建立深部资源三维智能预测理论与方法,实现了矿床深部三维结构重建的自动化与精细化、深部控矿规律表征的定量化与透明化、深部成矿空间矿体定位的精准化与智能化。该理论与方法主要包括成矿系统分析与找矿概念模型构建、矿床深部结构贝叶斯数据同化三维精细重建、矿床深部地质结构三维几何-物质分析与成矿信息提取、深部矿体空间定位规律深度学习与三维预测等重要方法与关键技术。该理论与方法先后在山东胶西北金矿集区、甘肃金川铜镍矿等地取得成功应用,在矿区深部探获厚度大、高品位矿体,取得深部找矿突破。 展开更多
关键词 三维成矿预测 三维地质建模 成矿信息提取 矿产智能预测 深部矿产资源
下载PDF
基于震后舆情的灾情信息提取研究
11
作者 闫晓美 牛艳杰 +1 位作者 王宁 许振鹏 《山西地震》 2024年第1期1-4,16,共5页
大地震发生后,通常会出现大量关于地震灾害的信息并在网络中快速传播,为快速准确地获取地震灾情信息,开展基于震后舆情提取灾情信息的相关研究。首先构建灾情信息挖掘模型,建立灾情关键词表,通过计算词向量相似度,快速提取地震灾情等相... 大地震发生后,通常会出现大量关于地震灾害的信息并在网络中快速传播,为快速准确地获取地震灾情信息,开展基于震后舆情提取灾情信息的相关研究。首先构建灾情信息挖掘模型,建立灾情关键词表,通过计算词向量相似度,快速提取地震灾情等相关信息。同时以“山东德州原平5.5级地震”为案例,验证构建模型在地震灾情提取方面的效果及其可行性和实用性。结果表明,该研究可为震后快速应对和处置灾情提供一定的参考数据和决策依据。 展开更多
关键词 地震灾情 震后舆情 网络爬虫 文本挖掘 信息提取
下载PDF
多信息块Web页面的信息抽取 被引量:21
12
作者 王庆一 王继成 +1 位作者 周源远 袁春风 《计算机应用研究》 CSCD 北大核心 2002年第10期23-26,共4页
提出了一个采用新的抽取规则的包装器 ,结合采用基于文档结构抽取规则和基于特征Pattern匹配抽取规则包装器的优点 ,可以适用于含有多个信息块的Web页面。
关键词 多信息块 web页面 信息抽取 包装器 抽取规则 信息集成 Internet WWW 信息资源
下载PDF
基于样本实例的Web信息抽取 被引量:19
13
作者 张绍华 徐林昊 +2 位作者 杨文柱 薛文玲 李天柱 《河北大学学报(自然科学版)》 CAS 2001年第4期431-437,共7页
主要研究了基于HTML文档的信息抽取 ,提出了一种基于样本实例的Web信息抽取的方法 .用户首先选定样本页面和预先定义模式 (基于O -R模型 ) ,然后对样本页面和其中的样本记录进行标记、学习 ,形成信息抽取规则 ,并存入知识库 ;利用知识... 主要研究了基于HTML文档的信息抽取 ,提出了一种基于样本实例的Web信息抽取的方法 .用户首先选定样本页面和预先定义模式 (基于O -R模型 ) ,然后对样本页面和其中的样本记录进行标记、学习 ,形成信息抽取规则 ,并存入知识库 ;利用知识库对其他同类页面自动抽取所需的信息 ,存入数据库中 .本方法可用于Web查询 ,也可用于信息集成的包装器 . 展开更多
关键词 HTML 模式 抽取器 信息抽取 web查询 INTERNET INTRANET
下载PDF
基于本体的Web信息抽取系统 被引量:14
14
作者 王志华 魏斌 +1 位作者 李占波 赵伟 《计算机工程与设计》 CSCD 北大核心 2012年第7期2634-2639,共6页
为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架。对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文... 为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架。对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案。实验结果表明,该方法可以得到性能较高的抽取结果。 展开更多
关键词 本体 信息抽取 web页面 关键技术 抽取框架
下载PDF
基于模板和领域本体的Deep Web信息抽取研究 被引量:15
15
作者 顾韵华 高原 +1 位作者 高宝 杜杰 《计算机工程与设计》 CSCD 北大核心 2014年第1期327-332,共6页
为简化模板的抽取规则、提高抽取的准确率,提出了一种基于双模板和领域本体的Deep Web信息抽取方法。该方法采用DIV块模板和表格模板结合的方法,建立双模板。利用基于中文分词的网页预处理结果,在领域本体知识的指导下,通过C4.5决策树... 为简化模板的抽取规则、提高抽取的准确率,提出了一种基于双模板和领域本体的Deep Web信息抽取方法。该方法采用DIV块模板和表格模板结合的方法,建立双模板。利用基于中文分词的网页预处理结果,在领域本体知识的指导下,通过C4.5决策树算法来训练分类模型,筛选出待抽取的DIV块序号,构建DIV块模板,从而可以精确定位到数据块。利用XML技术构建XSLT文档,得到表格模板的抽取规则,从而抽取出数据片段。选取天气领域进行Deep Web信息抽取实验,实验结果表明,抽取准确率和召回率都可以达到95%以上,取得了较好的抽取效果。 展开更多
关键词 DEEP web 信息抽取 模板 领域本体 决策树
下载PDF
多信息块Web页面中的抽取规则 被引量:6
16
作者 王庆一 王继成 +1 位作者 周源远 袁春风 《计算机工程》 CAS CSCD 北大核心 2003年第9期42-44,50,共4页
以往的包装器主要针对仅含有一个数据块的Web页面,而对含有多个信息块的Web页面,简称MIB(Multiple Information Block), Web页面无法处理。该文提出了一个新的抽取规则,结合了基于文档结构的抽取规则和基于特征Pattern匹配的抽取规... 以往的包装器主要针对仅含有一个数据块的Web页面,而对含有多个信息块的Web页面,简称MIB(Multiple Information Block), Web页面无法处理。该文提出了一个新的抽取规则,结合了基于文档结构的抽取规则和基于特征Pattern匹配的抽取规则的优点,能够有效地抽取MIB Web页面中的信息。 展开更多
关键词 web 信息抽取 包装器 抽取规则 信息集成
下载PDF
领域本体指导的Web商品信息抽取 被引量:9
17
作者 毕蕾 沈洁 +3 位作者 徐法艳 魏榴花 朱燕 孙荣霜 《计算机工程与设计》 CSCD 北大核心 2008年第24期6393-6396,共4页
信息在网络上传播具有高时效、低成本等特性,因而越来越多的企业和个人都选择在网上发布商品信息,例如汽车、房产等信息。这些内容多数是以有一定的结构的信息呈现,如表格,但是不同网站的表现形式却大相径庭。提出了以领域本体知识为指... 信息在网络上传播具有高时效、低成本等特性,因而越来越多的企业和个人都选择在网上发布商品信息,例如汽车、房产等信息。这些内容多数是以有一定的结构的信息呈现,如表格,但是不同网站的表现形式却大相径庭。提出了以领域本体知识为指导,抽取表格信息表达为主的商品信息,以房产为例,自动集成不同网站的同类服务或产品的信息,用以实现专业检索的功能。 展开更多
关键词 领域本体 信息检索 信息抽取 搜索引擎 网络信息挖掘
下载PDF
基于XPath的Web信息抽取的设计与实现 被引量:6
18
作者 杨文柱 徐林昊 +2 位作者 陈少飞 郝亚南 李天柱 《计算机工程》 CAS CSCD 北大核心 2003年第16期82-83,113,共3页
提出了一种基于XPath的Web信息抽取方法,鉴于目前还没有免费的商用XPath引擎可用,于是利用DOM定制了一个XPath引擎,实现了Web信息抽取。该文着重介绍了原型系统的工作原理和实现中所采用的具体技术,该方法可用于Web查询和包装器的... 提出了一种基于XPath的Web信息抽取方法,鉴于目前还没有免费的商用XPath引擎可用,于是利用DOM定制了一个XPath引擎,实现了Web信息抽取。该文着重介绍了原型系统的工作原理和实现中所采用的具体技术,该方法可用于Web查询和包装器的构造,也可用于格式转换。 展开更多
关键词 XPATH web信息抽取 文档对象模型
下载PDF
基于Web挖掘的网页清洗技术 被引量:7
19
作者 李嘉佑 贾自艳 +1 位作者 何清 史忠植 《计算机工程与应用》 CSCD 北大核心 2006年第25期98-101,共4页
随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后... 随着互联网上信息的大量增多,Web挖掘技术越来越重要。而在Web挖掘过程中,基于Web的信息抽取的主要部分是如何去除网页中的噪音数据,它是Web数据的预处理的过程,这个预处理结果影响了Web挖掘的结果。在文中先分析了噪音数据的特点,然后根据实际观察提取规则并且用于模型统计的方法,去除噪音数据,抽取相关可利用的信息。 展开更多
关键词 web数据 信息抽取 噪音数据
下载PDF
突发事件Web新闻中时间信息分析及抽取 被引量:11
20
作者 蔡华利 刘鲁 +1 位作者 刘志明 杨跃翔 《计算机工程与应用》 CSCD 北大核心 2010年第34期107-110,共4页
为了更深入地挖掘突发事件Web新闻并应用于应急管理,提出了突发事件Web新闻时间抽取方法。首先引入中文的时间关系理论;然后从突发事件Web新闻的时间构成、时间位置特征以及时间常用词三个方面分析了突发事件Web新闻的表达特征;基于此,... 为了更深入地挖掘突发事件Web新闻并应用于应急管理,提出了突发事件Web新闻时间抽取方法。首先引入中文的时间关系理论;然后从突发事件Web新闻的时间构成、时间位置特征以及时间常用词三个方面分析了突发事件Web新闻的表达特征;基于此,提出突发事件Web新闻的时间抽取方法,通过统计学习,正确率较理想;最后,基于已抽取到的事件发生时间信息,程序实现了突发事件Web新闻排序。 展开更多
关键词 突发事件 发生时间 web新闻排序 信息抽取
下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部