期刊文献+
共找到212篇文章
< 1 2 11 >
每页显示 20 50 100
Structured AJAX Data Extraction Based on Agricultural Ontology 被引量:6
1
作者 LI Chuan-xi SU Ya-ru +2 位作者 WANG Ru-jing WEI Yuan-yuan HUANG He 《Journal of Integrative Agriculture》 SCIE CAS CSCD 2012年第5期784-791,共8页
More web pages are widely applying AJAX (Asynchronous JavaScript XML) due to the rich interactivity and incremental communication. By observing, it is found that the AJAX contents, which could not be seen by traditi... More web pages are widely applying AJAX (Asynchronous JavaScript XML) due to the rich interactivity and incremental communication. By observing, it is found that the AJAX contents, which could not be seen by traditional crawler, are well-structured and belong to one specific domain generally. Extracting the structured data from AJAX contents and annotating its semantic are very significant for further applications. In this paper, a structured AJAX data extraction method for agricultural domain based on agricultural ontology was proposed. Firstly, Crawljax, an open AJAX crawling tool, was overridden to explore and retrieve the AJAX contents; secondly, the retrieved contents were partitioned into items and then classified by combining with agricultural ontology. HTML tags and punctuations were used to segment the retrieved contents into entity items. Finally, the entity items were clustered and the semantic annotation was assigned to clustering results according to agricultural ontology. By experimental evaluation, the proposed approach was proved effectively in resource exploring, entity extraction, and semantic annotation. 展开更多
关键词 information extraction structured data AJAX agricultural ontology semantic annotation
下载PDF
The ideas and methods of structural monitoring of the scientific and technical information resources on the Web
2
作者 Zhixiong ZHANG Xiaolin ZHANG +4 位作者 Jianhua LIU Yimin ZOU Jing XIE Li QIAN Ying WANG 《Journal of Library Science in China》 2014年第1期5-20,共16页
Due to its openness and timeliness,the S&T Web information has become one of the most important resources for strategic intelligence monitoring.However,since S&T Web information is unstructured and lack of sem... Due to its openness and timeliness,the S&T Web information has become one of the most important resources for strategic intelligence monitoring.However,since S&T Web information is unstructured and lack of semantic description,it is a challenge to transfer the unstructured Web information into structured semantic knowledge.To solve this problem,the authors propose a method for structural monitoring of the S&T Web information resources.By using the knowledge extraction technologies,the authors firstly extract the knowledge objects as well as the relationship between objects from the Web resources and convert the free text into calculable structured knowledge units.Based on those extracted structured information,the authors build various kinds of monitoring models to realize research profiling for specific research fields.Based on those ideas,the authors implement the automated Web information monitoring system suitable for research field monitoring.A research profiling experiment also is carried out based on the semantic resources which are converted from the monitored Web data. 展开更多
关键词 S&T WEB information structural MONITORING Monitored content OBJECT Knowledge extraction Automatic MONITORING system Field MONITORING
原文传递
基于句子层次结构的语义句模研究
3
作者 余小鹏 徐健儿 +1 位作者 王振佩 姚小桐 《长江信息通信》 2024年第1期132-134,共3页
汉语句模对计算机在处理自然语言时具有重要作用,可以使其更好地理解和分析汉语文本、抽取文本信息,提高自然语言处理的准确性和效率。但由于中文文本表达存在一定的灵活性和多样性,使得目前现有的句模存在匹配精度低、句模数量多、难... 汉语句模对计算机在处理自然语言时具有重要作用,可以使其更好地理解和分析汉语文本、抽取文本信息,提高自然语言处理的准确性和效率。但由于中文文本表达存在一定的灵活性和多样性,使得目前现有的句模存在匹配精度低、句模数量多、难以完全覆盖所有句子等问题,阻碍了句模在具体领域实现广泛应用和发展。针对以上的不足,文章提出基于句子层次结构的语义句模(HSST)。该句模以句子是嵌套的、有层次结构的,句子结构并非单向线性的为构建依据,使用多个句模且根据句子的层次结构对这些句模进行组合,大大减少了句模的数量,提高句模的匹配精度,并使得其对中文文本的覆盖面更广,使机器能更准确有效地理解与抽取文本语义信息。 展开更多
关键词 句模 自然语言处理 信息抽取 层次结构
下载PDF
改进的区域生长算法在三维激光点云识别岩体结构面中的应用 被引量:3
4
作者 徐志华 郭戈 +3 位作者 孙钱程 丰光亮 何钰铭 谢迪 《水文地质工程地质》 CAS CSCD 北大核心 2024年第2期101-112,共12页
交错分布的结构面构成了岩体中的薄弱部位,准确高效的岩体结构面识别和特征信息提取可为岩体稳定性评价提供重要依据。三维激光扫描技术可以极大地提高结构面勘测效率和精度,但目前主流的点云分析算法存在结构面边缘识别模糊、点云分割... 交错分布的结构面构成了岩体中的薄弱部位,准确高效的岩体结构面识别和特征信息提取可为岩体稳定性评价提供重要依据。三维激光扫描技术可以极大地提高结构面勘测效率和精度,但目前主流的点云分析算法存在结构面边缘识别模糊、点云分割准确性不能满足结构面特征信息提取精度等问题。因此,考虑岩体结构面点云位置与其邻域的空间关系,利用KD-tree数据结构进行最邻近搜索的体素下采样,在稳健随机Hough变换的基础上改进了区域生长算法,通过多特征值对区域生长分割参数进行修正,依据点云法向量差值和特征终值进行结构面分割,实现了结构面产状、间距、延展度信息的提取。研究结果表明:与传统的主成分分析法和随机抽样一致法相比,在室内块体模型组成的24个结构面中,该方法在相同区域具有更高的识别率和准确率,既能在复杂变化的平面区域保证数据的完整识别,也能在平面的尖锐位置较好地分割边缘点云。利用该方法可以将24个结构面分为6组,并在识别数据中获取对应的结构面特征信息,与实际测量结果相比,角度信息误差约为1°,距离信息误差1cm以内。利用该方法在长江干流蟒蛇寨斜坡岩体中成功识别出3组结构面同时计算各组结构面间距与延展度信息,并采用赤平投影图分析不同结构面组对斜坡稳定性的影响。所提出的方法在室内模型及现场斜坡验证效果良好,可以为岩体结构面识别分割提供稳定且有效的技术支撑。 展开更多
关键词 三维激光扫描 点云信息提取 区域生长算法 智能识别 岩体结构面
下载PDF
基于潜层关系增强的实体和关系联合抽取
5
作者 王鹏 刘小明 +2 位作者 杨关 刘杰 刘阳 《计算机工程与设计》 北大核心 2024年第6期1780-1788,共9页
为充分发掘文本序列中潜层语义关系信息,提出一种实体和关系联合抽取的潜层关系增强模型SREM(text subtext relationship enhancement model)。在潜层关系表示层利用结构化对齐的方式,获取并保持文本序列中的语义信息结构。在融合注意... 为充分发掘文本序列中潜层语义关系信息,提出一种实体和关系联合抽取的潜层关系增强模型SREM(text subtext relationship enhancement model)。在潜层关系表示层利用结构化对齐的方式,获取并保持文本序列中的语义信息结构。在融合注意力机制的关系网络层中对数据进行建模,提高模型对文本词汇间关系信息的捕获能力。结合注意力机制获取细粒度语义信息,对上下文信息进行选择过滤。实验结果表明,在数据集NYT和WebNLG上取得的F1值分别为92.40%和92.52%,验证了模型的有效性。 展开更多
关键词 联合抽取 语义关系 结构化知识 潜层表示 注意力机制 关系网路 信息过滤
下载PDF
基于自然语言处理与结构化算法的病历信息高精度抽取方法研究
6
作者 王维笑 费晓璐 +7 位作者 闾海荣 魏岚 陶焜 赵明 付旭 赵许盼 高菲 任怡 《中国数字医学》 2024年第5期40-48,共9页
目的:综合运用自然语言处理、结构化算法和知识图谱等技术,探索实现电子病历高精度信息抽取和结构化处理的方法。方法:通过构建命名实体识别模型、关系识别模型、同义词识别模型完成病历文本的句内信息抽取;提出了一种病历生成树算法,... 目的:综合运用自然语言处理、结构化算法和知识图谱等技术,探索实现电子病历高精度信息抽取和结构化处理的方法。方法:通过构建命名实体识别模型、关系识别模型、同义词识别模型完成病历文本的句内信息抽取;提出了一种病历生成树算法,可以有效实现大段落病历文本分层结构的解析;同时利用知识图谱技术存储信息抽取与分层解析的构造模型,实现病历文本信息高精度抽取。结果:形成了一套融合深度学习算法与结构化解析算法的病历信息高精度抽取方法,其中实体识别模型准确率达95.74%,关系识别模型准确率达89.20%,最终生成具有清晰层次结构、可精确定位和抽取信息的结构化病历。结论:本文所探索的病历信息高精度抽取方法,将深度学习算法与结构化解析算法相融合,兼顾了病历文本的句内信息抽取与病历结构层次的解析,可以实现对病历数据的自动抽取、精准定位与高效管理,可以为临床医学研究奠定数据基础,也可以为其他疾病病历文本数据的挖掘提供方法学参考。 展开更多
关键词 电子病历 信息抽取 自然语言处理 知识图谱 结构化解析
下载PDF
基于IFC的建筑结构设计信息交互框架研究与实现 被引量:6
7
作者 张兆波 孟晓明 《建筑结构》 北大核心 2024年第5期149-154,85,共7页
为了解决基于BIM的建筑与结构设计工作模式中信息交互度低的问题,提出了基于IFC的建筑结构信息交互框架。该框架由4个算法模块、5个步骤组成。借助于IfcOpenShell工具包,用Python语言开发了前两个算法模块即IFC文件优化算法模块和结构... 为了解决基于BIM的建筑与结构设计工作模式中信息交互度低的问题,提出了基于IFC的建筑结构信息交互框架。该框架由4个算法模块、5个步骤组成。借助于IfcOpenShell工具包,用Python语言开发了前两个算法模块即IFC文件优化算法模块和结构信息模型提取算法模块。选取案例模型对所开发算法的有效性进行了验证。验证结果表明:优化算法模块可以有效地过滤IFC文件中的无用信息,查找并删除重复的实体,使IFC文件轻量化,且可间接提高提取算法模块的运行效率;提取算法模块可以准确地从IFC文件中提取结构信息模型,未出现IFC语法错误、构件丢失、构件重叠等情况。IFC文件优化算法模块和结构信息模型提取算法模块的成功开发为信息交互框架的完全实现奠定了基础。 展开更多
关键词 工业基础类 建筑设计 结构设计 信息交互 优化算法 提取算法
下载PDF
融入结构先验知识的隐私信息抽取算法
8
作者 赵玉媛 王斌 +2 位作者 张泽丹 李青山 胡建斌 《信息安全研究》 CSCD 北大核心 2024年第2期139-147,共9页
随着数据脱敏技术的持续进步,精确识别隐私数据已成为关键挑战.目前,隐私信息抽取算法主要基于传统自然语言处理技术,如双向循环神经网络和基于注意力机制的预训练语言模型(如BERT).这些模型利用其强大的上下文特征表示能力,克服了传统... 随着数据脱敏技术的持续进步,精确识别隐私数据已成为关键挑战.目前,隐私信息抽取算法主要基于传统自然语言处理技术,如双向循环神经网络和基于注意力机制的预训练语言模型(如BERT).这些模型利用其强大的上下文特征表示能力,克服了传统方法在多义词表示方面的限制.然而,它们在精确判断实体边界方面仍有改进空间.提出了一种新颖的隐私信息抽取算法,该算法融合结构先验知识,通过一种隐私数据结构知识增强机制,提高模型对句子语义结构的理解,从而提高了隐私信息边界判断的准确性.此外,还在多个公开数据集上对模型进行评估,详细的实验结果展示了其有效性. 展开更多
关键词 结构先验知识 结构增强机制 隐私信息抽取算法 实体边界判断 数据脱敏 自然语言处理
下载PDF
结合语法结构和语义信息的情感三元组提取
9
作者 杨芳捷 冯广 唐业凯 《计算机系统应用》 2024年第3期255-263,共9页
针对目前大多数方面情感三元组提取方法存在着没有充分考虑语法结构和语义相关性的问题.本文提出一种结合语法结构和语义信息的方面情感三元组提取模型,首先提出使用依赖解析器得到所有依赖弧的概率矩阵构建语法图,提取丰富的语法结构信... 针对目前大多数方面情感三元组提取方法存在着没有充分考虑语法结构和语义相关性的问题.本文提出一种结合语法结构和语义信息的方面情感三元组提取模型,首先提出使用依赖解析器得到所有依赖弧的概率矩阵构建语法图,提取丰富的语法结构信息.其次利用自注意力机制构建语义图,表示单词与单词之间的语义相关性,从而减低噪声词的干扰.最后设计了一个相互仿射变换层,让模型可以更好地交换语法图和语义图之间的相关特征,提升模型情感三元组提取的表现.在多个公开数据集上进行验证.实验表明,与现有的情感三元组提取模型相比,精确度(P)、召回率(R)和F1值整体都有提高,验证了结合语法结构和语义信息在方面情感三元组提取的有效性. 展开更多
关键词 方面情感三元组提取 语法结构 语义信息 图卷积网络 自注意力机制
下载PDF
基于深度学习的CAD表格识别算法设计
10
作者 方靖宇 韩文涛 +3 位作者 应成才 何天祥 徐瑞吉 毛科技 《科技资讯》 2024年第16期16-20,共5页
随着工程和设计行业的快速发展,计算机辅助设计(Computer-Aided Design,CAD)软件在生产设计图纸方面发挥着不可或缺的作用。然而,传统的CAD在表格数据管理和提取方面存在局限性,尤其是在处理大规模的工程图纸中的表格数据时。为了解决... 随着工程和设计行业的快速发展,计算机辅助设计(Computer-Aided Design,CAD)软件在生产设计图纸方面发挥着不可或缺的作用。然而,传统的CAD在表格数据管理和提取方面存在局限性,尤其是在处理大规模的工程图纸中的表格数据时。为了解决这一问题,提出了一种新的自动化方法来提取CAD图纸中的大型表格数据。通过将原始CAD文件转换为图像格式,并应用先进的图像处理技术和深度学习模型(SAHI算法和Cycle-CenterNet模型),能够有效地提高表格数据的识别准确率和处理效率。实验结果显示,对比直接提取表格数据,使用该方法能显著提高数据提取的精确度、召回率和F1分数,验证了其在自动化提取大型CAD表格数据方面的有效性。未来的工作将集中在优化模型架构和提升其在不同类型图纸中的通用性和效果。 展开更多
关键词 计算机辅助设计 表格检测 表格结构识别 表格信息提取 表格分割 图像处理 深度学习
下载PDF
基于图神经网络的代码抄袭检测方法
11
作者 陈昌奉 赵宏州 周恺卿 《计算机工程与科学》 CSCD 北大核心 2024年第10期1815-1824,共10页
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网... 随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。 展开更多
关键词 代码抄袭检测 深度语义和结构信息提取 图神经网络 图注意力网络 特征强化
下载PDF
科创项目信息提取系统设计
12
作者 柏斌 《现代信息科技》 2024年第7期19-24,共6页
文章分析讨论了半结构化信息管理技术的发展状况和应用情况,在梳理和总结半结构化文本信息抽取载体类型、内容和技术方法的基础上,设计了科创项目信息提取系统。该系统数据源以科研院所/创业团队提供的商业策划书为主,采用B/S架构,以基... 文章分析讨论了半结构化信息管理技术的发展状况和应用情况,在梳理和总结半结构化文本信息抽取载体类型、内容和技术方法的基础上,设计了科创项目信息提取系统。该系统数据源以科研院所/创业团队提供的商业策划书为主,采用B/S架构,以基础设置、数据层、应用层和用户层四层逻辑构架为基础,通过业务逻辑后台、文件解析模块、项目关键信息抽取服务三大功能模块,实现对科创项目策划书文本数据采集、关键信息提取、数据存储以及数据服务的高效管理。实践结果表明,该系统功能达到了预期设计目标,运行稳定、高效。 展开更多
关键词 半结构化信息 科创项目 信息提取系统
下载PDF
面向用水结构研究领域的多阶段实体关系联合抽取方法
13
作者 陶天然 《现代计算机》 2024年第8期103-107,共5页
以往的知识抽取模型忽略了实体关系间的内在语义关联,并且在处理具有复杂关系的用水数据集时会产生大量的冗余信息。针对以上问题,提出一种融合语义信息的实体关系联合抽取模型。模型包括三个阶段:第一阶段,将经过BERT⁃wwm编码后的文本... 以往的知识抽取模型忽略了实体关系间的内在语义关联,并且在处理具有复杂关系的用水数据集时会产生大量的冗余信息。针对以上问题,提出一种融合语义信息的实体关系联合抽取模型。模型包括三个阶段:第一阶段,将经过BERT⁃wwm编码后的文本信息投影到关系检测空间中,过滤掉关系集合中的冗余数据;第二阶段,利用多头注意力机制将关系信息融合进文本编码,获取对应关系下的头实体和尾实体集合;第三阶段,引入融合上下文语义信息的实体相关矩阵,完成对三元组的准确提取。实验结果表明,所设计的模型在用水结构研究数据集上取得了较好的实体关系抽取效果。 展开更多
关键词 用水结构研究 联合抽取 多阶段抽取 语义信息 知识图谱
下载PDF
基于隐马尔可夫模型的半结构化文本信息抽取研究
14
作者 蒲治宇 《数字通信世界》 2024年第6期84-85,93,共3页
随着互联网和信息技术的快速发展,大量的文本数据在互联网上被生成和存储,这些文本数据包含了丰富的信息。然而,大部分文本数据都是半结构化的,即数据的组织结构不完整或不规则,不适合直接进行分析和处理。因此,半结构化文本信息抽取成... 随着互联网和信息技术的快速发展,大量的文本数据在互联网上被生成和存储,这些文本数据包含了丰富的信息。然而,大部分文本数据都是半结构化的,即数据的组织结构不完整或不规则,不适合直接进行分析和处理。因此,半结构化文本信息抽取成为了一个重要的研究领域,文章基于隐马尔科夫模型对半结构化文本信息的抽取进行研究。 展开更多
关键词 半结构化文本 信息抽取 隐马尔科夫模型
下载PDF
基于结构信息提取的图像质量评价 被引量:43
15
作者 叶盛楠 苏开娜 +1 位作者 肖创柏 段娟 《电子学报》 EI CAS CSCD 北大核心 2008年第5期856-861,共6页
结构相似性理论是一种关于图像质量评价的新思想.与自底向上地模拟人眼视觉系统(HVS)低阶的组成结构不同,结构相似性理论自顶向下地模拟HVS的整体功能.作为结构相似性理论的一个实现,结构相似度(SSIM)指数有着简单高效的优点,但SSIM在... 结构相似性理论是一种关于图像质量评价的新思想.与自底向上地模拟人眼视觉系统(HVS)低阶的组成结构不同,结构相似性理论自顶向下地模拟HVS的整体功能.作为结构相似性理论的一个实现,结构相似度(SSIM)指数有着简单高效的优点,但SSIM在交叉失真类型和失真严重时的准确性不够好.本文将结构信息重新解释为图像中能量足够大的中高频成分,从新的角度将SSIM理解为一种更好的局部误差度量方式.提出一种基于结构信息提取(SIExt)的图像质量评价方法,将图像中的结构信息分离出来给予较大的权重,并用SSIM作为误差度量估计局部失真.实验结果表明,SIExt比PSNR和SSIM等方法有更好的准确性. 展开更多
关键词 图像质量评价 结构相似度(SSIM) 结构信息提取(siext) 人眼视觉系统(HIVS)
下载PDF
桥梁结构动态应变监测信息的分离与提取 被引量:17
16
作者 吴佰建 李兆霞 +1 位作者 王滢 T.H.T.Chan 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第5期767-773,共7页
对工作应变传感器和温度应变传感器的数据进行了对比分析,利用能量谱比指标将监测系统输出的原始应变数据按照温度、应力和测量噪声3种类型在频域中进行分类,分别确定了温度变形与结构应变的分界频率.提出了一个多分辨递阶方法,可将3类... 对工作应变传感器和温度应变传感器的数据进行了对比分析,利用能量谱比指标将监测系统输出的原始应变数据按照温度、应力和测量噪声3种类型在频域中进行分类,分别确定了温度变形与结构应变的分界频率.提出了一个多分辨递阶方法,可将3类不同信息分离并提取出由结构应力导致的应变信息,在分离信息基础上考察了干扰部分和温度应力部分对疲劳评估的影响.研究结果表明,2个分界频率值对同类桥梁有较强的参考价值,提出的算法具有多分辨和递阶的特征,适合于海量应变数据的压缩与预处理,便于在结构健康监测系统软件中集成.虽然变温变形部分的能量很大,但其对疲劳评估产生的误差很小;而干扰信息虽然能量很小,但对疲劳评估产生的影响很大,其主要原因是干扰信息使得应力应变中提取的应变幅发生偏移. 展开更多
关键词 结构健康监测 结构应变 信息分离 信息提取 疲劳评估
下载PDF
基于Web的快速信息抽取 被引量:12
17
作者 张绍华 薛文玲 李天柱 《计算机应用》 CSCD 北大核心 2001年第7期18-19,31,共3页
介绍了一种基于Web的信息抽取的快速实现方法 ,该方法将信息抽取划分为两个阶段 ,在每个阶段采用不同的数据模型。
关键词 半结构数据 信息抽取 装配器 WEB 数据模型 信息处理
下载PDF
一种全自动生成网页信息抽取Wrapper的方法 被引量:21
18
作者 梅雪 程学旗 +2 位作者 郭岩 张刚 丁国栋 《中文信息学报》 CSCD 北大核心 2008年第1期22-29,共8页
Web网页信息抽取是近年来广泛关注的话题。如何最快最准地从大量Web网页中获取主要数据成为该领域的一个研究重点。文章中提出了一种全自动化生成网页信息抽取Wrapper的方法。该方法充分利用网页设计模版的结构化、层次化特点,运用网页... Web网页信息抽取是近年来广泛关注的话题。如何最快最准地从大量Web网页中获取主要数据成为该领域的一个研究重点。文章中提出了一种全自动化生成网页信息抽取Wrapper的方法。该方法充分利用网页设计模版的结构化、层次化特点,运用网页链接分类算法和网页结构分离算法,抽取出网页中各个信息单元,并输出相应Wrapper。利用Wrapper能够对同类网页自动地进行信息抽取。实验结果表明,该方法同时实现了对网页中严格的结构化信息和松散的结构化信息的自动化抽取,抽取结果达到非常高的准确率。 展开更多
关键词 计算机应用 中文信息处理 网页信息抽取 网页结构分离 包装器
下载PDF
基于多知识的Web网页信息抽取方法 被引量:10
19
作者 朱明 黄云 蔡庆生 《小型微型计算机系统》 CSCD 北大核心 2001年第9期1058-1061,共4页
从 Web网页中自动抽取所需要的信息内容 ,是互联网信息智能搜取的一个重要研究课题 .为有效解决网页信息抽取所需的信息描述知识获取问题 ,这里提出了一种基于多知识的 Web网页信息抽取方法 (简称 MKIE方法 ) .该方法将网页信息抽取所... 从 Web网页中自动抽取所需要的信息内容 ,是互联网信息智能搜取的一个重要研究课题 .为有效解决网页信息抽取所需的信息描述知识获取问题 ,这里提出了一种基于多知识的 Web网页信息抽取方法 (简称 MKIE方法 ) .该方法将网页信息抽取所需的知识分为二类 .一类是描绘网页内容本身表示特点 ,以及识别各网页信息对象的确定模式知识 ;另一类则描述网页信息记录块 ,以及各网页信息对象的非确定模式知识 .MKIE方法根据前一类知识 ,动态分析获得后一类知识 ;并利用这两类知识 ,最终完成从信息内容类似但其表现形式各异的网页中 ,抽取出所需要的信息 .美大学教员论文网页信息抽取实验结果表明 。 展开更多
关键词 WEB 网页 信息抽取 知识 互联网
下载PDF
Web信息抽取 被引量:17
20
作者 李晶 陈恩红 《计算机科学》 CSCD 北大核心 2003年第6期78-81,共4页
With the tremendous amount of information available on the Web, the ability to quickly obtain information has become a crucial problem. It is not enough for us to acquire information only with Web information retrieva... With the tremendous amount of information available on the Web, the ability to quickly obtain information has become a crucial problem. It is not enough for us to acquire information only with Web information retrieval technology. Therefore more and more people pay attention to Web information extraction technology. This paper first in- troduces some concepts of information extraction technology, then introduces and analyzes several typical Web information extraction methods based on the differences in extraction patterns. 展开更多
关键词 WEB 信息抽取 信息搜索 互联网 信息资源 搜索引擎
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部