期刊文献+
共找到37篇文章
< 1 2 >
每页显示 20 50 100
A Joint Entity Relation Extraction Model Based on Relation Semantic Template Automatically Constructed
1
作者 Wei Liu Meijuan Yin +1 位作者 Jialong Zhang Lunchong Cui 《Computers, Materials & Continua》 SCIE EI 2024年第1期975-997,共23页
The joint entity relation extraction model which integrates the semantic information of relation is favored by relevant researchers because of its effectiveness in solving the overlapping of entities,and the method of... The joint entity relation extraction model which integrates the semantic information of relation is favored by relevant researchers because of its effectiveness in solving the overlapping of entities,and the method of defining the semantic template of relation manually is particularly prominent in the extraction effect because it can obtain the deep semantic information of relation.However,this method has some problems,such as relying on expert experience and poor portability.Inspired by the rule-based entity relation extraction method,this paper proposes a joint entity relation extraction model based on a relation semantic template automatically constructed,which is abbreviated as RSTAC.This model refines the extraction rules of relation semantic templates from relation corpus through dependency parsing and realizes the automatic construction of relation semantic templates.Based on the relation semantic template,the process of relation classification and triplet extraction is constrained,and finally,the entity relation triplet is obtained.The experimental results on the three major Chinese datasets of DuIE,SanWen,and FinRE showthat the RSTAC model successfully obtains rich deep semantics of relation,improves the extraction effect of entity relation triples,and the F1 scores are increased by an average of 0.96% compared with classical joint extraction models such as CasRel,TPLinker,and RFBFN. 展开更多
关键词 Natural language processing deep learning information extraction relation extraction relation semantic template
下载PDF
改进Deeplabv3+的高分辨率遥感影像道路提取模型 被引量:8
2
作者 赵凌虎 袁希平 +2 位作者 甘淑 胡琳 丘鸣语 《自然资源遥感》 CSCD 北大核心 2023年第1期107-114,共8页
针对传统的道路提取方法在高分辨率遥感影像中存在提取效果差和提取速度慢的问题,提出了改进Deeplabv3+的高分辨率遥感影像道路提取模型。采用MobileNetv2主干特征提取网络与Dice Loss函数相结合,较好地平衡了高分辨率遥感影像道路提取... 针对传统的道路提取方法在高分辨率遥感影像中存在提取效果差和提取速度慢的问题,提出了改进Deeplabv3+的高分辨率遥感影像道路提取模型。采用MobileNetv2主干特征提取网络与Dice Loss函数相结合,较好地平衡了高分辨率遥感影像道路提取精度与速度的矛盾,实现较高提取精度的同时减少了模型参数,满足了时效性的要求。基于开源道路提取数据集的实验结果表明:①该文提出的道路提取模型在高分辨率遥感影像上具有可行性,提取道路的整体精度达到98.71%,具有较高的提取精度;②在提取道路的速度方面该方法平均帧数达到120.05,模型参数量仅为5.81 M,总体上比原模型更加轻量化,表明该方法满足了时效性的要求。该方法在大幅减少参数量、满足时效性的同时保证了提取的精确度,为提高基于高分辨率影像的道路提取精度和速度提供了一种新的改进思路和方法。 展开更多
关键词 遥感影像 道路提取 深度学习 语义分割 deepLabv3+模型
下载PDF
基于潜层关系增强的实体和关系联合抽取
3
作者 王鹏 刘小明 +2 位作者 杨关 刘杰 刘阳 《计算机工程与设计》 北大核心 2024年第6期1780-1788,共9页
为充分发掘文本序列中潜层语义关系信息,提出一种实体和关系联合抽取的潜层关系增强模型SREM(text subtext relationship enhancement model)。在潜层关系表示层利用结构化对齐的方式,获取并保持文本序列中的语义信息结构。在融合注意... 为充分发掘文本序列中潜层语义关系信息,提出一种实体和关系联合抽取的潜层关系增强模型SREM(text subtext relationship enhancement model)。在潜层关系表示层利用结构化对齐的方式,获取并保持文本序列中的语义信息结构。在融合注意力机制的关系网络层中对数据进行建模,提高模型对文本词汇间关系信息的捕获能力。结合注意力机制获取细粒度语义信息,对上下文信息进行选择过滤。实验结果表明,在数据集NYT和WebNLG上取得的F1值分别为92.40%和92.52%,验证了模型的有效性。 展开更多
关键词 联合抽取 语义关系 结构化知识 潜层表示 注意力机制 关系网路 信息过滤
下载PDF
基于伪属性语义匹配的Deep web信息抽取 被引量:4
4
作者 郑皎凌 唐常杰 +2 位作者 姜玥 杨宁 李红军 《四川大学学报(工程科学版)》 EI CAS CSCD 北大核心 2009年第2期173-178,共6页
已有的Deep Web信息抽取算法主要对结构规范的网页进行模版的提取,目前多数Deep Web网页在结构上是非规范的,网页中记录属性字段可能缺失或重复、原子属性字段可能被html标签分隔。为了正确抽取这些非规范网页,提出了一种新方法:引入了... 已有的Deep Web信息抽取算法主要对结构规范的网页进行模版的提取,目前多数Deep Web网页在结构上是非规范的,网页中记录属性字段可能缺失或重复、原子属性字段可能被html标签分隔。为了正确抽取这些非规范网页,提出了一种新方法:引入了记录的伪属性及其语义匹配概念,通过实现记录间伪属性序列的语义匹配实现信息抽取;提出了伪属性序列的模型及其语义匹配算法和记录Wrapper模型及其生成算法。实验表明,在结构不规范deep web网页的抽取上,能达到91%的查全率和93%的查准率,相对其它算法有一定优势。 展开更多
关键词 deep WEB 信息抽取 伪属性 语义匹配
下载PDF
结合语法结构和语义信息的情感三元组提取
5
作者 杨芳捷 冯广 唐业凯 《计算机系统应用》 2024年第3期255-263,共9页
针对目前大多数方面情感三元组提取方法存在着没有充分考虑语法结构和语义相关性的问题.本文提出一种结合语法结构和语义信息的方面情感三元组提取模型,首先提出使用依赖解析器得到所有依赖弧的概率矩阵构建语法图,提取丰富的语法结构信... 针对目前大多数方面情感三元组提取方法存在着没有充分考虑语法结构和语义相关性的问题.本文提出一种结合语法结构和语义信息的方面情感三元组提取模型,首先提出使用依赖解析器得到所有依赖弧的概率矩阵构建语法图,提取丰富的语法结构信息.其次利用自注意力机制构建语义图,表示单词与单词之间的语义相关性,从而减低噪声词的干扰.最后设计了一个相互仿射变换层,让模型可以更好地交换语法图和语义图之间的相关特征,提升模型情感三元组提取的表现.在多个公开数据集上进行验证.实验表明,与现有的情感三元组提取模型相比,精确度(P)、召回率(R)和F1值整体都有提高,验证了结合语法结构和语义信息在方面情感三元组提取的有效性. 展开更多
关键词 方面情感三元组提取 语法结构 语义信息 图卷积网络 自注意力机制
下载PDF
基于深度学习的CAD表格识别算法设计
6
作者 方靖宇 韩文涛 +3 位作者 应成才 何天祥 徐瑞吉 毛科技 《科技资讯》 2024年第16期16-20,共5页
随着工程和设计行业的快速发展,计算机辅助设计(Computer-Aided Design,CAD)软件在生产设计图纸方面发挥着不可或缺的作用。然而,传统的CAD在表格数据管理和提取方面存在局限性,尤其是在处理大规模的工程图纸中的表格数据时。为了解决... 随着工程和设计行业的快速发展,计算机辅助设计(Computer-Aided Design,CAD)软件在生产设计图纸方面发挥着不可或缺的作用。然而,传统的CAD在表格数据管理和提取方面存在局限性,尤其是在处理大规模的工程图纸中的表格数据时。为了解决这一问题,提出了一种新的自动化方法来提取CAD图纸中的大型表格数据。通过将原始CAD文件转换为图像格式,并应用先进的图像处理技术和深度学习模型(SAHI算法和Cycle-CenterNet模型),能够有效地提高表格数据的识别准确率和处理效率。实验结果显示,对比直接提取表格数据,使用该方法能显著提高数据提取的精确度、召回率和F1分数,验证了其在自动化提取大型CAD表格数据方面的有效性。未来的工作将集中在优化模型架构和提升其在不同类型图纸中的通用性和效果。 展开更多
关键词 计算机辅助设计 表格检测 表格结构识别 表格信息提取 表格分割 图像处理 深度学习
下载PDF
基于图神经网络的代码抄袭检测方法
7
作者 陈昌奉 赵宏州 周恺卿 《计算机工程与科学》 CSCD 北大核心 2024年第10期1815-1824,共10页
随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网... 随着数据开源的不断深化,代码抄袭成本降低,严重影响软件行业的健康发展。因此,针对现有抄袭检测方法无法深度挖掘源代码语义和结构信息导致语义抄袭检测效果不佳的问题,提出一种基于图神经网络的代码抄袭检测方法。该方法利用图神经网络对源代码包括语义和结构信息在内的特征进行有效表征,并利用图注意力网络进行特征强化,进一步利用神经张量网络得到不同源代码之间的相似向量。最后,利用全连接网络计算不同源代码之间的相似度。同时,加入dropout机制平衡神经元权重,优化模型设计,防止过拟合。为了验证所提方法的有效性,在OJ系统数据集上进行实验验证,并将此方法与当前流行的检测方法进行了对比。实验结果表明,所提方法具有更好的检测效果。 展开更多
关键词 代码抄袭检测 深度语义和结构信息提取 图神经网络 图注意力网络 特征强化
下载PDF
增强问句和文本交互的答案抽取方法
8
作者 邓涵 《现代电子技术》 北大核心 2024年第6期179-186,共8页
答案抽取对提高问答的质量和性能有着重要的作用,但现有的答案抽取方法存在问句和文本信息交互的问题。结合上下文的答案抽取模型虽然可以从文本中抽取出给定问题的答案,但这种抽取方法并未考虑文本和问句的信息交互。而只有问句和文本... 答案抽取对提高问答的质量和性能有着重要的作用,但现有的答案抽取方法存在问句和文本信息交互的问题。结合上下文的答案抽取模型虽然可以从文本中抽取出给定问题的答案,但这种抽取方法并未考虑文本和问句的信息交互。而只有问句和文本数据时,要从文本中获取更加精准的问句答案,可以利用问句和文本之间的语义信息,预测问句与文本实体之间的关联。基于此,使用问句对齐层和多头注意力机制构建一个交互文本和问句之间的信息模型。实验结果表明,相较于BIDAF-INDEPENDENT模型,改进后模型的EM值和F1值分别提高了1.281%和1.296%。 展开更多
关键词 答案抽取 问答系统 信息交互 语义信息 深度学习 多头注意力机制
下载PDF
基于属性的访问控制策略混合生成方法
9
作者 袁薇 田秀霞 《计算机工程与设计》 北大核心 2024年第10期2914-2921,共8页
为解决目前基于属性的访问控制(ABAC)策略生成方法受限于关系提取问题的难度以及属性的质量和数量等问题,提出一种策略混合生成方法。利用自顶向下方法提取富语义的访问权限信息词语,无需提取词语关系减小问题难度;基于语义相似度优化... 为解决目前基于属性的访问控制(ABAC)策略生成方法受限于关系提取问题的难度以及属性的质量和数量等问题,提出一种策略混合生成方法。利用自顶向下方法提取富语义的访问权限信息词语,无需提取词语关系减小问题难度;基于语义相似度优化实体属性,减少属性数量并提升质量,改进深度森林模型自底向上挖掘策略,提升高维度属性下的访问权限决策性能。实验结果表明,混合方法权限决策准确率最高可达98.11%,比直接的单一生成方法提高了2.05%,且策略模型的挖掘时间缩短了21.53%,是一种更加精准且高效的ABAC策略生成方法。 展开更多
关键词 基于属性的访问控制 深度神经网络 词提取 属性优化 语义相似度 深度森林 信息安全
下载PDF
基于图像语义分割与结构保持约束的风机叶片拼接技术
10
作者 许恒雷 陈帅旗 +1 位作者 宋勋 朱洺洁 《现代防御技术》 北大核心 2024年第4期123-129,共7页
以无人机对风机叶片的巡检拍摄为应用背景,开展了风机叶片图像的拼接方法研究,提出了一种先进行背景分割然后进行图像网格化拼接的处理方法。通过深度学习U-Net算法,进行图像中风机主体部分的提取,该处理能够有效处理多视角大视差、目... 以无人机对风机叶片的巡检拍摄为应用背景,开展了风机叶片图像的拼接方法研究,提出了一种先进行背景分割然后进行图像网格化拼接的处理方法。通过深度学习U-Net算法,进行图像中风机主体部分的提取,该处理能够有效处理多视角大视差、目标背景特征点分布不均导致的风机叶片拼接困难的问题;在图像网格优化的过程中,基于保护风叶全局线性度的策略设计能量函数,优化得到的网格顶点对风机边缘的直线特征进行了有效保护。实现了多幅风机叶片的自然拼接,拼接得到的图像视觉效果畸变小、连续真实。 展开更多
关键词 图像语义分割 as-projective-as-possible(APAP) 网格化图像拼接 直线结构保持 深度学习 特征提取
下载PDF
面向用水结构研究领域的多阶段实体关系联合抽取方法
11
作者 陶天然 《现代计算机》 2024年第8期103-107,共5页
以往的知识抽取模型忽略了实体关系间的内在语义关联,并且在处理具有复杂关系的用水数据集时会产生大量的冗余信息。针对以上问题,提出一种融合语义信息的实体关系联合抽取模型。模型包括三个阶段:第一阶段,将经过BERT⁃wwm编码后的文本... 以往的知识抽取模型忽略了实体关系间的内在语义关联,并且在处理具有复杂关系的用水数据集时会产生大量的冗余信息。针对以上问题,提出一种融合语义信息的实体关系联合抽取模型。模型包括三个阶段:第一阶段,将经过BERT⁃wwm编码后的文本信息投影到关系检测空间中,过滤掉关系集合中的冗余数据;第二阶段,利用多头注意力机制将关系信息融合进文本编码,获取对应关系下的头实体和尾实体集合;第三阶段,引入融合上下文语义信息的实体相关矩阵,完成对三元组的准确提取。实验结果表明,所设计的模型在用水结构研究数据集上取得了较好的实体关系抽取效果。 展开更多
关键词 用水结构研究 联合抽取 多阶段抽取 语义信息 知识图谱
下载PDF
一种基于视觉特征的Deep Web信息抽取方法 被引量:4
12
作者 孙璐 陈军华 廉德胜 《计算机与数字工程》 2016年第6期1107-1111,1126,共6页
随着Web数据库的不断增长,大量网络信息通过普通搜索引擎难以满足用户的需求,需要用户提交表单查询并从后台数据库中返回结果页面才能获取到想要的信息,称为Deep Web。因此如何有效地抽取这些实体信息成为一个值得研究的问题。论文通过... 随着Web数据库的不断增长,大量网络信息通过普通搜索引擎难以满足用户的需求,需要用户提交表单查询并从后台数据库中返回结果页面才能获取到想要的信息,称为Deep Web。因此如何有效地抽取这些实体信息成为一个值得研究的问题。论文通过分析Deep Web结果页面的特点,结合人的视觉特征,提出了一种基于视觉特征的Deep Web信息抽取方法。该方法充分利用了人的视觉特征,在解析器将Web文档解析成语法树之前,将Web页面一些与主题无关的信息(例如导航栏、广告)等去除,并对优化后的DOM树利用VIPS算法对其进行语义分块,分块后根据位置特征首先寻找到基准视觉块,以该基准视觉块作为中心位置逆序和顺序遍历DOM树寻找所有相似的视觉块并对其进行抽取。从实验效果来看,该方法从提取信息速度和提取信息的准确率和完整率方面与传统方法相比都有一定的提高。 展开更多
关键词 deep Web 视觉特征 DOM树 语义分块 信息抽取
下载PDF
Structured AJAX Data Extraction Based on Agricultural Ontology 被引量:6
13
作者 LI Chuan-xi SU Ya-ru +2 位作者 WANG Ru-jing WEI Yuan-yuan HUANG He 《Journal of Integrative Agriculture》 SCIE CAS CSCD 2012年第5期784-791,共8页
More web pages are widely applying AJAX (Asynchronous JavaScript XML) due to the rich interactivity and incremental communication. By observing, it is found that the AJAX contents, which could not be seen by traditi... More web pages are widely applying AJAX (Asynchronous JavaScript XML) due to the rich interactivity and incremental communication. By observing, it is found that the AJAX contents, which could not be seen by traditional crawler, are well-structured and belong to one specific domain generally. Extracting the structured data from AJAX contents and annotating its semantic are very significant for further applications. In this paper, a structured AJAX data extraction method for agricultural domain based on agricultural ontology was proposed. Firstly, Crawljax, an open AJAX crawling tool, was overridden to explore and retrieve the AJAX contents; secondly, the retrieved contents were partitioned into items and then classified by combining with agricultural ontology. HTML tags and punctuations were used to segment the retrieved contents into entity items. Finally, the entity items were clustered and the semantic annotation was assigned to clustering results according to agricultural ontology. By experimental evaluation, the proposed approach was proved effectively in resource exploring, entity extraction, and semantic annotation. 展开更多
关键词 information extraction structured data AJAX agricultural ontology semantic annotation
下载PDF
半结构化的Deep Web信息抽取技术
14
作者 朱晴 姜利群 张言辉 《电脑知识与技术(过刊)》 2010年第15期4312-4313,共2页
当今随着互联网技术的飞速发展,DeepWeb的信息量也在以惊人的速度迅猛增长,对其进行信息抽取具有十分重要意义。该文针对Web页面半结构化的特点,提出了基于XML的信息自动抽取方法,设计了抽取的流程,并对抽取规则进行了优化。
关键词 deep WEB 半结构化 信息抽取技术 XML
下载PDF
基于U-Net++的烟草种植信息提取
15
作者 齐建伟 《测绘与空间地理信息》 2023年第1期100-102,106,共4页
以洛宁县为研究区,高分二号为数据源,利用U-Net++模型对研究区烟草进行提取。结果表明:基于U-Net++模型烟草提取的准确率、F1分数和Kappa系数相比于原始的U-Net模型提取精度分别从86.33%、73.86%和0.65提高到91.85%、80.13%和0.82。综... 以洛宁县为研究区,高分二号为数据源,利用U-Net++模型对研究区烟草进行提取。结果表明:基于U-Net++模型烟草提取的准确率、F1分数和Kappa系数相比于原始的U-Net模型提取精度分别从86.33%、73.86%和0.65提高到91.85%、80.13%和0.82。综上可知,本文提出的U-Net++网络模型在烟草提取中是可行的,为烟草信息的快速提取提供了技术支持。 展开更多
关键词 深度学习 语义分割 烟草 信息提取 高分二号
下载PDF
基于深度学习和GB-RBM的UAV红外语义分割方法 被引量:1
16
作者 冯向东 邬忠萍 郝宗波 《计算机工程与设计》 北大核心 2023年第8期2432-2438,共7页
为提高UAV红外图像语义分割的性能,提出基于深度学习和高斯伯努利受限玻尔兹曼机(GB-RBM)的实时语义分割模型。确认地面车辆实时特征提取中的关键问题。基于GB-RBM,提出用于编码阶段的形状先验模型。通过将SegNet中的编码器-解码器结构... 为提高UAV红外图像语义分割的性能,提出基于深度学习和高斯伯努利受限玻尔兹曼机(GB-RBM)的实时语义分割模型。确认地面车辆实时特征提取中的关键问题。基于GB-RBM,提出用于编码阶段的形状先验模型。通过将SegNet中的编码器-解码器结构与GB-RBM模块相融合,在解码器块中生成红外数据的实时映射,实现准确快速的语义分割。实验结果表明,所提方法能够很好地处理红外视频中的实时几何信息,在3个实验数据集上的平均精度约为0.98,平均处理时长约为17.86 s,性能优于其它优秀方法。 展开更多
关键词 深度学习 语义分割 受限玻尔兹曼机 红外图像 编码器-解码器 特征提取 几何信息
下载PDF
HUSS:A Heuristic Method for Understanding the Semantic Structure of Spreadsheets
17
作者 Xindong Wu Hao Chen +3 位作者 Chenyang Bu Shengwei Ji Zan Zhang Victor S.Sheng 《Data Intelligence》 EI 2023年第3期537-559,共23页
Spreadsheets contain a lot of valuable data and have many practical applications.The key technology of these practical applications is how to make machines understand the semantic structure of spreadsheets,e.g.,identi... Spreadsheets contain a lot of valuable data and have many practical applications.The key technology of these practical applications is how to make machines understand the semantic structure of spreadsheets,e.g.,identifying cell function types and discovering relationships between cell pairs.Most existing methods for understanding the semantic structure of spreadsheets do not make use of the semantic information of cells.A few studies do,but they ignore the layout structure information of spreadsheets,which affects the performance of cell function classification and the discovery of different relationship types of cell pairs.In this paper,we propose a Heuristic algorithm for Understanding the Semantic Structure of spreadsheets(HUSS).Specifically,for improving the cell function classification,we propose an error correction mechanism(ECM)based on an existing cell function classification model[11]and the layout features of spreadsheets.For improving the table structure analysis,we propose five types of heuristic rules to extract four different types of cell pairs,based on the cell style and spatial location information.Our experimental results on five real-world datasets demonstrate that HUSS can effectively understand the semantic structure of spreadsheets and outperforms corresponding baselines. 展开更多
关键词 Spreadsheet semantic structure information extraction HEURISTICS Cell function analysis Table structure analysis
原文传递
基于结构语义熵的网上商品信息提取系统 被引量:2
18
作者 吴晓彦 郑骁庆 +1 位作者 顾轶灵 沈元一 《计算机应用与软件》 CSCD 2010年第9期49-52,84,共5页
目前网上销售已成为一种重要的商品销售途径,其中商品网页信息提取是商品发布信息监测、商品比价等应用的技术基础。传统的网页信息提取系统在提取这些商品信息时存在人工干预过多和提取数据的针对性不强的问题。针对商品销售网站数据... 目前网上销售已成为一种重要的商品销售途径,其中商品网页信息提取是商品发布信息监测、商品比价等应用的技术基础。传统的网页信息提取系统在提取这些商品信息时存在人工干预过多和提取数据的针对性不强的问题。针对商品销售网站数据的具体表现形式,提出了一种基于结构语义熵的商品信息提取算法。该算法结合了商品的语义特征和网页的结构表现形式,可以实现全自动的网页商品提取。并通过实验证明了算法的有效性,和其在网上商品销售领域的普适性。 展开更多
关键词 网页信息提取 结构语义熵 信息聚集度分析
下载PDF
信息抽取的语义知识资源研究 被引量:18
19
作者 袁毓林 《中文信息学报》 CSCD 北大核心 2002年第5期8-14,共7页
本文讨论支持信息抽取的语义资源的建设问题,举例说明了信息抽取至少需要三种层面的语义知识:(i)宏观的话语篇章知识,籍此可以约束信息抽取的匹配模板的类型,预测关键性的信息项目在文本中的分布位置;(ii)中观的论元结构知识,籍此... 本文讨论支持信息抽取的语义资源的建设问题,举例说明了信息抽取至少需要三种层面的语义知识:(i)宏观的话语篇章知识,籍此可以约束信息抽取的匹配模板的类型,预测关键性的信息项目在文本中的分布位置;(ii)中观的论元结构知识,籍此可以建立动词的论元成分跟事件模板的传递与继承关系,帮助确定代词或空语类跟其先行语的回指关系,进而确定其语义所指;(iii)微观的逻辑结构知识,籍此可以确定否定词、量化词、模态词等逻辑算子跟其所约束的成分之间的逻辑关系(比如,哪些成分处于否定的辖域之中,其中哪个成分是否定的焦点,在哪些语法条件下否定词是冗余的,等等)。最后,指出研究这三种语义知识所可利用的几种理论和方法。 展开更多
关键词 信息抽取 语义知识资源 话语篇章 论元结构 逻辑结构 语义标注 语言分析 中文信息处理
下载PDF
基于语义的林产品贸易文本信息结构化研究 被引量:2
20
作者 陈钊 李嘉 《计算机工程》 CAS CSCD 北大核心 2011年第20期261-263,共3页
根据林产品贸易文本信息推送中信息结构化存储的需要,结合语义识别的基本原理和基于规则的信息抽取方法,提出一种基于规则的林产品贸易文本信息抽取方法,利用林产品贸易文本信息的特征,定义林产品贸易文本信息的文本层次识别规则,采用... 根据林产品贸易文本信息推送中信息结构化存储的需要,结合语义识别的基本原理和基于规则的信息抽取方法,提出一种基于规则的林产品贸易文本信息抽取方法,利用林产品贸易文本信息的特征,定义林产品贸易文本信息的文本层次识别规则,采用创建数据库和数据表匹配识别规则,给出识别规则匹配的正则表达式和文本内容截取识别规则,以抽取需要的特定事实信息,并以一种结构化的形式存储于数据库中。通过对实际林产品贸易网站的文本信息结构化抽取,证明该研究在林产品贸易信息推送中具有较好的应用价值。 展开更多
关键词 语义 林产品 贸易文本信息 结构化 信息抽取 识别规则
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部