期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
基于CasEE的电子病历医疗事件抽取模型
1
作者 倪昊 张旭 +2 位作者 马帅 王悦绮 崔建峰 《厦门理工学院学报》 2023年第3期40-49,共10页
为解决中文电子病历文本中医疗术语难以准确识别和医疗事件发生状态难以提取的问题,提出一种基于CasEE的电子病历医疗事件抽取模型。该模型采用MC-BERT作为编码层对医学实体向量化表示,并构建分类器和提取器,用类别信息辅助抽取事件发... 为解决中文电子病历文本中医疗术语难以准确识别和医疗事件发生状态难以提取的问题,提出一种基于CasEE的电子病历医疗事件抽取模型。该模型采用MC-BERT作为编码层对医学实体向量化表示,并构建分类器和提取器,用类别信息辅助抽取事件发生状态,并在模型训练阶段对数据集进行数据增强处理。实验结果显示,该模型在医疗事件抽取任务中的F1值达到了57.92%,优于传统模型,表明该模型具有良好的医疗事件抽取性能和较高的临床应用价值。 展开更多
关键词 电子病历 医疗事件 抽取模型 CasEE 深度学习
下载PDF
RE-OEM:一种半结构化生物数据的信息抽取模型 被引量:2
2
作者 曹顺良 刘杰 +2 位作者 王健 刘念祖 李亦学 《计算机应用研究》 CSCD 北大核心 2008年第9期2647-2650,2654,共5页
在分析半结构化生物数据特点的基础上,提出了一种新的半结构化数据抽取模型RE-OEM。它将OEM数据模型和正则表达式有机地结合起来,不但能够灵活方便地表示各种数据结构,而且能够非常方便地进行模式匹配和数据的定位,为半结构化生物数据... 在分析半结构化生物数据特点的基础上,提出了一种新的半结构化数据抽取模型RE-OEM。它将OEM数据模型和正则表达式有机地结合起来,不但能够灵活方便地表示各种数据结构,而且能够非常方便地进行模式匹配和数据的定位,为半结构化生物数据的抽取打下坚实基础。 展开更多
关键词 半结构化 生物数据 抽取模型 OEM数据模型 正则表达式
下载PDF
Web表格信息抽取模型的设计与实现 被引量:1
3
作者 廖涛 刘宗田 孔庆苹 《计算机应用与软件》 CSCD 2009年第4期72-74,共3页
Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中。现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自... Web表格作为一种简洁有效的数据信息表达方式,已广泛应用于Web页面中。现提出一种基于表格结构的Web表格信息抽取模型,该模型主要有表格定位模块、表格结构预处理模块和表格信息抽取与重构模块三个模块组成,根据Web表格的结构标记和自定义的启发式规则来抽取表格信息。实验结果表明该模型能够很好地应用于Web表格信息的抽取。 展开更多
关键词 表格结构 抽取模型 启发式规则 预处理 解析
下载PDF
基于载流子抽取模型的Trench Gate/Field-stop IGBT驱动器有源箝位功能分析 被引量:1
4
作者 陈玉香 罗皓泽 +1 位作者 李武华 何湘宁 《电源学报》 CSCD 2016年第6期136-142,共7页
针对Trench gate/Field-stop IGBT结构特有的关断过程中集电极电流下降率不可控问题,引入了载流子抽取模型来模拟器件关断过程中的集电极电流下降阶段器件内部载流子的动态行为特性,并以此为基础分析了驱动器为适应Trench gate/Field-St... 针对Trench gate/Field-stop IGBT结构特有的关断过程中集电极电流下降率不可控问题,引入了载流子抽取模型来模拟器件关断过程中的集电极电流下降阶段器件内部载流子的动态行为特性,并以此为基础分析了驱动器为适应Trench gate/Field-Stop IGBT结构这种关断特性而引入的有源箝位功能的作用机理,验证了载流子抽取模型在器件级与电路级交互作用分析中的实用性,为后续实现器件与电路的最佳匹配奠定了基础。 展开更多
关键词 Trench gate/Field-Stop IGBT 集电极电流下降率 不可控性 载流子抽取模型 有源箝位功能
下载PDF
面向电子交易的商品供应信息抽取模型 被引量:1
5
作者 傅魁 聂规划 《武汉理工大学学报(信息与管理工程版)》 CAS 2007年第7期96-99,共4页
随着互联网的普及和电子商务的发展,形成了大量的商品供应信息资源。从企业门户网站和电子市场的海量商品网页中抽取出供应信息资源,是电子交易迫切需要解决的问题。在分析信息抽取过程和商品网页结构的基础上,构建了基于网页DOM树的商... 随着互联网的普及和电子商务的发展,形成了大量的商品供应信息资源。从企业门户网站和电子市场的海量商品网页中抽取出供应信息资源,是电子交易迫切需要解决的问题。在分析信息抽取过程和商品网页结构的基础上,构建了基于网页DOM树的商品供应信息抽取模型。该模型由网页采集层、HTML文档解析层、信息抽取层和结果处理层组成,并重点对信息抽取层的抽取规则进行了探讨。 展开更多
关键词 电子交易 信息抽取模型 DOM 电子商务
下载PDF
评标专家均衡随机抽取模型 被引量:7
6
作者 孟陶然 《中国管理信息化》 2009年第15期50-53,共4页
在分析原有评标专家抽取模型不足的基础上,本文提出了评标专家均衡随机抽取模型。这种新的抽取模型不仅可以保证抽取过程的随机性,还能改善一段时间内专家被抽取状况的均衡性。本文介绍了新模型的构建思路和算法步骤,并利用实际数据进... 在分析原有评标专家抽取模型不足的基础上,本文提出了评标专家均衡随机抽取模型。这种新的抽取模型不仅可以保证抽取过程的随机性,还能改善一段时间内专家被抽取状况的均衡性。本文介绍了新模型的构建思路和算法步骤,并利用实际数据进行仿真实验,验证了新模型的优势。评标专家均衡随机抽取模型的提出对提高招投标工作的公平性和公正性具有重要的现实意义。 展开更多
关键词 评标专家 抽取模型 随机 均衡
下载PDF
基于深度学习的Web信息抽取模型研究与应用 被引量:2
7
作者 俞鑫 吴明晖 《计算机时代》 2019年第9期30-32,共3页
Web网页中包含了大量异构的半结构化或非结构化数据,如何准确地从这些网页中提取有价值的信息显得极其重要。文章基于深度学习,结合BERT构建了一种新型的BERT+BiLSTM+CRF信息抽取模型,实验结果表明了该方法的有效性。
关键词 深度学习 信息抽取模型 WEB BERT+BiLSTM+CRF
下载PDF
一种新的基于深度学习的重叠关系联合抽取模型 被引量:3
8
作者 赵敏钧 赵亚伟 +1 位作者 赵雅捷 罗刚 《中国科学院大学学报(中英文)》 CSCD 北大核心 2022年第2期240-251,共12页
随着互联网技术的快速发展和移动设备的普及,我们每时每刻都被各种各样的信息包围着。如何从海量的数据中挖掘出具有价值的信息一直是国内外研究的热点。其中,关系抽取是信息抽取的一个重要子任务,目的是从文本中识别出实体之间的关系,... 随着互联网技术的快速发展和移动设备的普及,我们每时每刻都被各种各样的信息包围着。如何从海量的数据中挖掘出具有价值的信息一直是国内外研究的热点。其中,关系抽取是信息抽取的一个重要子任务,目的是从文本中识别出实体之间的关系,从而挖掘出文本中的结构化信息,即事实三元组。在文本中,实体重叠和关系重叠是非常普遍的现象,但是现有的联合抽取模型不能够有效地解决这类问题,因此提出一种新的联合抽取模型,将关系抽取任务看作由2个子任务实体识别和关系识别组成,并分别使用序列标注的方法和多分类方法进行识别。在联合抽取过程中,为充分挖掘文本语义信息,在模型的输入层添加词性(POS)和句法依存关系(Deprel)特征,同时为消除随着句子长度增加带来的长距离依赖问题,在模型中引入注意力机制。最后,论文在NYT数据集和WebNLG数据集上进行关系抽取实验,结果表明论文提出的模型能够有效地解决关系重叠的问题,并取得最佳抽取效果。 展开更多
关键词 关系抽取 实体重叠 联合抽取模型 深度学习
下载PDF
汉语部分实体的抽取模型
9
作者 张秀丽 《沈阳工业学院学报》 2000年第4期57-63,共7页
为了识别汉语实体 ,提出了利用模式匹配技术构造一个抽取模型 .为了识别该模型的有效性 ,系统的测试语料采用 Internet网上真实语料 ,语料全部来自新加坡联合早报 ,主要是新闻领域 ,经过开放测试 ,该系统识别实体召回率为 46 .0 2 % ,... 为了识别汉语实体 ,提出了利用模式匹配技术构造一个抽取模型 .为了识别该模型的有效性 ,系统的测试语料采用 Internet网上真实语料 ,语料全部来自新加坡联合早报 ,主要是新闻领域 ,经过开放测试 ,该系统识别实体召回率为 46 .0 2 % ,准确率为 5 2 .94% . 展开更多
关键词 实体 模式匹配语言 规则 召回率 准确率 信息处理 汉语 抽取模型
下载PDF
基于PERT的中医药知识抽取式问答模型研究
10
作者 陈昊飏 于同舟 何强强 《现代信息科技》 2024年第11期125-129,共5页
中医药领域积累了丰富的知识与经验,但如何从这些海量、深奥的中医资料中准确提取中医药知识,一直是医学领域的挑战。为了提供高效准确的中医药知识抽取方法,提出了一种基于PERT模型的中医药知识抽取式问答模型。该方法依托中医药领域... 中医药领域积累了丰富的知识与经验,但如何从这些海量、深奥的中医资料中准确提取中医药知识,一直是医学领域的挑战。为了提供高效准确的中医药知识抽取方法,提出了一种基于PERT模型的中医药知识抽取式问答模型。该方法依托中医药领域的专业知识与增强数据集,结合PERT模型,使用乱序语言预训练任务,实现了一个具有较强中医药知识阅读理解能力的问答模型。实验结果表明,该模型在中医药知识数据集上的问答性能优于其他相关模型,当给出中医药知识文本和问题时,能较为精确地理解并给出对应答案。 展开更多
关键词 PERT 抽取式问答模型 预训练模型 中医药知识 机器阅读理解
下载PDF
基于通用信息抽取模型的年鉴大事记知识图谱构建研究——以林业大事记知识图谱为例
11
作者 周则旭 韩红旗 +2 位作者 张均胜 周潇 徐紫燕 《档案学研究》 北大核心 2023年第5期140-148,共9页
针对大事记数据的特点,以及各行业对于大事记的信息化需求,本文尝试提出一种利用知识图谱来整理大事记中的信息的方法,从而有效抽取领域年鉴大事记中的多元主体,厘清主体间复杂关系,并用于查阅及宣传工作。首先,根据大事记中各类事件的... 针对大事记数据的特点,以及各行业对于大事记的信息化需求,本文尝试提出一种利用知识图谱来整理大事记中的信息的方法,从而有效抽取领域年鉴大事记中的多元主体,厘清主体间复杂关系,并用于查阅及宣传工作。首先,根据大事记中各类事件的特点,进行事件分类和概念建模,从整体的角度,对大事记的信息化处理方案进行设计;其次,对知识图谱进行顶层设计,选取通用信息抽取模型进行信息抽取、知识图谱构建与存储的工作;最后,以《中国林业年鉴》的林业大事记部分为例,说明知识图谱的构建过程和应用。本文提出的知识图谱的构建过程和方法能够通过少量人工标注数据将大事记转化为结构化的知识库形式,便于高效便捷地检索大事记记录的事件信息,为挖掘大事记档案文本的价值提供了基础。 展开更多
关键词 通用信息抽取模型 信息抽取 知识图谱 大事记
原文传递
面向中文法律裁判文书的抽取式摘要算法
12
作者 温嘉宝 杨敏 《集成技术》 2024年第1期62-71,共10页
裁判文书自动摘要的目的在于让计算机能够自动选择、抽取和压缩法律文本中的重要信息,从而减轻法律从业者的工作量。目前,大多数基于预训练语言模型的摘要算法对输入文本的长度存在限制,因此无法对长文本进行有效摘要。为此,该文提出了... 裁判文书自动摘要的目的在于让计算机能够自动选择、抽取和压缩法律文本中的重要信息,从而减轻法律从业者的工作量。目前,大多数基于预训练语言模型的摘要算法对输入文本的长度存在限制,因此无法对长文本进行有效摘要。为此,该文提出了一种新的抽取式摘要算法,利用预训练语言模型生成句子向量,并基于Transformer编码器结构融合包括句子向量、句子位置和句子长度在内的信息,完成句子摘要。实验结果显示,该算法能够有效处理长文本摘要任务。此外,在2020年中国法律智能技术评测(CAIL)摘要数据集上进行测试的结果表明,与基线模型相比,该模型在ROUGE-1、ROUGE-2和ROUGE-L指标上均有显著提升。 展开更多
关键词 抽取式摘要模型 法律裁判文书 文本自动摘要 深度神经网络
下载PDF
基于BERT的电子病历实体关系联合抽取研究 被引量:1
13
作者 黄晓芳 陈剑秋 +1 位作者 周祖宏 廖敏 《医学信息学杂志》 CAS 2023年第2期28-34,共7页
分析中文电子病历数据实体关系提取常用方法,提出一种基于双向编码器表征的实体关系联合抽取算法,使用级联解码器以及指针标注方法完成实体关系抽取及实体识别,实验结果证明该方法可有效抽取电子病历实体关系。
关键词 电子病历 关系抽取 联合抽取模型 自然语言处理
下载PDF
SOCKET通信程序模型抽取及可靠性验证 被引量:9
14
作者 肖美华 余立全 肖攀 《计算机科学》 CSCD 北大核心 2012年第11期102-105,141,共5页
形式化方法是验证并发系统可靠性和安全性的重要手段。对高级语言开发的并发系统自动抽取的模型进行形式化验证是模型检测技术领域中的一个研究热点。鉴于socket函数调用顺序不正确产生的运行时潜在问题(内存泄漏、死锁、边界数据丢失... 形式化方法是验证并发系统可靠性和安全性的重要手段。对高级语言开发的并发系统自动抽取的模型进行形式化验证是模型检测技术领域中的一个研究热点。鉴于socket函数调用顺序不正确产生的运行时潜在问题(内存泄漏、死锁、边界数据丢失等),针对顺序结构的socket程序,通过描述Promela消息数据结构和通道,构建socket函数的Promela模型,定义socket函数到Promela映射规则,提出socket函数调用序列抽取算法及目标Promela模型生成算法,用线性时态逻辑(LTL)刻画socket函数调用顺序应满足的性质,开发基于SPIN的socket通信程序分析系统。实验结果表明,该系统能有效检测socket通信程序的运行时潜在问题。 展开更多
关键词 SOCKET 模型检测 模型抽取 形式化验证
下载PDF
基于Pro/E二次开发的模型抽取技术 被引量:3
15
作者 张利强 刘刚 +1 位作者 顾翠 章翔峰 《导弹与航天运载技术》 北大核心 2011年第2期58-61,共4页
为了实现从复杂的装配体中抽取部分零部件进行CAE分析,同时保持被抽取零部件的空间位置关系不变。利用VC2005开发环境和Pro/E自带的Pro/ToolKit开发模块进行二次开发,在Pro/E非可视化的条件下将Pro/E模型导入内存,重新组合生成新装配体... 为了实现从复杂的装配体中抽取部分零部件进行CAE分析,同时保持被抽取零部件的空间位置关系不变。利用VC2005开发环境和Pro/E自带的Pro/ToolKit开发模块进行二次开发,在Pro/E非可视化的条件下将Pro/E模型导入内存,重新组合生成新装配体进行实时预览,并将预览合适的新装配体按照指定文件格式保存。结合虚拟火箭案例,验证了复杂模型抽取的可行性和实用性,提高了分析模型抽取、装配的效率和通用性。 展开更多
关键词 Pro/E模型 二次开发 PRO/TOOLKIT 模型抽取
下载PDF
一种用于模型验证的Web应用模型抽取方法 被引量:1
16
作者 方明科 缪淮扣 《应用科学学报》 CAS CSCD 北大核心 2009年第1期90-96,共7页
以模型验证为目标,提出一种Web应用FSM(finite state machines)模型的抽取方法。该方法将模型抽取划分为链接提取、模型构造和结果显示。通过建立标签库和对标签的定位,并结合正则表达式的方法,对Web应用进行逆向分析,从源代码开始进行... 以模型验证为目标,提出一种Web应用FSM(finite state machines)模型的抽取方法。该方法将模型抽取划分为链接提取、模型构造和结果显示。通过建立标签库和对标签的定位,并结合正则表达式的方法,对Web应用进行逆向分析,从源代码开始进行链接及相关信息的提取、规整和存储。对Web应用中的页面、链接等建模元素进行分析,应用映射与聚合等抽象技术对获得的信息进行重构,得到适用于验证的Web应用的FSM模型。 展开更多
关键词 链接提取 WEB应用模型 模型抽取 有限状态机
下载PDF
藏文单音节单纯词抽取方法设计与实现
17
作者 才让东知 祁坤钰 贡保杰布 《西北民族大学学报(自然科学版)》 2023年第3期16-24,共9页
针对藏文词汇资源匮乏和词汇分级模糊等问题,采用词典语料和词性标注语料相结合的方法,设计了藏文单音节单纯词抽取模型,规划了详细的技术方案,构建了比较完整的词典语料库,获得了藏文单音节单纯词的分类词表,依据相对通用度得到了分级... 针对藏文词汇资源匮乏和词汇分级模糊等问题,采用词典语料和词性标注语料相结合的方法,设计了藏文单音节单纯词抽取模型,规划了详细的技术方案,构建了比较完整的词典语料库,获得了藏文单音节单纯词的分类词表,依据相对通用度得到了分级词表,其中名词、动词、形容词、副词和数词等单音节单纯词总数1414条,词性之间存在大量的兼类现象,对汉藏语言资源库建设具有重要意义. 展开更多
关键词 藏文单纯词 抽取模型 语料库
下载PDF
基于迁移学习的化学键能数据自动抽取
18
作者 庞娜 袁钺 薛秋红 《现代情报》 2023年第1期19-28,共10页
[目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,... [目的/意义]在计算化学中,化学键能是重要的化学领域科学数据,目前化学键能数据抽取工作主要是由领域专家手动抽取,效率低下,大多数化学键能科学数据被湮没于海量文献中,无益于深入的、创新的科学数据分析。[方法/过程]为了解决该问题,本研究以ChemBE化学键能语料为实验对象,设计在较少专家支持的情况下,使用迁移学习的方法在化学论文中自动抽取与化学键能相关的科学数据。本文提出了一种端到端的BERT-CRF模型,通过构建领域高频子词的方法来解决大量未登录词的问题,并在后续深度学习模型的训练中,将构建好的领域高频子词作为领域特征输入到深度学习模型中,实现了对论文中的化学键能科学数据自动、高效地抽取。[结果/结论]实验表明,端到端的BERT-CRF模型与需要专家构建规则的基线模型相比,取得了理想的实验结果,F1值达到了88.56%。本文通过构建领域高频子词来解决大量未登录词的问题,降低了对领域专家的要求,可以较为容易地、低成本地迁移到其他领域。本文的研究结果是情报分析技术在化学领域的实践,为化学键能的智能知识检索提供了重要支撑。 展开更多
关键词 迁移学习 化学键能 深度学习 自动抽取 智能知识检索 领域高频子词 联合抽取模型 科学数据 文本挖掘
下载PDF
对比学习与图神经网络技术支持下信息抽取技术应用研究
19
作者 马翊铭 《软件》 2023年第9期139-141,共3页
信息抽取技术是大数据时代精准获得信息的关键技术。在网络时代背景下,信息抽取的实时性、准确性和实名性极为重要,因此,在信息抽取时,实现对多元信息的筛选分析非常关键。通过文献研究与实践分析可知,对比学习和图神经网络技术的应用,... 信息抽取技术是大数据时代精准获得信息的关键技术。在网络时代背景下,信息抽取的实时性、准确性和实名性极为重要,因此,在信息抽取时,实现对多元信息的筛选分析非常关键。通过文献研究与实践分析可知,对比学习和图神经网络技术的应用,有利于在信息抽取环节准确识别单词多义和单词缩写的信息,在实践中需分别构建模型,以便进一步实现信息抽取功能。 展开更多
关键词 对比学习 图神经网络 关系抽取模型
下载PDF
基于XML的Web应用模型抽取
20
作者 程广金 缪淮扣 +2 位作者 方明科 梅佳 髙洪皓 《计算机科学》 CSCD 北大核心 2011年第9期130-134,149,共6页
以模型检验为目标,从时间的约束角度出发,提出一种基于XML文档的Web应用的模型抽取方法。模型抽取由时间及相关链接的提取、模型构造和结果显示3部分组成。首先,通过对Web应用进行逆向分析,从带时间约束的XML源代码对链接及时间约束等... 以模型检验为目标,从时间的约束角度出发,提出一种基于XML文档的Web应用的模型抽取方法。模型抽取由时间及相关链接的提取、模型构造和结果显示3部分组成。首先,通过对Web应用进行逆向分析,从带时间约束的XML源代码对链接及时间约束等相关信息进行提取、规整和存储。其次,对Web应用中的链接、时间约束等建模元素进行分析,应用映射与聚合等抽象技术对获得的信息进行重构,得到适合于形式化验证的时间自动机(TA,Timed Automata)模型,并对时间约束下的并发进行模型组合。最后,以电子邮箱系统为实例阐述如何实现模型抽取。 展开更多
关键词 XML文档 时间约束 模型抽取 时间自动机
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部