期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
通过Glibc堆信息提取检测house of spirit类型攻击
1
作者 翟继强 王家乾 +1 位作者 韩旭 孙海旭 《哈尔滨理工大学学报》 CAS 北大核心 2024年第1期96-106,共11页
目前有关堆的取证研究主要是针对Windows系统的堆和NT堆,然而怎样从转储文件中提取出Linux系统Glibc堆信息并没有得到充分的研究。为了重现Linux系统中Glibc堆的内部信息,采用内存对象vtype描述信息中字段偏移定位结合在内存中Glibc堆... 目前有关堆的取证研究主要是针对Windows系统的堆和NT堆,然而怎样从转储文件中提取出Linux系统Glibc堆信息并没有得到充分的研究。为了重现Linux系统中Glibc堆的内部信息,采用内存对象vtype描述信息中字段偏移定位结合在内存中Glibc堆实现的方法提取Glibc堆内部信息。并基于此方法研发了基于Rekall框架的3个堆信息提取插件。还研究了house of spirit类型的堆攻击,建立了攻击模型并提取其攻击特征。基于提取的攻击特征设计出针对house of spirit攻击的检测算法。在堆信息提取插件的基础上研发了攻击检测插件。实验结果表明本方法可以有效地提取Linux系统进程中堆在内存中的信息,并且基于这些信息结合攻击检测算法成功检测内存中的house of spirit类型攻击。 展开更多
关键词 Glibc堆 信息提取 堆攻击检测 Rekall框架
下载PDF
融合风貌特征的上海城市框架模型生产更新方法
2
作者 刘一宁 徐豆豆 昌尧霏 《北京测绘》 2024年第4期560-566,共7页
城市三维(3D)模型的快速构建和及时更新是实景3D中国建设的重点之一。本文针对上海历史风貌建筑与地标性异形建筑较多的特点进行深入分析,结合城市风貌特征和使用效能,提出了一种融合简易模型和去纹理精细模型的上海城市框架模型构建方... 城市三维(3D)模型的快速构建和及时更新是实景3D中国建设的重点之一。本文针对上海历史风貌建筑与地标性异形建筑较多的特点进行深入分析,结合城市风貌特征和使用效能,提出了一种融合简易模型和去纹理精细模型的上海城市框架模型构建方法,阐述了其概念、构建规则和生产方法,解决了传统简易模型难以表现城市特征而导致应用场景受限的问题。在此基础上提出了基于二维(2D)建筑底面和3D精细模型生产更新的城市框架模型动态更新方法,并通过试验对所提出方法进行了验证。目前该方法已应用于上海城市“一张图”数据生产更新中,服务于市国土空间信息平台、城市运行管理等场景,证明了方法的有效性。 展开更多
关键词 城市框架模型 城市风貌特征 增量信息自动提取 模型动态更新 实景三维上海
下载PDF
基于预训练语言模型的互联网开源信息抽取与情报分析应用研究——以“学术、讲座、论坛”等会议活动为例
3
作者 王宇琪 周庆山 《情报理论与实践》 北大核心 2024年第1期154-163,共10页
[目的/意义]互联网开源信息具有海量、多源异构等特点,如何从中及时发现有价值的信息,并对信息加以情报利用一直是情报研究和实践应用的重点领域之一。文章提出一套开源的学术会议领域信息抽取框架,解决信息抽取语义理解和关联融合的问... [目的/意义]互联网开源信息具有海量、多源异构等特点,如何从中及时发现有价值的信息,并对信息加以情报利用一直是情报研究和实践应用的重点领域之一。文章提出一套开源的学术会议领域信息抽取框架,解决信息抽取语义理解和关联融合的问题,并将其应用于情报研究中,为解决情报分析的智能应用提供工具和方法。[方法/过程]采集网络上新闻报道的内容,采用预训练语言模型方法挖掘学术会议事件信息,提出面向特定领域的信息抽取框架,实现会议名称及其举办时间、地点、出席人、发言人信息的抽取,并进行实际的情报利用研究案例分析。[结果/结论]相较于单一抽取实体的方法,抽取会议核心元素更具有情报关联性和准确性,可以更好地对开源热点事件发现和跟踪监测、目标人物轨迹动向分析等研究提供方法,为情报分析应用和情报研判奠定基础。 展开更多
关键词 互联网开源信息 学术会议事件信息 信息抽取框架 预训练语言模型 情报分析应用
下载PDF
基于IFC的建筑结构设计信息交互框架研究与实现 被引量:1
4
作者 张兆波 孟晓明 《建筑结构》 北大核心 2024年第5期149-154,85,共7页
为了解决基于BIM的建筑与结构设计工作模式中信息交互度低的问题,提出了基于IFC的建筑结构信息交互框架。该框架由4个算法模块、5个步骤组成。借助于IfcOpenShell工具包,用Python语言开发了前两个算法模块即IFC文件优化算法模块和结构... 为了解决基于BIM的建筑与结构设计工作模式中信息交互度低的问题,提出了基于IFC的建筑结构信息交互框架。该框架由4个算法模块、5个步骤组成。借助于IfcOpenShell工具包,用Python语言开发了前两个算法模块即IFC文件优化算法模块和结构信息模型提取算法模块。选取案例模型对所开发算法的有效性进行了验证。验证结果表明:优化算法模块可以有效地过滤IFC文件中的无用信息,查找并删除重复的实体,使IFC文件轻量化,且可间接提高提取算法模块的运行效率;提取算法模块可以准确地从IFC文件中提取结构信息模型,未出现IFC语法错误、构件丢失、构件重叠等情况。IFC文件优化算法模块和结构信息模型提取算法模块的成功开发为信息交互框架的完全实现奠定了基础。 展开更多
关键词 工业基础类 建筑设计 结构设计 信息交互 优化算法 提取算法
下载PDF
基于UIE框架的电网故障处置预案实体和事件识别方法 被引量:1
5
作者 皮俊波 齐世雄 +5 位作者 孙文多 楼贤嗣 沃建栋 张越 姜涛 单连飞 《中国电力》 CSCD 北大核心 2023年第12期138-146,共9页
电网故障处置预案区域差异化明显且实体嵌套复杂,仅凭实体类型识别难以准确地将其结构化。提出一种基于通用信息抽取(universal information extraction,UIE)框架的故障处置预案实体和事件识别方法。首先,提出基于句法分析的故障处置预... 电网故障处置预案区域差异化明显且实体嵌套复杂,仅凭实体类型识别难以准确地将其结构化。提出一种基于通用信息抽取(universal information extraction,UIE)框架的故障处置预案实体和事件识别方法。首先,提出基于句法分析的故障处置预案实体标记方法,生成故障处置预案标记实体;然后,接入ERNIE 3.0编码及双指针解码模块替代UIE框架中生成式模型,通过调节超参数训练故障处置预案实体与实体标签在高维空间的映射关系及实体嵌套关系;最后,基于句法结构组合嵌套复杂的预案实体得到预案事件。通过不同区域电网调控中心预案验证,与其他算法相比,所提方法对故障处置预案具有较高的实体和事件识别精度,能够准确识别预案中故障处置策略和恢复策略,为故障情况下区域电网弹性提升提供支撑。 展开更多
关键词 故障处置预案 通用信息抽取框架 实体识别 事件抽取
下载PDF
基于本体的Web信息抽取系统 被引量:14
6
作者 王志华 魏斌 +1 位作者 李占波 赵伟 《计算机工程与设计》 CSCD 北大核心 2012年第7期2634-2639,共6页
为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架。对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文... 为了解决已有信息抽取系统中方法不具有重用性及不能抽取语义信息的问题,提出了一个基于领域本体的面向主题的Web信息抽取框架。对Web中文页面,借助外部资料,利用本体解析信息,对文件采集及预处理中的源文档及信息采集、文档预处理、文档存储等技术进行了分析设计,提出了文本转换中的分词及词表查询和命名实体识别算法,并给出了一种知识抽取方案。实验结果表明,该方法可以得到性能较高的抽取结果。 展开更多
关键词 本体 信息抽取 WEB页面 关键技术 抽取框架
下载PDF
基于知识图谱的Web信息抽取系统 被引量:16
7
作者 王辉 郁波 +1 位作者 洪宇 肖仰华 《计算机工程》 CAS CSCD 北大核心 2017年第6期118-124,共7页
为实现多领域海量网页信息的有效抽取,以中文知识图谱CN-DBpedia为基础设计Web信息抽取系统。基于知识图谱对网页数据项进行自动标注,建立具有容错能力的包装器归纳框架,从包含错误的标注集中归纳学习出正确的包装器。实验结果表明,该... 为实现多领域海量网页信息的有效抽取,以中文知识图谱CN-DBpedia为基础设计Web信息抽取系统。基于知识图谱对网页数据项进行自动标注,建立具有容错能力的包装器归纳框架,从包含错误的标注集中归纳学习出正确的包装器。实验结果表明,该系统的准确率和召回率均高于传统人工标注方法,可显著降低网页信息抽取过程中的人力成本,灵活运用于大规模、多领域的网页信息抽取任务。 展开更多
关键词 知识图谱 多领域 WEB信息抽取 网页自动标注 容错 包装器归纳框架
下载PDF
基于事件框架的主题事件融合研究 被引量:6
8
作者 许荣华 吴刚 +1 位作者 李培峰 朱巧明 《计算机应用研究》 CSCD 北大核心 2009年第12期4542-4545,共4页
针对事件抽取获得的单个元事件无法完整描述主题事件的特点,提出了一种主题事件的融合方法,通过该方法将与同一主题相关的所有元事件整合在一起,以层次化的形式表示。首先定义了一种事件融合框架TEFF(topic event fusion framework)。... 针对事件抽取获得的单个元事件无法完整描述主题事件的特点,提出了一种主题事件的融合方法,通过该方法将与同一主题相关的所有元事件整合在一起,以层次化的形式表示。首先定义了一种事件融合框架TEFF(topic event fusion framework)。该框架根据各类元事件在主题事件中的作用,将主题事件以层次化的形式表示。同时给出元事件和主题的相关度计算方法,通过该算法来评价元事件和主题的相关度。在TEFF的指导下,通过相关度计算,实现主题事件的融合。在以2008年起的金融危机为主题的实验中,取得了F值为77.1%的实验结果,这表明该方法能有效地对主题事件进行融合。 展开更多
关键词 事件框架 主题事件融合 事件信息抽取
下载PDF
基于模板流程配置的Web信息抽取 被引量:5
9
作者 刘辉 陈静玉 徐学洲 《计算机工程》 CAS CSCD 北大核心 2008年第20期55-57,共3页
针对Web信息抽取中存在的包装器构造复杂及抽取精度等问题,提出并实现了一种基于模板流程配置的Web信息抽取框架。将用户请求、访问和获取Web页面的动作进行分解,抽取其中的动作模式,并映射到流程配置模板中的节点。通过流程解析器对用... 针对Web信息抽取中存在的包装器构造复杂及抽取精度等问题,提出并实现了一种基于模板流程配置的Web信息抽取框架。将用户请求、访问和获取Web页面的动作进行分解,抽取其中的动作模式,并映射到流程配置模板中的节点。通过流程解析器对用户创建的流程配置XML描述文档进行解析,抽取感兴趣的信息。试验结果表明,系统可快速、准确地实现抽取。 展开更多
关键词 WEB信息抽取 模板流程配置 包装器 框架
下载PDF
基于汉语框架的网络事件抽取及相关算法研究 被引量:4
10
作者 赵文娟 刘忠宝 《情报理论与实践》 CSSCI 北大核心 2016年第10期112-116,79,共6页
文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介... 文章研究的目的是从众多非结构化的网络文档中抽取出与某一主题事件相关的各种信息,对信息进行合并、提取,然后依据相应的规则填槽到主题事件框架槽中,供用户进一步的查询提供依据。研究方法是通过对基于汉语框架的网络事件抽取流程的介绍,对流程中使用的技术和方法进行了描述。最后通过"空难"框架下的"德国之翼坠机事件"为例对方法的有效性进行了验证。 展开更多
关键词 事件抽取 汉语框架 信息抽取 文本聚类
下载PDF
通用抽取引擎框架:一种新的Web信息抽取方法的研究 被引量:3
11
作者 宫继兵 唐杰 杨文军 《计算机科学》 CSCD 北大核心 2011年第1期198-202,共5页
大规模的网络视频信息既为用户信息分享带来了方便,同时也为国家监管部门带来了新的挑战。考虑到效率问题,在线视频监管则主要考虑视频描述信息。主要研究了网络视频描述信息的抽取问题,提出了一种新的Web信息抽取方法:通用抽取引擎框架... 大规模的网络视频信息既为用户信息分享带来了方便,同时也为国家监管部门带来了新的挑战。考虑到效率问题,在线视频监管则主要考虑视频描述信息。主要研究了网络视频描述信息的抽取问题,提出了一种新的Web信息抽取方法:通用抽取引擎框架,其主要包括对视频描述信息抽取问题的形式化描述和用户感知的视频网站逻辑模型。该方法在国家某部委的视频监管项目中已得到应用,并取得了很好的效果。实验结果表明,该方法的扩展性、通用性和抽取准确率大大优于其他方法。 展开更多
关键词 通用抽取引擎框架 网络视频监管 视频网站逻辑模型 WEB信息抽取 抽取模式产生算法
下载PDF
基于序列比对的动态Web信息抽取算法
12
作者 赵刚 郭东伟 李丹 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2010年第3期421-426,共6页
基于对深网(DeepWeb)网页公共框架的定义,提出一种在信息抽取算法中增加公共框架检测阶段,采用序列比对算法提取公共框架的方法.与原始网页数据相比,去除公共框架的数据域信息对模板抽取更有利.基于真实网站的数据密集型网页集合,测试... 基于对深网(DeepWeb)网页公共框架的定义,提出一种在信息抽取算法中增加公共框架检测阶段,采用序列比对算法提取公共框架的方法.与原始网页数据相比,去除公共框架的数据域信息对模板抽取更有利.基于真实网站的数据密集型网页集合,测试和对比了序列比对算法中参数不同取值以及公共框架检测阶段在数据量和抽取准确率等方面对信息抽取算法的影响.实验结果表明了算法的有效性. 展开更多
关键词 WEB信息抽取 序列比对 公共框架检测
下载PDF
采掘类企业环境会计信息披露框架研究
13
作者 汪中华 姜文强 《北方经贸》 2014年第3期95-97,共3页
环境会计信息披露是环境会计研究框架中最早进入实务操作领域的,众多学者就该问题进行了深入研究,但是由于基础性环境会计理论的支持不足,目前的信息披露理论研究仍需深入。有鉴于此,本文以采掘类企业为研究对象,有针对性的对采掘类企... 环境会计信息披露是环境会计研究框架中最早进入实务操作领域的,众多学者就该问题进行了深入研究,但是由于基础性环境会计理论的支持不足,目前的信息披露理论研究仍需深入。有鉴于此,本文以采掘类企业为研究对象,有针对性的对采掘类企业环境会计信息披露的目标、原则进行分析,在借鉴传统会计信息披露框架的基础上建立了采掘类企业环境会计信息披露框架,最后提出了相应的信息披露模式的意见建议。本文介绍的信息披露框架是针对采掘类企业建立的,解决采掘类企业环境会计信息披露问题将对整个行业的环境会计实施产生推动作用。 展开更多
关键词 环境会计 信息披露框架 采掘类企业
下载PDF
可扩展的网页关键信息抽取研究 被引量:3
14
作者 郭少华 郭岩 +3 位作者 李海燕 刘悦 张瑾 程学旗 《中文信息学报》 CSCD 北大核心 2015年第1期97-103,共7页
该文提出了一种可扩展的网页关键信息抽取框架。该框架很好地融合了模板无关的全自动信息抽取算法和基于模板的信息抽取算法,从本质上提高抽取精度和抽取效率。该框架中的一些关键环节可根据需求进行替换,因此该框架具有很好的可扩展性... 该文提出了一种可扩展的网页关键信息抽取框架。该框架很好地融合了模板无关的全自动信息抽取算法和基于模板的信息抽取算法,从本质上提高抽取精度和抽取效率。该框架中的一些关键环节可根据需求进行替换,因此该框架具有很好的可扩展性。同时,该文还提出了模板的正交过滤算法。将该算法引入基于模板的抽取算法中,能够从本质上提高生成的模板的准确性。实验结果验证了上述结论。 展开更多
关键词 关键信息 信息抽取 可扩展框架 正交过滤
下载PDF
室外场景中标识牌文字的检测与提取技术综述 被引量:1
15
作者 贾文静 曾超 +2 位作者 敖永霞 何祥健 吴强 《云南民族大学学报(自然科学版)》 CAS 2010年第3期157-161,共5页
室外场景中标识牌文字的检测与提取在机器视觉、辅助驾驶员系统、眼障人士辅助系统、游客帮助系统等中有着广泛的应用.近年来,针对不同应用,研究人员研制开发出许多室外场景中文字信息提取的系统与方法.对2002年以来发表在主要英文刊物... 室外场景中标识牌文字的检测与提取在机器视觉、辅助驾驶员系统、眼障人士辅助系统、游客帮助系统等中有着广泛的应用.近年来,针对不同应用,研究人员研制开发出许多室外场景中文字信息提取的系统与方法.对2002年以来发表在主要英文刊物和会议论文集中的方法进行综述.提出了一个分层次的系统框架结构,并按照这一结构对文献中出现的实现各主要模块的比较有代表性的方法进行了归纳和比较,旨在对该领域的研究技术水平提供一个综述,并提出尚待解决的技术问题. 展开更多
关键词 文字信息提取 室外场景 综述 层次框架结构
下载PDF
以本体为指导的Web网页信息抽取方法 被引量:2
16
作者 程文涛 师雪霖 《北京化工大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期134-139,共6页
针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则... 针对Web网页中事物描述信息的特点,提出了一种通过本体指导网页信息抽取的方法。首先建立抽取对象的本体模型,并为本体属性概念添加定位信息映射模型,通过映射模型定位和分离样本页中包含语义信息的数据块,结合路径分析算法生成抽取规则,之后利用抽取规则对同类网页中的事物描述信息进行抽取,最后以资源描述框架(RDF)数据格式储存信息。抽取性能测试实验表明,抽取结果具有较高的准确率,与无规则抽取方法相比,具有更高的抽取效率。 展开更多
关键词 信息抽取 本体 语义 资源描述框架 WEB
下载PDF
Web信息抽取研究
17
作者 钟祥睿 《电脑知识与技术》 2006年第5期96-97,共2页
在分析当前一些主流的wrapper技术的基础上,提出了一个基于移动Agent的Web信息抽取系统框架。在该框架中,利用移动Agent所具有的自治性、移动性、交互性和智能性,将数据抽取和转换任务交给移动Agent,让其移动到Web数据源上去完成信息抽... 在分析当前一些主流的wrapper技术的基础上,提出了一个基于移动Agent的Web信息抽取系统框架。在该框架中,利用移动Agent所具有的自治性、移动性、交互性和智能性,将数据抽取和转换任务交给移动Agent,让其移动到Web数据源上去完成信息抽取任务,并将抽取结果传回。这样不但可以减少数据传输量,节约网络带宽,降低响应时间;还可以减少对网络的依赖性,允许网络的间断连接。 展开更多
关键词 WEB信息抽取 wrapper移动agent 系统框架
下载PDF
法院判决书关键信息抽取系统设计与实现 被引量:6
18
作者 刘稳 王锦 +2 位作者 李锐 游景扬 陈建峡 《湖北工业大学学报》 2018年第1期63-67,共5页
从海量的法院判决书数据中快速抽取关键信息,构建结构化的数据,对法院信息化建设具有重要的现实意义。为实现这一目标,结合法院判决书文本的特点,设计了法院案件信息抽取模型,基于法院案件的命名实体识别、框架知识表示和事件信息抽取... 从海量的法院判决书数据中快速抽取关键信息,构建结构化的数据,对法院信息化建设具有重要的现实意义。为实现这一目标,结合法院判决书文本的特点,设计了法院案件信息抽取模型,基于法院案件的命名实体识别、框架知识表示和事件信息抽取等关键技术,研发了法院判决书信息抽取系统。实验结果表明,该系统不仅能够自动生成结构化的数据信息,而且结合主题图技术进行可视化展示,以供用户快速查询和修改,有助于案件判决相关人员提高犯罪信息分析的质量和效率。 展开更多
关键词 命名实体识别 框架知识表示 信息抽取
下载PDF
一种基于Java字节码的软件设计信息提取方法
19
作者 李留义 黄松 +1 位作者 惠战伟 邹珊 《南通大学学报(自然科学版)》 CAS 2016年第3期12-17,共6页
基于ASM解析字节码文件的算法,提出一种基于Java字节码的软件设计信息提取的方法.在此方法基础上,设计并实现了以Java字节码文件作为输入,MS Word格式的软件设计说明文档作为输出的原型系统.运行结果表明,该方法对大部分字节码文件的解... 基于ASM解析字节码文件的算法,提出一种基于Java字节码的软件设计信息提取的方法.在此方法基础上,设计并实现了以Java字节码文件作为输入,MS Word格式的软件设计说明文档作为输出的原型系统.运行结果表明,该方法对大部分字节码文件的解析和提取效果比较理想. 展开更多
关键词 JAVA字节码 软件设计 信息提取 字节码解析 ASM框架
下载PDF
融合词、句层级信息的抽取式摘要优化框架
20
作者 林心宜 严睿 赵东岩 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2018年第2期229-235,共7页
提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评... 提出一个混合的抽取式摘要优化框架,在优化单词层级信息的同时,将句子层级信息作为优化约束。在约束条件下,该优化框架迭代地进行摘要文本中单元的替换,得到不断逼近目标函数的最优解。与传统方法对比,该框架在DUC数据集上获得ROUGE评测的高分,证明了该框架的有效性。 展开更多
关键词 抽取式摘要生成 词层级信息 句层级信息 混合迭代优化框架
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部