期刊文献+
共找到12篇文章
< 1 >
每页显示 20 50 100
一种改进的Web应用结构抽取方法
1
作者 周俊 吴军华 刘继红 《现代计算机》 2011年第8期53-57,共5页
以采用HTML为文件格式,JavaScript作为客户端脚本,JSP作为服务器端执行代码的Web应用系统为研究对象,在现有Web应用结构抽取方法所存在的缺陷分析基础下,通过静态分析Web应用系统的源代码,获得整个Web应用的目录结构和文档类型,再进一... 以采用HTML为文件格式,JavaScript作为客户端脚本,JSP作为服务器端执行代码的Web应用系统为研究对象,在现有Web应用结构抽取方法所存在的缺陷分析基础下,通过静态分析Web应用系统的源代码,获得整个Web应用的目录结构和文档类型,再进一步抽取页面内主要结构元素,将所得到的信息以XML语言形式进行存储。通过构建和遍历XML语法树,抽取主要组件及组件间的关联信息,最终形成Web应用的系统结构图,从而提高Web应用系统维护和演化工作的效率,有效帮助维护人员对整个Web应用系统的理解。 展开更多
关键词 Web应用结构抽取 静态分析 Web应用逆向工程
下载PDF
基于改进的网络蜘蛛算法抽取Web站点结构的方法 被引量:5
2
作者 刘继红 吴军华 任明鑫 《江南大学学报(自然科学版)》 CAS 2009年第5期555-559,共5页
针对传统的Web站点结构恢复方法的局限性,提出了一种基于改进的网络蜘蛛算法的Web结构抽取方法,并实现了相应的工具WebAnalyzer。该方法通过深度优先搜索策略递归遍历Web站点,同时对网页的语法、标签进行分析,提取词法信息,在此基础上形... 针对传统的Web站点结构恢复方法的局限性,提出了一种基于改进的网络蜘蛛算法的Web结构抽取方法,并实现了相应的工具WebAnalyzer。该方法通过深度优先搜索策略递归遍历Web站点,同时对网页的语法、标签进行分析,提取词法信息,在此基础上形成Web结构视图和词法表。实验表明,该方法能够快速准确地恢复Web站点结构图。 展开更多
关键词 WEB应用 逆向工程 静态分析 结构抽取
下载PDF
基于标签路径的Web结构化数据自动抽取 被引量:3
3
作者 李贵 陈成 +3 位作者 李征宇 韩子扬 孙平 孙焕良 《计算机科学》 CSCD 北大核心 2013年第06A期141-144,165,共5页
提出了一种基于标签路径的Web结构化数据自动抽取方法。该方法通过对网页DOM树的解析获取完整标签路径集合,并依据路径相似度测量方法来聚类标签路径,实现目标数据区域的定位,然后通过标签节点坐标位置的特性来分离各个数据项,过滤冗余... 提出了一种基于标签路径的Web结构化数据自动抽取方法。该方法通过对网页DOM树的解析获取完整标签路径集合,并依据路径相似度测量方法来聚类标签路径,实现目标数据区域的定位,然后通过标签节点坐标位置的特性来分离各个数据项,过滤冗余数据,最终完成数据抽取。实验结果表明,与MDR方法相比,该方法在处理拥有结构化数据的网页时,有更高的查全率和查准率。 展开更多
关键词 标签路径 结构化数据抽取 聚类
下载PDF
一种面向医学文本数据的结构化信息抽取方法 被引量:16
4
作者 杨兵 聂铁铮 +2 位作者 申德荣 寇月 于戈 《小型微型计算机系统》 CSCD 北大核心 2019年第7期1479-1485,共7页
医学文本作为医疗领域重要的信息载体,为临床诊断和病理学研究提供了重要的数据支持,然而使用自然语言编写的文本数据往往是非结构化的,不便于机器理解和自动化处理.对于中文的医学文本数据而言,由于专业性强,需要丰富的领域知识,并且... 医学文本作为医疗领域重要的信息载体,为临床诊断和病理学研究提供了重要的数据支持,然而使用自然语言编写的文本数据往往是非结构化的,不便于机器理解和自动化处理.对于中文的医学文本数据而言,由于专业性强,需要丰富的领域知识,并且语法上多采用短句形式,这给结构化信息的抽取带来了巨大的挑战.为此,本文设计了一种针对医学领域的文本数据进行结构化信息抽取的方法,该方法首先通过文本聚类和关键词提取来获得医学描述语言中常用的表达术语,然后使用生成的医学术语库辅助中文分词处理,以提高中文医学文本的分词质量.然后,分析词与词之间的语义依存关系并随之构建依存句法树.最后,从该句法树中识别和抽取医学文本描述中的关键指标及其对应的指标值,最终得到结构化的键值对数据.本文采用真实的医学影像报告文本作为实验数据,实验结果表明该方法有效提高了中文医学文本的分词质量,准确率最高可达98.24%,并在结构化的信息抽取中效果显著,具有最高83.76%的准确率和88.09%的召回率.本文提出的方法能覆盖多种依存语法,且有很好的适用性. 展开更多
关键词 结构化信息抽取 文本聚类 关键词提取 语义依存
下载PDF
地质领域开放式实体关系联合抽取 被引量:6
5
作者 王智广 文红英 +1 位作者 鲁强 申昊锴 《计算机工程与设计》 北大核心 2021年第4期996-1005,共10页
为解决地质领域实体关系类型复杂且缺乏大量标注语料的问题,建立基于句法结构的开放式实体关系联合抽取模型CSSEM(Chinese syntactic structure extraction model)。给出一种基于模式的地质领域实体识别方法,解决地质领域缺乏实体标注... 为解决地质领域实体关系类型复杂且缺乏大量标注语料的问题,建立基于句法结构的开放式实体关系联合抽取模型CSSEM(Chinese syntactic structure extraction model)。给出一种基于模式的地质领域实体识别方法,解决地质领域缺乏实体标注语料的问题;基于少量标注语料自动学习关系抽取模式,使用基于句法结构的抽取模式从非结构化文本中开放式地抽取三元组。基于AUC(area under curve)评价标准,CSSEM与其它方法在地质领域和通用领域的数据集上进行对比分析。分析结果表明,该模型在上述两个领域取得了更好的准确率和召回率。 展开更多
关键词 地质领域 句法结构 依存句法分析 实体关系抽取 模式 中文句法结构抽取模型
下载PDF
基于网格IC图象的多模板快速匹配算法 被引量:2
6
作者 韦燕凤 彭思龙 《中国图象图形学报(A辑)》 CSCD 北大核心 2003年第2期193-197,共5页
为了加快 IC图象中多个相似单元模板的匹配与定位 ,提出了一种基于网格 IC图象的多模板快速匹配算法 .该算法首先抽取网格图象和模板的二值拓扑结构 ,以构成图象和模板的粗分辨率表示 ;然后 ,在拓扑结构表示上通过综合来构造多模板的二... 为了加快 IC图象中多个相似单元模板的匹配与定位 ,提出了一种基于网格 IC图象的多模板快速匹配算法 .该算法首先抽取网格图象和模板的二值拓扑结构 ,以构成图象和模板的粗分辨率表示 ;然后 ,在拓扑结构表示上通过综合来构造多模板的二叉树模型 ;接着 ,在二值拓扑结构表示上运用树模型进行搜索 ,在搜索过程中应用二叉决策树识别多个模板 ;最后 ,将粗匹配得到的目标 ,在原图象对应位置的小邻域内进行二次匹配 ,以确定模板和对应实例的位置 .应用此算法对 IC图象库进行测试 ,结果表明 ,所提出的多模板二叉决策树搜索算法与逐个模板匹配的方法相比 。 展开更多
关键词 计算机图象处理 多模板匹配 拓扑结构抽取 二叉决策树 网格IC图象
下载PDF
基于深度学习的科技文献摘要结构要素自动抽取方法研究 被引量:10
7
作者 赵丹宁 牟冬梅 白森 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第7期70-80,共11页
【目的】构建基于深度学习的科技文献非结构式摘要结构要素自动抽取方法。【方法】以结构式摘要为训练样本,采用LSTM、Attention机制等深度学习方法训练模型,自动抽取非结构式摘要中的"目的""方法""结果"... 【目的】构建基于深度学习的科技文献非结构式摘要结构要素自动抽取方法。【方法】以结构式摘要为训练样本,采用LSTM、Attention机制等深度学习方法训练模型,自动抽取非结构式摘要中的"目的""方法""结果"三种结构要素,并对摘要进行结构化。【结果】该方法对非结构式摘要中的"目的""方法""结果"三种结构要素抽取的F值分别为0.951、0.916、0.960。【局限】深度学习可解释性相对较弱。【结论】该方法在非结构式摘要的结构要素自动抽取和摘要结构化方面具有良好的准确性。 展开更多
关键词 深度学习 Attention-LSTM 结构要素抽取
原文传递
高性能水下地震数据采集系统设计与实现 被引量:14
8
作者 王超 宋克柱 唐进 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2007年第1期168-172,共5页
针对高分辨海上石油勘探中的水下地震信号的特点和采集要求,采用Σ-Δ结构ADC和数字抽取滤波器设计了高性能、高可靠性的水下拖缆数据采集系统。FPGA逻辑实现了对分布式数据采集的实时控制和流水线结构的远距离数据传输。
关键词 计算机应用 ∑-△结构ADC数字抽取滤波 现场可编程门阵列 流水线 水下地震 数据采集
下载PDF
改进的降低信号峰均功率比算法研究 被引量:1
9
作者 张春琴 《计算机仿真》 CSCD 北大核心 2011年第6期157-160,共4页
研究降低信号峰均功率比问题。针对信号峰均功率比(PAPR)过高是正交频分复用(OFDM)技术的主要缺点,较大的峰值功率会导致功放处于非线性区造成信号失真,而传统部分选择映射(SLM)算法虽然能够有效降低OFDM信号的峰均功率比,但是由于需要... 研究降低信号峰均功率比问题。针对信号峰均功率比(PAPR)过高是正交频分复用(OFDM)技术的主要缺点,较大的峰值功率会导致功放处于非线性区造成信号失真,而传统部分选择映射(SLM)算法虽然能够有效降低OFDM信号的峰均功率比,但是由于需要采用多路IFFT变换,会导致运算量巨大的问题。为解决上述问题,提出了一种新的基于峰值出现位置进行相位旋转的SLM算法,对与时域峰值相关的中间信号进行相位旋转,降低了运算量。经仿真验证,该算法不仅能够有效降低SLM算法的运算复杂度,而且随子载波数增加性能逐渐优于SLM算法,从而降低了信号的峰均功率比。 展开更多
关键词 正交频分复用 峰均功率比 选择式映射 频域抽取结构
下载PDF
垂直搜索引擎浅析 被引量:1
10
作者 霍永 罗钊 《广西警官高等专科学校学报》 2009年第4期38-41,共4页
垂直搜索引擎是面向某一特定领域的专业搜索引擎。本文对垂直搜索引擎使用的关键技术进行了阐述,从技术和服务两个角度对垂直搜索引擎和综合搜索引擎进行了比较分析,讨论了现阶段垂直搜索引擎存在的问题,并对垂直搜索引擎将来的发展提... 垂直搜索引擎是面向某一特定领域的专业搜索引擎。本文对垂直搜索引擎使用的关键技术进行了阐述,从技术和服务两个角度对垂直搜索引擎和综合搜索引擎进行了比较分析,讨论了现阶段垂直搜索引擎存在的问题,并对垂直搜索引擎将来的发展提出建议。 展开更多
关键词 垂直搜索 中文分词 结构化信息抽取 网络蜘蛛
下载PDF
基于中频数字化仪的板载信号处理器的设计和实现
11
作者 史浩 刘金川 +1 位作者 辛丽霞 邵永丰 《计算机测量与控制》 北大核心 2014年第4期1215-1218,共4页
为了满足装备测试小体积下复杂信号的多域分析功能,设计了一种基于中频数字化仪的板载信号处理器(OSP);通过板载信号处理器的硬件设计、属性设定和应用配置,实现了数字下变频、抽取及滤波等数字信号处理功能,把中频数字化仪A/D采集的高... 为了满足装备测试小体积下复杂信号的多域分析功能,设计了一种基于中频数字化仪的板载信号处理器(OSP);通过板载信号处理器的硬件设计、属性设定和应用配置,实现了数字下变频、抽取及滤波等数字信号处理功能,把中频数字化仪A/D采集的高速数据流下变频至低速的数据流,极大缓解后端DSP等处理器对高速信号处理的压力、可满足数字化仪的数字信号的预处理要求;该OSP已成功应用到数字化仪模块中,可实现分辨率带宽1Hz^3MHz,满足时域、频域和调制域等不同处理要求。 展开更多
关键词 数字化仪 板载信号处理 级联滤波 正交抽取结构 软件无线电
下载PDF
新型大规格交流接触器的研制开发
12
作者 陈晓军 《机床电器》 2012年第1期4-6,共3页
本文重点介绍了一种具有新型节电技术的大规格交流接触器的特点、创新点及材料运用等情况。特别是对产品的技术特点和创新点进行了图文并茂的详细说明,如脉宽调制PWM、独特的抽取式结构及引线固定方式等。该大规格交流接触器节电率高、... 本文重点介绍了一种具有新型节电技术的大规格交流接触器的特点、创新点及材料运用等情况。特别是对产品的技术特点和创新点进行了图文并茂的详细说明,如脉宽调制PWM、独特的抽取式结构及引线固定方式等。该大规格交流接触器节电率高、抗电压波动能力强、控制电压AC/DC通用、运行稳定可靠、维护方便,符合国际及国内的交流接触器最新发展趋势。 展开更多
关键词 新型节电技术 脉宽调制PWM 抽取结构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部