期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于简单树匹配算法的Web页面结构相似性度量 被引量:15
1
作者 何昕 谢志鹏 《计算机研究与发展》 EI CSCD 北大核心 2007年第z3期1-6,共6页
网页结构相似性的度量是Web信息处理中的一项重要任务,在数据抽取和搜索引擎等研究领域有着潜在的重要研究价值.好的相似性度量方法可以提高数据抽取的准确率和速度,还可以提高搜索引擎的速度,提高返回数据的质量,减少大量冗余数据占据... 网页结构相似性的度量是Web信息处理中的一项重要任务,在数据抽取和搜索引擎等研究领域有着潜在的重要研究价值.好的相似性度量方法可以提高数据抽取的准确率和速度,还可以提高搜索引擎的速度,提高返回数据的质量,减少大量冗余数据占据的存储空间.实现该任务的已有算法往往存在着计算复杂度过高的问题,针对这一问题研究HTML文档标签特点,减少传统算法中使用的算子,进而采用简单树匹配算法来计算Web文档之间的结构相似度.简单树匹配不允许结点的替换和跨层匹配,从而大大提高了算法的运行效率.实验结果表明,所提出的方法不论在速度还是精度上都优于著名的Bag of XPaths方法. 展开更多
关键词 Web文件相似度 树匹配 结构相似
下载PDF
一种基于文件损坏度的勒索软件检测方法 被引量:2
2
作者 雷春 李娜 《信息安全研究》 2018年第4期387-392,共6页
在动态检测引擎中,当前检测勒索软件常用的方法主要为设置陷阱文件并检测其指纹变化或监控系统API操作.而这2种方法都不能准确地区分勒索软件和其他类型的恶意代码.为提高其检测准确性,提出文件损坏度这个概念.在动态分析基础上通过模... 在动态检测引擎中,当前检测勒索软件常用的方法主要为设置陷阱文件并检测其指纹变化或监控系统API操作.而这2种方法都不能准确地区分勒索软件和其他类型的恶意代码.为提高其检测准确性,提出文件损坏度这个概念.在动态分析基础上通过模糊哈希、相似度算法等对文件变化进行多维度检测,定量计算出当前文件损坏度,通过文件损坏度反映当前系统所受到的威胁程度,从而确定该样本是否为勒索软件. 展开更多
关键词 勒索软件 文件损坏 系统损坏 动态检测 文件相似度
下载PDF
基于知识图谱的商用飞机维修方案推荐系统集成建模 被引量:5
3
作者 邢雪琪 丁雨童 +2 位作者 夏唐斌 潘尔顺 奚立峰 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第3期512-521,共10页
针对我国商用飞机智能维修和数字化诊断的需求,面向非结构化故障隔离手册,提出新型BM长短期记忆网络(BM LSTM)算法.运用多数投票法融合条件随机场(CRF)、双向长短期记忆网络(BiLSTM)、BiLSTM CRF 3种实体识别算法,有效提高实体识别精度... 针对我国商用飞机智能维修和数字化诊断的需求,面向非结构化故障隔离手册,提出新型BM长短期记忆网络(BM LSTM)算法.运用多数投票法融合条件随机场(CRF)、双向长短期记忆网络(BiLSTM)、BiLSTM CRF 3种实体识别算法,有效提高实体识别精度.基于商用飞机维修故障诊断手册构建维修方案知识图谱,结合词频-逆向文件频率(TF-IDF)相似度算法与BM LSTM算法,设计商用飞机维修方案推荐系统,实现通过检索非结构化故障描述文本准确匹配到维修方案的功能.实验结果表明,利用商用飞机故障隔离手册构建知识图谱、基于所提创新方法开发的维修方案推荐系统,能够有效保证维修信息精确匹配,显著提高维修方案形成效率. 展开更多
关键词 商用飞机 故障隔离手册 BM长短期记忆网络(BM LSM) 知识图谱 词频-逆向文件频率(TF-IDF)相似
下载PDF
Near-duplicate document detection with improved similarity measurement 被引量:2
4
作者 袁鑫攀 龙军 +1 位作者 张祖平 桂卫华 《Journal of Central South University》 SCIE EI CAS 2012年第8期2231-2237,共7页
To quickly find documents with high similarity in existing documentation sets, fingerprint group merging retrieval algorithm is proposed to address both sides of the problem:a given similarity threshold could not be t... To quickly find documents with high similarity in existing documentation sets, fingerprint group merging retrieval algorithm is proposed to address both sides of the problem:a given similarity threshold could not be too low and fewer fingerprints could lead to low accuracy. It can be proved that the efficiency of similarity retrieval is improved by fingerprint group merging retrieval algorithm with lower similarity threshold. Experiments with the lower similarity threshold r=0.7 and high fingerprint bits k=400 demonstrate that the CPU time-consuming cost decreases from 1 921 s to 273 s. Theoretical analysis and experimental results verify the effectiveness of this method. 展开更多
关键词 similarity estimation near-duplicate document detection fingerprint group Hamming distance minwise hashing
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部