期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于SPSS统计分析的文本特征值提取算法 被引量:2
1
作者 付敏 戴祖旭 《计算机与数字工程》 2014年第2期220-222,共3页
在文本特征值的信息隐藏过程中,特征值是一个句子固有的属性,具有随机性。通过分析特征值之间的相关关系,找出其分布变化规律,才能控制其变化,以实现更好的信息隐藏。针对文本信息,首先在VC平台下设计出自动的特征值提取算法,然后利用S... 在文本特征值的信息隐藏过程中,特征值是一个句子固有的属性,具有随机性。通过分析特征值之间的相关关系,找出其分布变化规律,才能控制其变化,以实现更好的信息隐藏。针对文本信息,首先在VC平台下设计出自动的特征值提取算法,然后利用SPSS统计软件统计分析了文本的特征值。实验结果表明该算法的统计分析给出了有效的特征值数据。 展开更多
关键词 文本特征值 信息隐藏 SPSS
下载PDF
基于文本特征值的正文抽取方法 被引量:2
2
作者 孟川 武小年 《桂林电子科技大学学报》 2017年第2期106-110,共5页
针对现有Web正文抽取方法适用性差、准确率低的问题,提出了一种基于文本特征值的正文抽取方法。该方法通过对Web页面的代码进行预处理,再解析转换成DOM树;通过遍历DOM树,以节点的文本长度和标点符号权重计算DOM树各节点的文本特征值,并... 针对现有Web正文抽取方法适用性差、准确率低的问题,提出了一种基于文本特征值的正文抽取方法。该方法通过对Web页面的代码进行预处理,再解析转换成DOM树;通过遍历DOM树,以节点的文本长度和标点符号权重计算DOM树各节点的文本特征值,并通过标准差消除噪声;通过高斯函数为节点的文本特征值进行平滑处理,缓解节点文本特征值的突变,降低短文本节点丢失的可能。实验测试结果表明,该方法不依赖标签,也无需训练数据,具有较好的通用性和较高的正文抽取准确率。 展开更多
关键词 正文抽取 主题网页 文本特征值 高斯平滑
下载PDF
基于页面敏感特征的金融类钓鱼网页检测方法 被引量:8
3
作者 胡向东 刘可 +3 位作者 张峰 林家富 付俊 郭智慧 《网络与信息安全学报》 2017年第2期31-38,共8页
提出一种基于页面敏感特征的金融类钓鱼网页检测方法,通过获取网页超文本标记语言特定标签中的文本信息,利用适合中文的多模式匹配算法(AC_SC,AC suitable for Chinese)匹配出敏感文本条数,计算出敏感文本特征值;定位截取网页的logo图像... 提出一种基于页面敏感特征的金融类钓鱼网页检测方法,通过获取网页超文本标记语言特定标签中的文本信息,利用适合中文的多模式匹配算法(AC_SC,AC suitable for Chinese)匹配出敏感文本条数,计算出敏感文本特征值;定位截取网页的logo图像,采用PCA-SIFT算法提取图像特征,并与预先建立的网页logo图像库进行匹配,计算出logo图像相似度;基于文本特征值和图像相似度实现对金融类钓鱼网页的判定。实验结果表明,该方法具有很强的针对性和时效性,并能取得不低于97%的召回率。 展开更多
关键词 金融网页 敏感特征 文本特征值 图像相似度 钓鱼检测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部