期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
一种基于视觉分块的Web信息抽取方法研究 被引量:4
1
作者 耿焕同 宋庆席 何宏强 《情报理论与实践》 CSSCI 北大核心 2009年第3期106-109,共4页
随着浏览器/服务器体系结构和动态网页技术的广泛应用,对网页进行快速、准确地信息抽取的技术研究已成为一个热点。结合动态网页的生成特点和针对已有抽取方法的不足,提出了一种基于视觉分块的Web信息抽取方法。
关键词 网络 信息抽取 视觉分块
下载PDF
基于结构化文档的钓鱼网站检测算法 被引量:3
2
作者 刘博文 王雨琪 林果园 《计算机工程与设计》 北大核心 2019年第10期2791-2798,共8页
为利用网站设计的视觉原则并降低钓鱼者修改网页代码组织方式对钓鱼检测的影响,提出基于网页主视觉区域的结构化文档DMVA (document based on main visual area)检测钓鱼网站。提出子间归并算法生成网页的视觉分块;基于用户的视觉行为,... 为利用网站设计的视觉原则并降低钓鱼者修改网页代码组织方式对钓鱼检测的影响,提出基于网页主视觉区域的结构化文档DMVA (document based on main visual area)检测钓鱼网站。提出子间归并算法生成网页的视觉分块;基于用户的视觉行为,结合层DOM树的分层结构,提出主视觉区域的思想,获取网页的分层主视觉区域中文本信息,构造DMVA;提出相关网站集,计算待测网站和相关网站集中网页间的DMVA的相似性,检测钓鱼网站。实验结果表明,基于DMVA检测钓鱼网站算法钓鱼检测方法具有较好的准确度。 展开更多
关键词 钓鱼检测 结构化文档 视觉分块 视觉行为 分层结构
下载PDF
一种新颖的CRE用户评论信息抽取技术 被引量:2
3
作者 李慧 张舒 +2 位作者 顾天竺 陈晓红 吴颜 《计算机应用》 CSCD 北大核心 2006年第10期2509-2512,共4页
准确挖掘商务网站中的用户评论对于商家进行有效的推荐具有重要意义。提出了一种新颖的用户评论抽取(CRE)算法进行评论信息的抽取。该算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。实验结果证明了该算法具... 准确挖掘商务网站中的用户评论对于商家进行有效的推荐具有重要意义。提出了一种新颖的用户评论抽取(CRE)算法进行评论信息的抽取。该算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。实验结果证明了该算法具有较高的查全率与查准率。 展开更多
关键词 用户评论抽取 信息抽取 基于视觉的页面分块
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部