检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到4篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于DOM的网页主题信息自动提取被引量：81: 1; 作者王琦唐世渭 +1 位作者杨冬青王腾蛟《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1786-1792,共7页; Web页面所表达的主要信息通常隐藏在大量无关的结构和文字中 ,使用户不能迅速获取主题信息 ,限制了Web的可用性 ,信息提取有助于解决这一问题基于DOM规范 ,针对HTML的半结构化特征和缺乏语义描述的不足 ,提出含有语义信息的STU DOM树模... 展开更多; 关键词 DOM 信息提取分块 STU STU树 stu-dom树相关度; 下载PDF 职称材料

一种基于信息熵的Web页面主题信息抽取方法被引量：6: 2; 作者贺智平徐学洲李爱玲《计算机工程与应用》 CSCD 北大核心 2007年第4期164-166,共3页; 提出了一种剪枝信息熵增较大结点的信息抽取方法。通过对HTML文档解析来构造DOM树,根据配置过滤掉不需处理的相关内容并建立语义模型树,最后对熵增超过阈值的结点进行剪枝并输出抽取的主题信息页面,初步实验结果验证了用这种方法进行We... 展开更多; 关键词 WEB 抽取 stu-dom树信息熵; 下载PDF 职称材料

基于标题与文本距离的网页去噪算法的研究: 3; 作者苏秀芝《中小企业管理与科技》 2014年第24期229-230,共2页; 使用STU-DOM这种网页提取技术,在实际操作过程中,在对不含超级链接的网页噪音进行判断时,准确性较低,同时,这种技术也不能有效处理DIV、TABLE标签中的正文信息。这是一种效果比较差的网页去噪技术。本文针对STU-DOM树在提取网页过程中... 展开更多; 关键词网页去噪 stu-dom 词共现; 下载PDF 职称材料

面向Web的新闻网页正文信息抽取策略研究: 4; 作者陈蕾蕾张如静《电脑知识与技术》 2008年第S2期1-2,共2页; 本文介绍了一种结合STU-DOM树和文本字数统计的新闻网页正文信息抽取方法,它赋予节点语义属性后,过滤主题无关节点,最终利用相关标记包含的中文字符数从中选择包含正文信息的节点。这种策略能够准确地提取正文内容外,还无损地保留了正... 展开更多; 关键词统计 STU树信息抽取; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部