期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
三段式逐步求精的中文Deep Web数据源自动分类
1
作者 胡萍 《电脑知识与技术(过刊)》 2009年第5X期3599-3601,共3页
针对单纯的Pre-query和单纯的Post-query分类方法对中文Deep Web数据源自动分类的不足,本文提出了三段式逐步求精的中文Deep Web数据源自动分类方法,并且基于该方法设计了相应的分类系统。通过实验表明:对于实验数据源,这种自动分类方... 针对单纯的Pre-query和单纯的Post-query分类方法对中文Deep Web数据源自动分类的不足,本文提出了三段式逐步求精的中文Deep Web数据源自动分类方法,并且基于该方法设计了相应的分类系统。通过实验表明:对于实验数据源,这种自动分类方法比单纯的Pre-query分类方法、单纯的Post-query分类方法以及无影响度差别的文献[2]的分类方法的查全率、查准率和F1值都要高。 展开更多
关键词 DEEPWEB 数据源自动分类 中文 三段式
下载PDF
基于主题和表单属性的深层网络数据源分类方法 被引量:2
2
作者 祝官文 王念滨 王红滨 《电子学报》 EI CAS CSCD 北大核心 2013年第2期260-266,共7页
当前深层网络中蕴含着高质量的海量信息并且其数量不断地增长,由于深层网络具有分布、异构、自治等特点,用户高效、快捷地获取自己感兴趣的信息面临巨大挑战.将深层网络数据源按领域分类是解决这一挑战的基础.本文以对航空订票、图书、... 当前深层网络中蕴含着高质量的海量信息并且其数量不断地增长,由于深层网络具有分布、异构、自治等特点,用户高效、快捷地获取自己感兴趣的信息面临巨大挑战.将深层网络数据源按领域分类是解决这一挑战的基础.本文以对航空订票、图书、汽车和房地产领域的200多个数据源的统计和分析为基础,充分利用主题和表单属性信息,提出了一种新的深层网络数据源分类方法以及改进的查询接口相似性度量方法,实现深层网络数据源的自动分类.本文还提出了一种查询接口标记策略,以降低随机选择初始中心点所产生的影响.实验结果表明该方法具有较高的分类精度. 展开更多
关键词 表单主题和属性 查询接口标记 深层网络 数据源自动分类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部