期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
定题Web信息采集中的元数据处理
1
作者 宗校军 沈轶 廖晓昕 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第10期37-40,共4页
论述了元数据在定题Web信息采集中的重要作用,分析了常见的元数据类型,确定了Href,AnchorText及Surrounding Text三种元数据类型最适合作为定题信息采集依据的元数据类型.利用关联规则挖掘,将支持度和置信度相结合作为相关度的判定标准... 论述了元数据在定题Web信息采集中的重要作用,分析了常见的元数据类型,确定了Href,AnchorText及Surrounding Text三种元数据类型最适合作为定题信息采集依据的元数据类型.利用关联规则挖掘,将支持度和置信度相结合作为相关度的判定标准,并采用禁用词过滤和相关策略过滤技术,给出了元数据的抽取与主题扩展迭代方法.实验证明所提出的元数据处理策略能使主题相关词和实际相关词较好符合,改善误包含和误排除的情况,为定题Web信息采集提供良好前提. 展开更多
关键词 定题信息采集 元数据 抽取 扩展
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部