期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于语义分析的主题信息采集系统的设计与实现 被引量:14
1
作者 赵佳鹤 王秀坤 刘亚欣 《计算机应用》 CSCD 北大核心 2007年第2期406-408,共3页
设计并实现了一个基于语义分析的主题信息采集系统(SAFWC),提出一种链接价值预测算法(SPageRank)。该算法从语义的角度出发,结合“知网”,通过对扩展元数据进行主题相关性判定来选择、预测与主题相关的URL。实验结果表明,该系统具有较... 设计并实现了一个基于语义分析的主题信息采集系统(SAFWC),提出一种链接价值预测算法(SPageRank)。该算法从语义的角度出发,结合“知网”,通过对扩展元数据进行主题相关性判定来选择、预测与主题相关的URL。实验结果表明,该系统具有较高的采集效率及精度。 展开更多
关键词 主题信息采集 知网 扩展元数据 搜索策略
下载PDF
自动抓取元数据标签中DC元数据的模块设计 被引量:1
2
作者 伯琼 赵小燕 张丽红 《重庆教育学院学报》 2010年第3期9-13,24,共6页
由于DC元数据描述网络资源的优越性,基于DC元数据的搜索引擎系统能够克服传统搜索引擎无法理解网页描述语义、检索效率低的缺点。设计该系统最首要的模块就是自动搜集模块,如何自动搜集含DC元数据的网页,如何自动提取其中的DC元数据信息... 由于DC元数据描述网络资源的优越性,基于DC元数据的搜索引擎系统能够克服传统搜索引擎无法理解网页描述语义、检索效率低的缺点。设计该系统最首要的模块就是自动搜集模块,如何自动搜集含DC元数据的网页,如何自动提取其中的DC元数据信息,并加以分析和处理,文章详细介绍了该模块的设计思路和具体的实现方法,并给出部分设计源代码。 展开更多
关键词 自动抓取 元数据标签 DC元数据
下载PDF
FastDu:Efficient Directory Summaries Harvest by Tracking File System Changes 被引量:2
3
作者 刘立坤 吴诺 +2 位作者 许春聪 武永卫 杨广文 《Tsinghua Science and Technology》 SCIE EI CAS 2011年第4期337-343,共7页
FastDu is a file system service that tracks file system changes by intercepting file system calls to maintain directory summaries, which play important roles in both storage administration and improvement of user expe... FastDu is a file system service that tracks file system changes by intercepting file system calls to maintain directory summaries, which play important roles in both storage administration and improvement of user experiences for some applications. In most circumstances, directory summaries are independently harvested by applications via traversing the file system hierarchy and calling stat 0 on every file in each directory. For large file systems, this brute-force traverse-based approach can take many hours to complete, even if only a small percentage of the files have changed. This paper describes FastDu, which uses a pre-built database to store harvested directory summaries, and tracks the file system changes by intercept- ing file system calls, so that new harvesting is restricted to the small subset of directories that contain modified files. Tests using FastDu show that this approach reduces the time needed to get a directory summary by one or two orders of magnitude with almost negligible penalty to application-aware file system performance. 展开更多
关键词 file system metadata metadata crawl file system changes file system intercepts
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部