期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于Hadoop的海量MP3文件存储架构 被引量:28
1
作者 赵晓永 杨扬 +1 位作者 孙莉莉 陈宇 《计算机应用》 CSCD 北大核心 2012年第6期1724-1726,共3页
MP3作为数字音乐时代的事实标准,数量已相当巨大,用户的访问需求也与日俱增,有效存储和管理海量的MP3文件,为用户提供良好的体验,越来越引起人们的关注。Hadoop的出现,提供了一种新的思路。但由于Hadoop自身并不适合海量小文件处理,提... MP3作为数字音乐时代的事实标准,数量已相当巨大,用户的访问需求也与日俱增,有效存储和管理海量的MP3文件,为用户提供良好的体验,越来越引起人们的关注。Hadoop的出现,提供了一种新的思路。但由于Hadoop自身并不适合海量小文件处理,提出一种基于Hadoop的海量MP3文件存储架构,充分利用MP3文件自身包含的丰富描述信息,通过预处理模块的归类算法,将小文件归并到Sequence File中,同时引入高效的索引机制,很好地解决了小文件过多时NameNode内存瓶颈问题。实验证明,该架构能达到良好的效果。 展开更多
关键词 HADOOP MP3 小文件 富元数据 存储架构
下载PDF
RSS的应用研究 被引量:30
2
作者 张会娥 《图书馆杂志》 CSSCI 北大核心 2005年第2期53-58,共6页
RSS 是一个较新的技术。目前许多网站包括科技网站都采用 RSS 来发布最新消息。那么,RSS 究竟是什么?RSS feed 是怎样的?如何应用 RSS?RSS 在图书馆情报领域有何应用前景?本文针对这些问题进行了研究,试图为图书情报界了解、应用 RSS ... RSS 是一个较新的技术。目前许多网站包括科技网站都采用 RSS 来发布最新消息。那么,RSS 究竟是什么?RSS feed 是怎样的?如何应用 RSS?RSS 在图书馆情报领域有何应用前景?本文针对这些问题进行了研究,试图为图书情报界了解、应用 RSS 提供参考。 展开更多
关键词 RSS 网站 消息 发布 领域 图书情报 图书馆 参考 技术 应用
下载PDF
网络科技信息监测中富文档识别与信息提取技术研究 被引量:8
3
作者 张敏 刘建华 谢靖 《情报科学》 CSSCI 北大核心 2017年第1期128-132,共5页
【目的/意义】围绕富文档载体类型的鉴别、元数据的提取等开展相应的实际应用探索。【方法/过程】通过开源工具PDFBox以及Tika对不同类型的富文档元数据及正文内容进行提取,取得了良好的实际效果,为科研人员提供了大量的有学术价值的情... 【目的/意义】围绕富文档载体类型的鉴别、元数据的提取等开展相应的实际应用探索。【方法/过程】通过开源工具PDFBox以及Tika对不同类型的富文档元数据及正文内容进行提取,取得了良好的实际效果,为科研人员提供了大量的有学术价值的情报资源。【结果/结论】通过对富文档监测与识别的研究与探索,笔者拓展了文本知识内容的识别方法,为后续的深度知识分析提供了有效的支撑。 展开更多
关键词 富文档 元数据 类型识别
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部