期刊文献+

中文学术文献网页的特征 被引量:2

The Characteristics of Chinese Academic Papers on the Web
下载PDF
导出
摘要 互联网上免费的中文学术资源数量庞大,但实用的专门检索工具仍然或缺。文章以网络中文学术文献的识别与检索为目标,调查分析网络学术文献网页的特征,并以非学术文献网页作为参照,验证所发现特征的可靠性。研究结果显示,学术文献网页在关键词词频、链接数量和相关链接比例等特征方面与非学术文献网页具有明显差别,差异程度都大于75%,属于程度明显,能较好地用于区分学术文献网页与非学术文献网页,为今后系统开发学术文献网页的自动化识别工具提供了依据和理论支持。 Many high-valued free academic papers on the web are obscured by the large amount of other types of information because of the lack of a more pratical and specific tool for the retrieval of this type of documents.The study analyzes the characteristics of academic document pages and verifies the differences between the academic document pages and the non-academic pages.It found that the academic document pages could be distinguished from other web pages by their differences in keyword frequency,page total links and the proportion of related links.Those differences may be applied in the automatic identification of Chinese academic papers on the web.
出处 《图书馆论坛》 CSSCI 北大核心 2011年第6期178-185,共8页 Library Tribune
基金 国家社会科学基金项目(2010-2012年)"网络中文学术文献的自动识别与检索研究--基于学术文献文体 链接及图文相关度的研究与系统开发"(项目编号:10BTQ049)研究成果之一
关键词 网络文献 学术文献 网页特征 信息检索 web document academic paper characteristics of web page information retrieval
  • 相关文献

参考文献3

二级参考文献19

  • 1宋廷山,刘贵基.基于Eviews软件的回归模型优选问题研究[J].统计教育,2007(1):21-23. 被引量:3
  • 2.[EB/OL].http://www. nzdl. org/fast-cgi-bin/cstrlibrary? a=p&p=about.,.
  • 3.[EB/OL].http://www1. cs. columbia. edu/library/.,.
  • 4.[EB/OL].http://159.226.113.17/science7. htm.,.
  • 5.[EB/OL].http://www. w3. org.,.
  • 6.[EB/OL].htrp://www. math. ecnu. edu. cn/preprint/.,.
  • 7.[EB/OL].[http://www. gpoaccess. gov/databases. htm.,.
  • 8.[EB/OL].http://www. chinapdf. corn/begin. htm.,.
  • 9.[EB/OL].http://arxlv. org.,.
  • 10.[EB/OL].http://www. patent. com. cn.,.

共引文献40

同被引文献7

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部