-
题名中文博客搜索引擎研究
被引量:3
- 1
-
-
作者
潘冰
徐亮亮
-
机构
暨南大学珠海学院
北京数码大方科技有限公司
-
出处
《计算机工程与设计》
CSCD
北大核心
2010年第8期1718-1721,共4页
-
文摘
为了充分利用博客日志所提供的信息,提出了建立中文博客搜索引擎的基本思路。通过对博客的技术特点和博客搜索引擎工作原理的分析,设计了中文博客搜索引擎的系统结构。在此基础上,利用规则定义和正则表达式,结合真正简易聚合技术对传统的网络爬虫进行了改进,较好地解决了博客信息难以被收录的问题。利用真正简易聚合技术对博客信息进行格式化处理,加快了博客信息采集速度。通过对中文分词的扩展,利用Lucene.net全文搜索工具实现了一个中文博客搜索引擎。实验测试结果表明,采用的方案和技术是可行的。
-
关键词
博客
博客搜索引擎
网络爬虫
真正简易聚合
正则表达式
-
Keywords
blog
blog search engine
crawler
RSS
regular expression
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名国外博客搜索引擎的比较研究
被引量:2
- 2
-
-
作者
胡海荣
-
机构
温州市图书馆
-
出处
《图书馆》
CSSCI
北大核心
2008年第6期55-56,60,共3页
-
文摘
介绍了国外著名博客搜索引擎的基本特征,并结合检索举例,从覆盖范围、可靠性方面进行了比较和分析,揭示它们各自的优点与不足。
-
关键词
博客搜索引擎
信息检索
信息服务
-
分类号
G250.7
[文化科学—图书馆学]
-
-
题名浅议基于RSS技术的博客搜索引擎
- 3
-
-
作者
肖离离
-
机构
广东农工商职业技术学院商务系
-
出处
《电子商务》
2011年第9期55-57,共3页
-
文摘
本文首先对RSS技术进行了概述,然后简要介绍国内外的结合了RSS技术的博客搜索引擎并阐述了其相对传统的搜索引擎的优点,最后提出了现有的博客搜索引擎在检索功能上的不足之处,以期对博客搜索引擎的改进提供借鉴。
-
关键词
RSS技术
博客搜索引擎
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于发布订阅模型的博客搜索系统
被引量:1
- 4
-
-
作者
李瑜
郭俊波
虎嵩林
-
机构
中国科学院计算技术研究所
中国科学院研究生院
-
出处
《微电子学与计算机》
CSCD
北大核心
2009年第9期99-101,共3页
-
基金
北京市自然科学基金项目(4092043)
北京市教育委员会共建项目专项
-
文摘
设计了一个基于发布订阅模型的博客搜索系统.它能够利用采集器抓取博客更新,并实时地将满足匹配条件的内容按需推送给用户.实验表明该系统能够取得较好的效率,能够满足博客搜索的实时性要求.
-
关键词
发布订阅
博客搜索
匹配算法
-
Keywords
publish-subscribe
blog search
matching algorithm
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名谷歌低调推出新博客搜索功能
- 5
-
-
-
出处
《青年记者》
2010年第9Z期77-77,共1页
-
文摘
据国外媒体报道,谷歌低调推出一项新功能,允许用户搜索任何特定主题的博客。谷歌8月底在每周搜索功能更新中发布了该功能。著名博客主比尔·史劳斯基(Bill Slawski)指出,该功能可能与谷歌一项新的专利有关。由于许多用户都经常需要搜索特定主题内的顶级博客,这项功能今后将大有用武之地。
-
关键词
谷歌
博客搜索
特定主题
客主
劳斯
新浪科技
博客文章
搜索算法
目录服务
输出技术
-
分类号
G206-F
[文化科学—传播学]
-
-
题名博客搜索引擎与传统搜索引擎的比较研究
被引量:11
- 6
-
-
作者
王娜
-
机构
武汉大学信息管理学院
-
出处
《图书情报工作》
CSSCI
北大核心
2006年第7期54-57,共4页
-
文摘
简要介绍博客与国内外著名博客搜索引擎,针对博客搜索引擎与传统搜索引擎的不同,从工作原理、检索内容和检索方式三个方面对两种搜索引擎进行系统地分析与比较,并选取了4个不同方面具有代表性的主题,对两种搜索引擎的代表进行检索功能及检索性能方面的测评;并指出两种搜索引擎在资源价值、检索方式、个性化服务等方面各自的优势与不足,以期对两种搜索引擎的改进提供借鉴。
-
关键词
博客搜索引擎
RSS
传统搜索引擎
比较研究
检索内容
检索方式
个性化服务
-
Keywords
blog blog search engine RSS
-
分类号
G354
[文化科学—情报学]
-
-
题名论博客链接索引的设计
被引量:3
- 7
-
-
作者
邱均平
李江
任全娥
李晔君
-
机构
武汉大学中国科学评价研究中心
-
出处
《情报理论与实践》
CSSCI
北大核心
2007年第4期489-492,共4页
-
基金
国家自然科学基金项目的研究成果之一
项目编号:70673071。
-
文摘
在分析目录学索引与传统引文索引的基础上,提出了“链接索引”与“博客链接索引”的概念,并进行博客链接索引的设计。从数据库设计的角度分析了博客链接索引所具有的内涵、结构及功能,结合博客计量学和链接分析,阐述了博客链接索引的理论价值与实践意义。最后,指出了博客链接索引实现的难点所在。
-
关键词
博客
链接索引
博客链接索引
博客搜索引擎
链接分析
-
Keywords
blog
sitation index
blog sitation index
blog search engine
link analysis
-
分类号
G353.21
[文化科学—情报学]
-
-
题名论博客链接索引的设计
被引量:1
- 8
-
-
作者
邱均平
李江
任全娥
李晔君
-
机构
武汉大学中国科学评价研究中心
-
出处
《评价与管理》
2007年第2期14-18,共5页
-
基金
本文系国家自然科学基金项目(编号70673071)的研究成果之一
-
文摘
在分析目录学索引与传统引文索引的基础上,提出了"链接索引"与"博客链接索引"的概念并进行博客链接索引的设计。从数据库设计的角度分析了博客链接索引所具有的内涵、结构及功能,并结合博客计量学和链接分析,阐述了博客链接索引的理论价值与实践意义;最后,指出了博客链接索引实现的难点所在。
-
关键词
博客
链接索引
BSI
博客搜索引擎
链接分析
-
Keywords
blog
sitation index
BSI
blog search engine
link analysis
-
分类号
G354
[文化科学—情报学]
-
-
题名博客中间 胡庆勇的一亩三分地
- 9
-
-
作者
王露
-
机构
《中国电子商务》记者
-
出处
《中国电子商务》
2006年第12期132-133,共2页
-
文摘
作为一种新的表达方式,博客为个人提供了展现自己的工具,包含着大量的智慧、思想,凸显了网络的知识价值。写博客和阅读博客越来越成为一种习惯,成为一种新的交际方式,改变和丰富着人们的互动生活。而胡庆勇的一亩地,则成为博客社区最大的互动场所。
-
关键词
博客搜索
乒乓球
娱乐思想
阅读
-
分类号
G236
[文化科学]
-
-
题名有道搜索——背靠亿万网民的网络词典
- 10
-
-
-
出处
《数字生活》
2007年第12期95-95,共1页
-
文摘
作为网易自主研发的全新中文搜索引擎,有道搜索(www.yodao.com)致力于为互联网用户提供更快更好的中文搜索服务。它于2006年底推出测试版,并于2007年7月正式成为网易旗下搜索引擎so.163.com的内核。
-
关键词
博客搜索
自主研发
中文搜索
图片搜索
网络词典
搜索服务
-
分类号
TP393.092
[自动化与计算机技术—计算机应用技术]
-
-
题名网络舆情监测与搜集研究
被引量:1
- 11
-
-
作者
张梅贞
周小情
-
机构
武汉长江工商学院文法学院
-
出处
《青年记者》
北大核心
2014年第08Z期13-14,共2页
-
基金
2014年湖北省教育厅人文社会科学项目"媒体人微博对网络舆情的引导性研究--基于网络第三方介入力量视角"(编号:14G465)阶段性成果
-
文摘
网络舆情监测与搜集,是运用各种方法监测、搜集、汇总网络舆情信息的工作。它既是网络舆情工作的开端,也贯穿网络舆情工作的全过程。在当前信息高度饱和的背景下,新闻的生命周期大约是4~6个小时,如果不能尽早报送并及时拿出应对方案,舆情处置工作会陷于被动,没有舆情监测与搜集,其他舆情处置工作就会陷入"巧妇难为无米之炊"的尴尬境地。因此,舆情的监测与搜集工作至关重要。
-
关键词
网络舆情
舆情信息
意见领袖
生命周期
博客搜索
舆论场
西方敌对势力
谷歌
文化工作
拉扎斯菲尔德
-
分类号
G206
[文化科学—传播学]
-
-
题名因特网上的免费化学资源
- 12
-
-
作者
温家亮
王化银
郭斌
-
机构
中器国兵工业集团第五三研究所
-
出处
《上海化工》
CAS
2015年第2期35-37,共3页
-
文摘
因特网(Internet)上相当一部分资源都是需要付费后才能使用,因而对广大科研工作者来说,既经济又可行的办法就是使用其所提供的免费服务,Internet所提供的免费资源中,与化学相关的占有相当高的比例,且有很多非常具有实用价值,下面择其要者推荐给广大科研工作者。1搜索引擎搜索引擎是搜索各类网络信息资源的重要工具。Google、百度等搜索引擎已经渗透到人们的日常生活当中。有问题Google一下甚至成为一句流行语。
-
关键词
化学资源
网站维护
免费资源
引擎搜索
博客搜索
网页搜索
信息资源
检索界面
检索策略
HTTP
-
分类号
G354
[文化科学—情报学]
O6-39
[理学—化学]
-