-
题名Zipf定律与网络信息计量学
被引量:5
- 1
-
-
作者
刘胜久
李天瑞
珠杰
-
机构
西南交通大学信息科学与技术学院
西藏大学计算机科学系藏文信息技术研究中心
-
出处
《中文信息学报》
CSCD
北大核心
2015年第4期89-94,共6页
-
基金
国家自然基金(61175047
61262058
+1 种基金
61152001)
中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)
-
文摘
作为文献计量学重要定律的Zipf定律已在许多领域得到较广泛的应用,网络信息计量学伴随着网络信息的激增而受到人们越来越大的关注。该文结合搜索结果数量的分布情况,提出了在网络信息计量学中仍然存在Zipf定律的猜想,并采用公开的词语集在几个代表性的搜索引擎中进行实验验证,证实了搜索结果数目近似服从Zipf定律的结论,其中Baidu与So搜索结果的Zipf指数为0.003。
-
关键词
Zipf定律
Zipf指数
搜索引擎
网络信息计量学
-
Keywords
Zipf's law
Zipf's index
search engine
webometrics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于Hadoop平台的并行中文句法分析研究
- 2
-
-
作者
刘胜久
李天瑞
贾真
珠杰
-
机构
西南交通大学信息科学与技术学院
西藏大学计算机科学系藏文信息技术研究中心
-
出处
《计算机科学》
CSCD
北大核心
2014年第3期88-90,115,共4页
-
基金
国家自然科学基金(61175047
61262058
+1 种基金
61152001)
中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题(20110102)资助
-
文摘
作为自然语言理解研究重点的句法分析一直受到人们的关注。针对现今句法分析方法效率低、准确度不高的问题,借助云计算计算能力强的优势,探讨了在云计算平台上实现并行中文句法分析的方法。利用公开的语料库及开源的句法分析工具在搭建的Hadoop云计算试验平台上实现并行中文句法分析,实验结果及理论分析均证实了所设计的基于Hadoop平台的并行句法分析方法的可行性、有效性与稳定性。
-
关键词
云计算
HADOOP
并行
句法分析
-
Keywords
Cloud computing
Hadoop
Parallellism
Syntactic analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-