-
题名基于Linux构建Hadoop高性能服务器集群
被引量:1
- 1
-
-
作者
汪瑜斌
-
机构
贵州财经大学
-
出处
《通信电源技术》
2018年第9期151-152,154,共3页
-
文摘
随着大多数企业在生产过程中对并行计算要求的提高,而且Hadoop框架已成为当今大数据时代的关键部件,构建高性能的Hadoop服务器集群已成为大势所趋。文章介绍了如何在Linux下实现Hadoop高性能服务器集群的搭建,并且创建了一个hadoop账号,对帐号的home目录下的hadoop文件夹中相关的6个配置文件进行配置。针对这些关键的配置文件,设置hdfs.replication配置文件块的副本数,完成Map和Reduce任务数的配置,通过和硬件的结合来使Hadoop服务器性能达到最优。
-
关键词
Linux
服务器
HADOOP
MAPREDUCE
分布式文件系统
高性能
-
Keywords
Linux
server
Hadoop
MapReduce
distributed file system
high performance
-
分类号
TP316.81
[自动化与计算机技术—计算机软件与理论]
TP368.5
[自动化与计算机技术—计算机系统结构]
-
-
题名基于多视图融合的论文自动分类方法研究
被引量:4
- 2
-
-
作者
杨秀璋
夏换
于小民
杨琪
汪瑜斌
-
机构
贵州财经大学信息学院
贵州财经大学贵州省经济系统仿真重点实验室
-
出处
《现代电子技术》
北大核心
2020年第8期120-124,共5页
-
基金
贵州省教育厅青年科技人才成长项目(黔教合KY字[2016]172)
贵州省教育厅青年科技人才成长项目(黔教合KY字[2016]178)
贵州省普通高等学校科技拔尖人才支持计划项目(黔教合KY字[2016]068)。
-
文摘
为科研工作者精准推荐所需的学术论文,从而节约检索时间和精力,提高科研效率,并进一步提升论文自动分类的准确度。该文在传统单视图论文分类基础上,提出了一种基于多视图融合的论文自动分类方法,考虑论文标题、关键词、摘要三个视图的互补性和协调性,实现对海量论文的自动分类。文中抓取了中国知网9个主题的1 710篇论文作为实验语料,并构建决策树、K最近邻、随机森林、支持向量机、朴素贝叶斯分类器进行实验。结果表明,基于多视图融合的论文分类方法在准确率、召回率和F值上都有所提升,优于单视图的论文分类方法,且可以为论文自动分类、推荐系统、文本挖掘提供有效支撑,具有一定的应用前景和实用价值。
-
关键词
论文自动分类
多视图融合
数据处理
语料获取
智能推荐
文本挖掘
-
Keywords
paper automatic classification
multi-view fusion
data processing
corpus obtaining
intelligent recommendation
text mining
-
分类号
TN911-34
[电子电信—通信与信息系统]
TP391
[自动化与计算机技术—计算机应用技术]
-