hadoop配置

  • 环境变量
    • export PATH=$PATH:/usr/local/hadoop/bin:/usr/local/hadoop/sbin
    • 记得保存source ~/.bashrc
  • /usr/local/hadoop/etc/hadoop下的

各配置文件的含义

workers

列出集群中的所有工作节点(DataNode/NodeManager或Spark Worker)的主机名或IP地址

core-site.xml

fs.defaultFS(指定默认的文件系统URI)
hadoop.tmp.dir(指定Hadoop的临时目录)。

hdfs-site.xml

dfs.replication(设置数据块的副本数量),dfs.namenode.name.dir(指定NameNode元数据的存储路径),dfs.datanode.data.dir(指定DataNode数据的存储路径)。

yarn-site.xml

yarn.resourcemanager.hostname(指定ResourceManager的主机名或IP),
yarn.nodemanager.aux-services(设置节点管理器的辅助服务,如 mapreduce_shuffle

mapred-site.xml

  • 通常需要先复制模板文件 mapred-site.xml.template 没有就自己修改mapred-site.xml
cp $HADOOP_CONF_DIR/mapred-site.xml.template $HADOOP_CONF_DIR/mapred-site.xml
mapreduce.framework.name,通常设置为 yarn,表明MapReduce作业将由YARN来管理
 
Loading...
Article List
一个NotionNext搭建的博客
数据库系统概论
大数据原理与应用
javaWeb应用开发基础教程
python
毕业设计
大数据技术综合应用
实训-航空数据系统
java面向对象程序设计
数据结构
算法分析与设计
SPARK
Python爬虫大数据采集与挖掘
云计算
概率论与数理统计
数字逻辑
计算机网络
计算机组成原理
linux
操作系统
人工智能导论
数据仓库与数据挖掘
数据可视化
大数据安全与隐私保护
c语言
C++