过程

  • 分别修改主机名
    • sudo vim /etc/hostname
  • 分别修改/etc/hosts

    启动集群

    HADOOP

    在NAMENODE上
    1. start-dfs.sh
    1. start-yarn.sh
    1. mapred --daemon start historyserver
      $HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager

      SPARK

      1. 在Spark Master节点上启动Spark Master
      $SPARK_HOME/sbin/start-master.sh
      1. 在所有Worker节点上启动Spark Worker
      $SPARK_HOME/sbin/start-slaves.sh
      $SPARK_HOME/sbin/start-slave.sh spark://hadoop01:7077
      如果配置好了
      $SPARK_HOME/sbin/start-all.sh

      PYSPARK

      关闭集群

      在NAMENODE上
      1. stop-yarn.sh
      1. stop-dfs.sh
      1. mapred --daemon stop historyserver

      SPARK

      如果配置好了
      $SPARK_HOME/sbin/stop-all.sh
      python环境与库管理 (1)
      jason (1)
      Prev
      前后端框架
      Next
      准备系统运行的先决条件
      Loading...
      Article List
      一个NotionNext搭建的博客
      数据库系统概论
      大数据原理与应用
      javaWeb应用开发基础教程
      python
      毕业设计
      大数据技术综合应用
      实训-航空数据系统
      java面向对象程序设计
      数据结构
      算法分析与设计
      SPARK
      Python爬虫大数据采集与挖掘
      云计算
      概率论与数理统计
      数字逻辑
      计算机网络
      计算机组成原理
      linux
      操作系统
      人工智能导论
      数据仓库与数据挖掘
      数据可视化
      大数据安全与隐私保护
      c语言
      C++