建站教程

往期整理

Ctrl+K

一个NotionNext搭建的博客

数据库系统概论

第一章]绪论

第二章]关系数据库

第三章]关系数据库标准语言SQL

第四章]数据库的安全性

第五章]数据库完整性

第六章]关系数据概论

第七章]数据库设计

第八章]数据库编程

第十章]数据库恢复技术

第十一章]并发控制

大数据原理与应用

[第一章]大数据概述

[第二章]大数据处理架构Hadoop

[第三章]分布式文件系统HDFS

[第四章]分布式数据库HBase

[第五章]NoSQL数据库

[第六章]云数据库

[第七章]MapReduce

[第八章]Hadoop再探讨

[第九章]数据仓库Hive

[第十章]Spark

[第十一章]流计算

[第十二章]Flink

[第十三章]图计算

javaWeb应用开发基础教程

[第一章]集成开发环境搭建

[第二章]JDBC

[第三章]Servlet

[第五章]JavaBean

[第八章]过滤器和监听器

[第十章]Spark

[第十一章]Spring框架核心基础

[第十三章]Spring MVC

毕业设计规划

python

常用内置函数

毕业设计

spring boot后端

系统功能模块设计

前后端框架

大数据技术综合应用

实训-航空数据系统

准备系统运行的先决条件

安装配置ZooKeeper

安装配置Hadoop集群

Python数据分析环境准备

数据预处理

java面向对象程序设计

搭建开发环境

编写第一个java程序

JAVA语言基础

面向对象编程

抽象类和接口

数据结构

树和森林的存储和遍历

算法分析与设计

[第一章]算法概述

[第二章]递归与分治策略

[第三章]动态规划

[第四章]贪心算法

[第五章]回溯法

[第六章]分支限界

判断奇偶数的条件

SPARK

【第二章】Spark设计与运行原理

【第四章】RDD编程

【第五章】DataFrame

【第六章】流计算

【第七章】Structured Streaming

【第八章】机器学习

Python爬虫大数据采集与挖掘

大数据采集概述

Web页面及相关技术

Web应用架构与协议

普通爬虫页面采集技术与Python实现

动态页面采集与Python实现

Web信息提取与Python实现

主题爬虫页面采集技术与Python实现

[第八章]Deep Web爬虫与Python实现

云计算

云计算概论

容器与容器云

概率论与数理统计

一、随机事件及其概率

二、随机变量及其分布

离散随机变量及其分布

连续型随机变量及其分布

二维离散型随机变量

二维连续型随机变量

期望与方差

中心极限定理

数字逻辑

数据选择器

计算机网络

计算机网络和因特网

网络层数据层面

网络层控制层面

计算机组成原理

第一章]计算机系统概述

第二章]数据信息的表示

第三章]运算方法与运算器

第四章]存储系统

第六章]中央处理器

第八章]总线系统

第九章]输入输出系统

linux

Linux基本概念与常用指令

Linux系统配置与管理

linux网络基础

shell程序设计

网络服务配置与管理

如何建立自己的linux系统

操作系统

[第一章]操作系统引论

[第二章]进程的描述与控制

[第三章]处理机调度与死锁

[第四章]进程同步

[第五章]存储器管理

[第六章]虚拟存储器

[第八章]文件管理

[第九章]磁盘存储管理

人工智能导论

[第一章]绪论

[第二章]知识表示与知识图谱

[第三章]确定性推理方法

[第四章]不确定性推理方法

[第五章]搜索求解策略

[第六章]智能计算及其应用

[第七章]专家系统与机器学习

[第八章]人工神经网络与深度学习

[第十章]自然语言处理及其应用

[第十一章]人工智能在游戏设计中的应用

数据仓库与数据挖掘

数据仓库和数据挖掘概述

数据仓库设计

[第五章]关联分析算法

[第六章]决策树分类算法

[第七章]贝叶斯分类算法

[第八章]神经网络算法

[第九章]回归分析算法

[第十章]时间序列分析

数据可视化

【第一章】概述

【第三章】数据读写和pandas

【第四章】类别比较型图表

【第九章】高维数据可视化

大数据安全与隐私保护

【第一章】网络空间安全：理解与认识

【第二章】常用的几个基本概念

【第三章】密码算法

【第五章】密钥管理

【第十二章】网络与系统攻击

【第十五章】互联网安全

c语言

C++

变量和数据类型

过程

分别网络配置
网络配置

分别修改主机名

sudo vim /etc/hostname

分别修改/etc/hosts

互相配置ssh

ssh免密连接

配置hadoop

把Master节点上的“/usr/local/hadoop”文件夹复制到各个节点上

Hadoop集群安装配置教程_Hadoop3.1.3_Ubuntu

【版权声明】版权所有，严禁转载，严禁用于商业用途，侵权必究。【相关文章推荐】《大数据软件安装和基础编程实践指南》，详细指导VirtualBox、Ubuntu、Hadoop、HDFS、HBase、Hive、MapReduce、Spark、Flink的安装和基础编程本文作者：厦门大学计算机系数据库实验室林子雨副教授 E-mail: ziyulin@xmu.edu.cn 本教程讲述如何配置 Hadoop 集群（采用Hadoop3.1.3），默认读者已经掌握了 Hadoop的单机伪分布式配置，否则，请先查看Hadoop安装教程_单机/伪分布式配置教程。

Hadoop集群安装配置教程_Hadoop3.1.3_Ubuntu

https://dblab.xmu.edu.cn/blog/2775/

启动集群

HADOOP

在NAMENODE上

start-dfs.sh

start-yarn.sh

mapred --daemon start historyserver

$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager

SPARK

在Spark Master节点上启动Spark Master

$SPARK_HOME/sbin/start-master.sh

在所有Worker节点上启动Spark Worker

$SPARK_HOME/sbin/start-slaves.sh

或

$SPARK_HOME/sbin/start-slave.sh spark://hadoop01:7077

如果配置好了

$SPARK_HOME/sbin/start-all.sh

PYSPARK

关闭集群

在NAMENODE上

stop-yarn.sh

stop-dfs.sh

mapred --daemon stop historyserver

SPARK

如果配置好了

$SPARK_HOME/sbin/stop-all.sh

python环境与库管理 (1)

前后端框架

准备系统运行的先决条件

Loading...

Catalog

Last update: 2026-06-07

🎉NotionNext 4.9已经上线🎉

-- 感谢您的支持 ---

👏欢迎更新体验👏

Article List

一个NotionNext搭建的博客

数据库系统概论

第一章]绪论

第二章]关系数据库

第三章]关系数据库标准语言SQL

第四章]数据库的安全性

第五章]数据库完整性

第六章]关系数据概论

第七章]数据库设计

第八章]数据库编程

第十章]数据库恢复技术

第十一章]并发控制

大数据原理与应用

[第一章]大数据概述

[第二章]大数据处理架构Hadoop

[第三章]分布式文件系统HDFS

[第四章]分布式数据库HBase

[第五章]NoSQL数据库

[第六章]云数据库

[第七章]MapReduce

[第八章]Hadoop再探讨

[第九章]数据仓库Hive

[第十章]Spark

[第十一章]流计算

[第十二章]Flink

[第十三章]图计算

javaWeb应用开发基础教程

[第一章]集成开发环境搭建

[第二章]JDBC

[第三章]Servlet

[第五章]JavaBean

[第八章]过滤器和监听器

[第十章]Spark

[第十一章]Spring框架核心基础

[第十三章]Spring MVC

毕业设计规划

python

常用内置函数

毕业设计

spring boot后端

系统功能模块设计

前后端框架

大数据技术综合应用

实训-航空数据系统

准备系统运行的先决条件

安装配置ZooKeeper

安装配置Hadoop集群

Python数据分析环境准备

数据预处理

java面向对象程序设计

搭建开发环境

编写第一个java程序

JAVA语言基础

面向对象编程

抽象类和接口

数据结构

树和森林的存储和遍历

算法分析与设计

[第一章]算法概述

[第二章]递归与分治策略

[第三章]动态规划

[第四章]贪心算法

[第五章]回溯法

[第六章]分支限界

判断奇偶数的条件

SPARK

【第二章】Spark设计与运行原理

【第四章】RDD编程

【第五章】DataFrame

【第六章】流计算

【第七章】Structured Streaming

【第八章】机器学习

Python爬虫大数据采集与挖掘

大数据采集概述

Web页面及相关技术

Web应用架构与协议

普通爬虫页面采集技术与Python实现

动态页面采集与Python实现

Web信息提取与Python实现

主题爬虫页面采集技术与Python实现

[第八章]Deep Web爬虫与Python实现

云计算

云计算概论

容器与容器云

概率论与数理统计

一、随机事件及其概率

二、随机变量及其分布

离散随机变量及其分布

连续型随机变量及其分布

二维离散型随机变量

二维连续型随机变量

期望与方差

中心极限定理

数字逻辑

数据选择器

计算机网络

计算机网络和因特网

网络层数据层面

网络层控制层面

计算机组成原理

第一章]计算机系统概述

第二章]数据信息的表示

第三章]运算方法与运算器

第四章]存储系统

第六章]中央处理器

第八章]总线系统

第九章]输入输出系统

linux

Linux基本概念与常用指令

Linux系统配置与管理

linux网络基础

shell程序设计

网络服务配置与管理

如何建立自己的linux系统

操作系统

[第一章]操作系统引论

[第二章]进程的描述与控制

[第三章]处理机调度与死锁

[第四章]进程同步

[第五章]存储器管理

[第六章]虚拟存储器

[第八章]文件管理

[第九章]磁盘存储管理

人工智能导论

[第一章]绪论

[第二章]知识表示与知识图谱

[第三章]确定性推理方法

[第四章]不确定性推理方法

[第五章]搜索求解策略

[第六章]智能计算及其应用

[第七章]专家系统与机器学习

[第八章]人工神经网络与深度学习

[第十章]自然语言处理及其应用

[第十一章]人工智能在游戏设计中的应用

数据仓库与数据挖掘

数据仓库和数据挖掘概述

数据仓库设计

[第五章]关联分析算法

[第六章]决策树分类算法

[第七章]贝叶斯分类算法

[第八章]神经网络算法

[第九章]回归分析算法

[第十章]时间序列分析

数据可视化

【第一章】概述

【第三章】数据读写和pandas

【第四章】类别比较型图表

【第九章】高维数据可视化

大数据安全与隐私保护

【第一章】网络空间安全：理解与认识

【第二章】常用的几个基本概念

【第三章】密码算法

【第五章】密钥管理

【第十二章】网络与系统攻击

【第十五章】互联网安全

c语言

C++

变量和数据类型