Ctrl+K

一个NotionNext搭建的博客

数据库系统概论

第一章]绪论

第二章]关系数据库

第三章]关系数据库标准语言SQL

第四章]数据库的安全性

第五章]数据库完整性

第六章]关系数据概论

第七章]数据库设计

第八章]数据库编程

第十章]数据库恢复技术

第十一章]并发控制

大数据原理与应用

[第一章]大数据概述

[第二章]大数据处理架构Hadoop

[第三章]分布式文件系统HDFS

[第四章]分布式数据库HBase

[第五章]NoSQL数据库

[第六章]云数据库

[第七章]MapReduce

[第八章]Hadoop再探讨

[第九章]数据仓库Hive

[第十章]Spark

[第十一章]流计算

[第十二章]Flink

[第十三章]图计算

javaWeb应用开发基础教程

[第一章]集成开发环境搭建

[第二章]JDBC

[第三章]Servlet

[第五章]JavaBean

[第八章]过滤器和监听器

[第十章]Spark

[第十一章]Spring框架核心基础

[第十三章]Spring MVC

毕业设计规划

python

常用内置函数

毕业设计

spring boot后端

系统功能模块设计

前后端框架

大数据技术综合应用

实训-航空数据系统

准备系统运行的先决条件

安装配置ZooKeeper

安装配置Hadoop集群

Python数据分析环境准备

数据预处理

java面向对象程序设计

搭建开发环境

编写第一个java程序

JAVA语言基础

面向对象编程

抽象类和接口

数据结构

树和森林的存储和遍历

算法分析与设计

[第一章]算法概述

[第二章]递归与分治策略

[第三章]动态规划

[第四章]贪心算法

[第五章]回溯法

[第六章]分支限界

判断奇偶数的条件

SPARK

【第二章】Spark设计与运行原理

【第四章】RDD编程

【第五章】DataFrame

【第六章】流计算

【第七章】Structured Streaming

【第八章】机器学习

Python爬虫大数据采集与挖掘

大数据采集概述

Web页面及相关技术

Web应用架构与协议

普通爬虫页面采集技术与Python实现

动态页面采集与Python实现

Web信息提取与Python实现

主题爬虫页面采集技术与Python实现

[第八章]Deep Web爬虫与Python实现

云计算

云计算概论

容器与容器云

概率论与数理统计

一、随机事件及其概率

二、随机变量及其分布

离散随机变量及其分布

连续型随机变量及其分布

二维离散型随机变量

二维连续型随机变量

期望与方差

中心极限定理

数字逻辑

数据选择器

计算机网络

计算机网络和因特网

网络层数据层面

网络层控制层面

计算机组成原理

第一章]计算机系统概述

第二章]数据信息的表示

第三章]运算方法与运算器

第四章]存储系统

第六章]中央处理器

第八章]总线系统

第九章]输入输出系统

linux

Linux基本概念与常用指令

Linux系统配置与管理

linux网络基础

shell程序设计

网络服务配置与管理

如何建立自己的linux系统

操作系统

[第一章]操作系统引论

[第二章]进程的描述与控制

[第三章]处理机调度与死锁

[第四章]进程同步

[第五章]存储器管理

[第六章]虚拟存储器

[第八章]文件管理

[第九章]磁盘存储管理

人工智能导论

[第一章]绪论

[第二章]知识表示与知识图谱

[第三章]确定性推理方法

[第四章]不确定性推理方法

[第五章]搜索求解策略

[第六章]智能计算及其应用

[第七章]专家系统与机器学习

[第八章]人工神经网络与深度学习

[第十章]自然语言处理及其应用

[第十一章]人工智能在游戏设计中的应用

数据仓库与数据挖掘

数据仓库和数据挖掘概述

数据仓库设计

[第五章]关联分析算法

[第六章]决策树分类算法

[第七章]贝叶斯分类算法

[第八章]神经网络算法

[第九章]回归分析算法

[第十章]时间序列分析

数据可视化

【第一章】概述

【第三章】数据读写和pandas

【第四章】类别比较型图表

【第九章】高维数据可视化

大数据安全与隐私保护

【第一章】网络空间安全：理解与认识

【第二章】常用的几个基本概念

【第三章】密码算法

【第五章】密钥管理

【第十二章】网络与系统攻击

【第十五章】互联网安全

c语言

C++

变量和数据类型

并行计算

简介类型层次并行计算和分布式计算并行操作系统共享内存分布式内存并行计算机体系结构并行计算机分类 Flynn分类法按功能部件互连位置不同分类互连网络静态互连网络动态互连网络并行计算机性能评价基本参数加速比定律 Amdahl阿姆达尔定律 Gustafson古斯塔夫森加速比定律 Sun&Ni孙-倪加速比定律基准测试程序并行程序设计模型数据并行模型消息传递模型

简介

类型

时间并行：并发

空间并行：并行

层次

位级并行：位

指令级并行：指令流水线

数据级并行：数据流

任务级并行：CPU并行执行多个任务

并行计算和分布式计算

并行计算共享内存

并行计算具有同构性，处理机类型相同

并行计算交互频繁，细粒度和低开销

并行计算节点结算结果相互影响；分布式分解后的小任务有独立性

并行操作系统

共享内存

单一OS映像

同意内存地址空间，不同内存模块的访问时间相同

分布式内存

每个节点有自己的本地内存，访问本地内存和全局内存的时间不同

集群/MPP：多台独立计算机通过网络互联，共同完成计算

并行计算机体系结构

并行计算机分类

Flynn分类法

SISD 单指令单流数据流

传统冯诺依曼计算机

SIMD

对多个数据进行相同操作

MISD

MIMD 多指令流多数据流

使用多个控制器来异步地控制多个处理器，从而实现空间上的并行性

SMP、多核、集群

缩放比定律、摩尔定律的终结，并行计算是未来

按功能部件互连位置不同分类

处理器处

单指令流多数据流SIMD
控制单元的成本在多个数据通路分担，多个通路同步工作
并行编程模型的灵活性有限

存储系统处

多个CPU共享同一个映射到物理内存上的虚拟地址空间
共享存储处理器SMP

所有CPU都能平等地访问所有的内存模块和输入/输出设备，而且在操作系统看来这些CPU是可以互换的

低延迟，但要求适当的同步才能获得较高的并行效率

I/O系统处

使用标准网络互联

集群

高性能计算集群

尽快完成大计算任务
节点通信频繁，节点耦合、紧耦合

高可用集群

容错、高可用
多个冗余节点
双机热备、一种是双机互备。这两种方式都是共享一个磁盘阵列

负载均衡集群

较高资源利用率
两台或多台服务器同时处理来自同一个应用的服务请求
同时具备高可用功能
多种模式实现服务的负载均衡

基于客户端的负载均衡
基于服务器的负载均衡

多用途集群

网络延迟大，价格低

使用专用网络互联

多计算机
性能强，价格高

互连网络

并行计算机内部互连

静态互连网络

一维线性阵列

只有左右临近节点相连
n个节点n-1条边
节点度为2
网络直径为n-1
对刨度为1
首位相连成环

四近邻连接

notion image

网状结构

(dx,dy) = (x2-x1,y2-y1) dx > 0, move down dx < 0, move up dy > 0, move right dy < 0, move left

环状结构

If |dx|>X_dim/2 or |dy|>Y_dim/2, 向相反方向移动

树形结构

路径唯一、路由简单
上层节点负担重

超立方体

动态互连网络

边和边连接处是具有开关、选路或仲裁功能的可控电子器件

并行计算机性能评价

基本参数

处理器数量、时钟频率、存储器容量/带宽

工作负载：求解问题的总计算量

串行分量：工作负载中必须串行执行的部分

串行分量占比：工作负载中串行分量所占比例，

并行分量：工作负载中可以并行执行的部分，

串行执行时间：使用个处理器串行处理所需时间。

并行执行时间：个处理器并行系统处理所需时间。

额外开销：包括并行处理开销和通信开销。

并行处理开销：任务分配、任务调度、结果汇总等涉及的开销。
通信开销：同步操作、通信操作等涉及的开销。

加速比S：P个处理器的并行系统执行程序时速度提升倍数—

处理器利用率（并行效率）

加速比定律

Amdahl阿姆达尔定律

固定负载

不考虑额外开销

notion image

考虑额外开销

notion image

顺序瓶颈

串行分量占比f被称为程序的顺序瓶颈
随着并行系统中的处理器数量不断增大，并行系统所能达到的加速比的上限为1\/𝑓

Gustafson古斯塔夫森加速比定律

扩展问题

不以获得最短运行时间为目的，更看重计算精度

扩大系统规模，获得更高计算精度

通过增加问题规模，形成更大的工作负载

串行工作负载保持W_s不变，并行工作负载从W_p增大为〖p«W〗_p，问题处理时间保持不变。因此，Gustafson加速比也叫作固定时间加速比

notion image

充分大时，加速比与几乎成线性关系,不再是瓶颈

Sun&Ni孙-倪加速比定律

受限于存储器

条件

所有节点的存储器集合能形成全局地址空间，即共享分布式存储空间。
所有可用的存储区都用于求解可扩展问题

系统规模增大到p时，并行系统的存储器容量增大为pM。

G(p)：存储器容器量增大为pM时工作负载的增加量，则扩大后的工作负载为：𝑊=𝑓𝑊+(1−𝑓)𝐺(𝑝)𝑊

notion image

基准测试程序

指令执行速度和浮点性能采用MIPS和Mflops

MIPS可用时钟频率和平均CPI(平均指令周期)计算得到。

并行程序设计模型

并行进程的规范说明、创建、挂起、再生、迁移、终止及同步

数据并行模型

强调局部计算和数据路由操作，适合于细粒度问题求解

消息传递模型

容器与容器云

Loading...

Article List

一个NotionNext搭建的博客

数据库系统概论

第一章]绪论

第二章]关系数据库

第三章]关系数据库标准语言SQL

第四章]数据库的安全性

第五章]数据库完整性

第六章]关系数据概论

第七章]数据库设计

第八章]数据库编程

第十章]数据库恢复技术

第十一章]并发控制

大数据原理与应用

[第一章]大数据概述

[第二章]大数据处理架构Hadoop

[第三章]分布式文件系统HDFS

[第四章]分布式数据库HBase

[第五章]NoSQL数据库

[第六章]云数据库

[第七章]MapReduce

[第八章]Hadoop再探讨

[第九章]数据仓库Hive

[第十章]Spark

[第十一章]流计算

[第十二章]Flink

[第十三章]图计算

javaWeb应用开发基础教程

[第一章]集成开发环境搭建

[第二章]JDBC

[第三章]Servlet

[第五章]JavaBean

[第八章]过滤器和监听器

[第十章]Spark

[第十一章]Spring框架核心基础

[第十三章]Spring MVC

毕业设计规划

python

常用内置函数

毕业设计

spring boot后端

系统功能模块设计

前后端框架

大数据技术综合应用

实训-航空数据系统

准备系统运行的先决条件

安装配置ZooKeeper

安装配置Hadoop集群

Python数据分析环境准备

数据预处理

java面向对象程序设计

搭建开发环境

编写第一个java程序

JAVA语言基础

面向对象编程

抽象类和接口

数据结构

树和森林的存储和遍历

算法分析与设计

[第一章]算法概述

[第二章]递归与分治策略

[第三章]动态规划

[第四章]贪心算法

[第五章]回溯法

[第六章]分支限界

判断奇偶数的条件

SPARK

【第二章】Spark设计与运行原理

【第四章】RDD编程

【第五章】DataFrame

【第六章】流计算

【第七章】Structured Streaming

【第八章】机器学习

Python爬虫大数据采集与挖掘

大数据采集概述

Web页面及相关技术

Web应用架构与协议

普通爬虫页面采集技术与Python实现

动态页面采集与Python实现

Web信息提取与Python实现

主题爬虫页面采集技术与Python实现

[第八章]Deep Web爬虫与Python实现

云计算

云计算概论

容器与容器云

概率论与数理统计

一、随机事件及其概率

二、随机变量及其分布

离散随机变量及其分布

连续型随机变量及其分布

二维离散型随机变量

二维连续型随机变量

期望与方差

中心极限定理

数字逻辑

数据选择器

计算机网络

计算机网络和因特网

网络层数据层面

网络层控制层面

计算机组成原理

第一章]计算机系统概述

第二章]数据信息的表示

第三章]运算方法与运算器

第四章]存储系统

第六章]中央处理器

第八章]总线系统

第九章]输入输出系统

linux

Linux基本概念与常用指令

Linux系统配置与管理

linux网络基础

shell程序设计

网络服务配置与管理

如何建立自己的linux系统

操作系统

[第一章]操作系统引论

[第二章]进程的描述与控制

[第三章]处理机调度与死锁

[第四章]进程同步

[第五章]存储器管理

[第六章]虚拟存储器

[第八章]文件管理

[第九章]磁盘存储管理

人工智能导论

[第一章]绪论

[第二章]知识表示与知识图谱

[第三章]确定性推理方法

[第四章]不确定性推理方法

[第五章]搜索求解策略

[第六章]智能计算及其应用

[第七章]专家系统与机器学习

[第八章]人工神经网络与深度学习

[第十章]自然语言处理及其应用

[第十一章]人工智能在游戏设计中的应用

数据仓库与数据挖掘

数据仓库和数据挖掘概述

数据仓库设计

[第五章]关联分析算法

[第六章]决策树分类算法

[第七章]贝叶斯分类算法

[第八章]神经网络算法

[第九章]回归分析算法

[第十章]时间序列分析

数据可视化

【第一章】概述

【第三章】数据读写和pandas

【第四章】类别比较型图表

【第九章】高维数据可视化

大数据安全与隐私保护

【第一章】网络空间安全：理解与认识

【第二章】常用的几个基本概念

【第三章】密码算法

【第五章】密钥管理

【第十二章】网络与系统攻击

【第十五章】互联网安全

c语言

C++

变量和数据类型