【第九章】高维数据可视化

notion image

高维数据的变换

  • 线性方法
    • 主成分分析(Principal Components Analysis, PCA)
    • 多维尺度分析 (Multi Dimensional Scaling, MDS)
    • 非矩阵分解 (Non-negative Matrix Factorization, NMF)
  • 非线性方法
    • 等距特征映射 (Isometric Feature lapping, ISO MAP)
    • 局部线性嵌套 (Locally Linear Embedding, LLE)
    • t-SNE算法

主成分分析

线性变换将数据变换到一个新的坐标系统中
  • 使得任何数据点投影到第一个坐标(成为第一主成分)的方差最大,在第二个坐标(第二主成分)的方差为第二大,以此类推。

t-SNE算法

非线性降维算法,在邻域图上随机游走的概率分布来找到数据内结构
  • 通过仿射(affinitie)变换将数据点映射到概率分布上
    • SNE构建一个高维对象之间的概率分布,使得相似的对象有更高的概率被选择,而不相似的对象有较低的概率被选择 。
    • SNE在低维空间里构建这些点的概率分布,使得这两个概率分布之间尽可能地相似。
  • 不足
    • 倾向于保存局部特征
    • 没有唯一最优解,且没有预估部分

等距离特征算法(isomap

非线性降维方法,代替原来的两点之间最短路径算法(MDS

分面图

数据类别按行或者列,使用多个该类别的散点图、气泡图、柱形图或者曲线图等基础图表展示数据揭示数据之间的关系,可以适用于四维到五维的数据结构类型

矩阵散点图

展示多维数据通道两两之间的关系
  • 自己和自己也要相关,对角线上是做自己的统计直方图
  • 关于主对角线对称
Prev
【第四章】类别比较型图表
Next
【第一章】网络空间安全:理解与认识
Loading...
Article List
一个NotionNext搭建的博客
数据库系统概论
大数据原理与应用
javaWeb应用开发基础教程
python
毕业设计
大数据技术综合应用
实训-航空数据系统
java面向对象程序设计
数据结构
算法分析与设计
SPARK
Python爬虫大数据采集与挖掘
云计算
概率论与数理统计
数字逻辑
计算机网络
计算机组成原理
linux
操作系统
人工智能导论
数据仓库与数据挖掘
数据可视化
大数据安全与隐私保护
c语言
C++