[第九章]回归分析算法

回归分析概述

利用数据统计原理,对大量统计数据进行数学处理,并确定因变量和自变量的关系建立回归方程并加以外推,用于预测今后因变量的变化
  1. 找出关系,关系的数学表达式
  1. 新数据结果预测

步骤

  1. 根据自变量和因变量的关系和数据,建立初步回归方程
  1. 找出合理的回归系数
  1. 进行相关性检测,确定相关系数
  1. 符合相关性要求后,可以预测并计算预测的置信区间

类型

  1. 线性回归
    1. 一元线性回归:一个自变量
    2. 多元线性回归:多个自变量
  1. 非线性回归
  1. 逻辑回归
  • 输出结构一般是连续值

线性回归

一元线性回归

Y=a+bX
  • 最小二乘法求系数a和b

多元线性回归

线性回归方程判定系数

接近程度用判定系数度量
  • 接近1拟合理想

显著性检验

回归系数的显著性检验

  • t检验

回归方程的显著性检验

  • f检验

非线性回归方程

方法

  • 非线性回归方程线性化
  • 多项式回归拟合逼近
  • 若变量间非线性关系已知,数值迭代的非线性回归分析

线性化

  1. 对数型
  1. 双曲线型
  1. 指数型
      • 取对数,
  1. 幂函数型
      • 取对数l, 令
  1. S型
  • 把x、y值根据类型变换,用线性求解,再变换回来
  • 高阶回归分析问题转换成多元线性回归问题

不可线性化的回归分析

  • 模型
      • X自变量Y因变量未知数e服从的随机变量(白噪音)
  • 对X做n次观测,得到n次的X值和Y值
  • 表示观测所带入的函数
    • 最小二乘法求

逻辑回归分析

分析二分类或有次序的因变量和自变量之间的关系
R²最大值为1。 R²的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R²的值越小,说明回归直线对观测值的拟合程度越差

模型

 
Prev
[第八章]神经网络算法
Next
[第十章]时间序列分析
Loading...
Article List
一个NotionNext搭建的博客
数据库系统概论
大数据原理与应用
javaWeb应用开发基础教程
python
毕业设计
大数据技术综合应用
实训-航空数据系统
java面向对象程序设计
数据结构
算法分析与设计
SPARK
Python爬虫大数据采集与挖掘
云计算
概率论与数理统计
数字逻辑
计算机网络
计算机组成原理
linux
操作系统
人工智能导论
数据仓库与数据挖掘
数据可视化
大数据安全与隐私保护
c语言
C++