一个NotionNext搭建的博客
数据库系统概论
大数据原理与应用
javaWeb应用开发基础教程
python
毕业设计
大数据技术综合应用
实训-航空数据系统
java面向对象程序设计
数据结构
算法分析与设计
SPARK
Python爬虫大数据采集与挖掘
云计算
概率论与数理统计
数字逻辑
计算机网络
计算机组成原理
linux
操作系统
人工智能导论
数据仓库与数据挖掘
数据可视化
大数据安全与隐私保护
c语言
C++
[第九章]回归分析算法
回归分析概述
利用数据统计原理,对大量统计数据进行数学处理,并确定因变量和自变量的关系建立回归方程并加以外推,用于预测今后因变量的变化
- 找出关系,关系的数学表达式
- 新数据结果预测
步骤
- 根据自变量和因变量的关系和数据,建立初步回归方程
- 找出合理的回归系数
- 进行相关性检测,确定相关系数
- 符合相关性要求后,可以预测并计算预测的置信区间
类型
- 线性回归
- 一元线性回归:一个自变量
- 多元线性回归:多个自变量
- 非线性回归
- 逻辑回归
- 输出结构一般是连续值
线性回归
一元线性回归
Y=a+bX
- 最小二乘法求系数a和b
多元线性回归
线性回归方程判定系数
接近程度用判定系数度量
- 接近1拟合理想
显著性检验
回归系数的显著性检验
- t检验
回归方程的显著性检验
- f检验
非线性回归方程
方法
- 非线性回归方程线性化
- 多项式回归拟合逼近
- 若变量间非线性关系已知,数值迭代的非线性回归分析
线性化
- 对数型
- 双曲线型
- 指数型
- 取对数,
- 令
- 幂函数型
- 取对数l, 令
- S型
- 令
- 把x、y值根据类型变换,用线性求解,再变换回来
- 高阶回归分析问题转换成多元线性回归问题
不可线性化的回归分析
- 模型
- X自变量Y因变量未知数e服从的随机变量(白噪音)
- 对X做n次观测,得到n次的X值和Y值
- 用表示观测所带入的函数
- 最小二乘法求
逻辑回归分析
分析二分类或有次序的因变量和自变量之间的关系
R²最大值为1。 R²的值越接近1,说明回归直线对观测值的拟合程度越好;反之,R²的值越小,说明回归直线对观测值的拟合程度越差
模型
Prev
[第八章]神经网络算法
Next
[第十章]时间序列分析
Loading...