南昌网站建设开发公司,腾讯广点通,中国建筑人才网简介,wordpress苏醒主题破解目录
1 什么是单变量分析#xff08;就是只分析数据本身#xff09;
1.1 不同的名字
1.2 《戏说统计》这本书里很多概念和一般的书不一样
1.3 具体来说#xff0c;各种概率分布都属于单变量分析
2 一维的数据分析的几个层次
2.1 数据分析的层次
2.2 一维的数据为什么…目录
1 什么是单变量分析就是只分析数据本身
1.1 不同的名字
1.2 《戏说统计》这本书里很多概念和一般的书不一样
1.3 具体来说各种概率分布都属于单变量分析
2 一维的数据分析的几个层次
2.1 数据分析的层次
2.2 一维的数据为什么可以画成二维但不是二维的
2.2.1 什么是一维数据什么是二维的数据
2.2.2 具体
3 多维数据分析
3.1 一维的数据分析
3.2 二维的数据分析
3.3 3维的面
4 典型的单变量分析
4.1 正态分布
5 多变量分析
5.1 分析方法分类
5.2 自变量的个数
5.3 为什么又了单因素分析还需要多因素分析呢 1 什么是单变量分析就是只分析1个变量数据本身
本质就是只分析1个变量数据本身就是只分析一个变量的数据就是单变量分析。如果非要统一说成是那种回归模型/因果分析模型/相关分析的话这个就算是0因子分析。 1.1 不同的名字
单变量分析模型里只有1个变量只分析这一个变量的数据纯单个变量分析0因子分析 如果一定要把所有分析都看成是因果分析那么单变量分析就是没有因子的因变量分析或者是0因子的单个因变量分布 1.2 《戏说统计》这本书里很多概念和一般的书不一样
书里说的和一般的说法不一样但是可以对应起来
单变量分析由点到线-------→一般书里没有这个说法双变量分析由线到面 ------→单变量回归多变量分析由面到体-------→多变量回归 1.3 具体来说各种概率分布都属于单变量分析
因为这些概率分布只分析这个概率序列的内部情况和其他因素无关。
0-1分布几何分布二项分布超几何分布正态分布泊松分布等 2 一维的数据分析的几个层次
2.1 数据分析的层次
层次1看到一群数据散点堆在一起注意到数据有不同差异
完全散在一群但是堆起来并不好看
层次2看到一群数据注意到这些数据的数值是不同的可分类的
有序的整理起来比如每个数值的堆在一起可以数数量分堆分类生活里常见
层次3定类进行分类
对数据进行分类具体相同特征的在一起分堆。本质上这个类别只有数据本身序列的话这个分类一定是不同数值/数值区间出现的次数就是频度。而频度本质就是概率
层次4定类且组合图形为1维
为了连续性分类数据类别全部首位相接就是统计和机器学习里都有的数据条有序的排起来比如动动脑筋把这些首尾相接起来这就是一条直线且按区间划分且区间也是按从小到大排列的一根线数据分类条每个类别的长度代表频度全部首位相接可以比较了定距数据。可比较互相的长度。
层次5把一维的数据展开为2维进行展示
把频度展开为直方图把一维的数据展开为2维进行展示。注意因为只有一种数据还是一维的是看起来形式展开像2维一样。更巧妙的是把这一根直线切分切成多根直线并着放. 这个是什么呢不是正态分布啊至少不一定是.这个其实更通用的说是频度图频度图算是分布图吗现在看起来就很像整体分布曲线了看起来像也不一定就是如果能代表概率才是概率分布曲线频度约等于权重概率横轴值的区间划分纵轴不同值的频度频度就是概率 2.2 一维的数据为什么可以画成二维但不是二维的
2.2.1 什么是一维数据什么是二维的数据
一维数据图图上无论是画成1条轴或者2条轴实际只有1个变量的数据
二维数据图有2条轴且实际确实有2个变量 2.2.2 具体
一维的线也是可以画出2个维度的轴比如一个变量的数据
前面的数据分类条从一根线变成一个二维表现形式的坐标轴横轴不同的数据值可以是离散的点或者离散区间段甚至连续的点组成的线纵轴每个数据值的发生次数/出现次数频度频度的这个二维坐标可以想象就是把 一根线的数据分类条分别截断后按左右的顺序摆在一起且下面因为是地面地面相当于一根起点相同的轴X轴。 3 多维数据分析
3.1 一维的数据分析
模型中只有一个变量单变量分析-----可以认为是0因素分析只分析因变量本身没有自变量。就是个体数据扩展到样本数据从1个到多个。但都还是属于同一个变量 3.2 二维的数据分析 2维的线直接是2个明确的轴轴1轴2两个轴都有实际意义
横轴一般是自变量纵轴一般是因变量Y 3.3 3维的面 横轴自变量1 纵轴自变量2 Z轴因变量
4 典型的单变量分析
4.1 正态分布 1 第1层次元素数据按频度展开展示自然分布2 多次抽样的平均值符合3 正态分布标准化后就是概率图并且是100% 无限逼近两边的 5 多变量分析
就是至少包含了2个变量的分析
5.1 分析方法分类
可能是相关性分析不分因果可能是回归分析有前因后果有1个因子2个因子等等。 5.2 自变量的个数 也就是只分析1因1果多因1果而不直接分析1果多因的情况自变量1因变量1自变量N因变量1自变量1因变量N---错误 实际上1果多因不符合函数实际上集合和函数的映射关系也是这个规律单设满射都满足才是双射而不能是一因多果这也函数都不是也不能有得因果缺乏映射关系。 5.3 为什么又了单因素分析还需要多因素分析呢
自变量N因变量1自变量1因变量1已经有了自变量1因变量1这种单变量分析了理论上即使有多个因素都可以拆成多个1个自变量--对应因变量这样的关系分别去分析为什么还要搞多因素分析呢因为虽然自变量1因变量1这种线性回归有截距斜率, 也可以列出函数表达式/方程。 但是这个是单个的。单因素分析双变量分析得出的公式只是一个变量的。这个无法预测结果。因为预测结果大多数情况下是多因素的我们已知多因素都影响因变量。所以只知道一个因素的影响不足于列出完整方程/建模来预测。只有多变量分析才能出一个多自变量的综合方程可以体现多变量一起变化的影响。虽然每个自变量系数都是在假设其他变量不变时求出来的也只能这么求出来然后获得统一的包含多因子在场的表达式这也才能求总公式