wordpress 调用 函数,河北seo搜索引擎优化,专门做会议的网站,网站建设方案书组网方案1、逻辑回归算法介绍
逻辑回归(Logistic Regression)是一种广义线性回归分析模型。虽然名字里带有“回归”两字#xff0c;但其实是分类模型#xff0c;常用于二分类。既然逻辑回归模型是分类模型#xff0c;为什么名字里会含有“回归”二字呢#xff1f;这是因为其算法原…1、逻辑回归算法介绍
逻辑回归(Logistic Regression)是一种广义线性回归分析模型。虽然名字里带有“回归”两字但其实是分类模型常用于二分类。既然逻辑回归模型是分类模型为什么名字里会含有“回归”二字呢这是因为其算法原理同样涉及线性回归模型中的线性回归方程。线性回归方程是用于预测连续变量的其y的取值范围为−∞∞而逻辑回归模型是用于预测类别的例如用逻辑回归模型预测一个人是否会违约、客户是否会流失在本质上预测的是一个人是否违约、是否流失的概率而概率的取值范围是01因此不能直接用线性回归方程来预测概率。
☀什么是连续型变量
连续型变量是指在一定范围内可以取无限多个可能值的数据类型。这些值通常可以是任意小数且在理论上没有间隔。例如时间、温度、长度、重量等都是典型的连续型数据因为它们可以在某个区间内无限细分。
关键特点
①无限可分在任意两个值之间存在无数个中间值。
②小数可能性可以精确到小数点后多位如身高1.75米、温度36.8°C。
③测量精度实际应用中可能受限于测量工具但理论上连续。 连续型与离散型数值的对比 特征 连续型数值 离散型数值 取值范围 无限细分如0.1, 0.01, ... 有限且可数如1, 2, 3 例子 温度、时间、价格、身高 人数、商品数量、考试题数 统计方法 线性回归、相关分析 计数模型泊松回归、卡方检验
那么想将线性回归应用到分类问题中该怎么办呢也就是如何把一个取值范围是−∞∞的回归方程变为取值范围是01的内容呢 假设y3通过Sigmoid函数转换后f(y)1/(1e^−3)0.95就可以作为一个概率值使用了。
Sigmoid函数的曲线如下图所示从图上可知当y值趋向负无穷(−∞)时f(y)的值趋向于0当y值趋向正无穷(∞)时f(y)的值趋向于1且函数的值域为(01)。这样就将线性回归中 得到的取值范围为−∞∞的值变成了取值范围为01之间的概率值。 将线性回归函数结果y放到Sigmoid函数中去就构造了逻辑回归函数函数表达式为 逻辑回归模型本质就是将线性回归模型通过Sigmoid函数进行了一个非线性转换将线性回归的结果(−∞∞)转换到一个介于01之间的概率值。逻辑回归带有“回归”却是分类问题就是因为Sigmoid函数Sigmoid函数将数据压缩到[0, 1]之间并经过一个重要的点(0, 0.5)。这样可以将 0.5作为阈值当值大于0.5作为一类而小于0.5作为另一类。
2、为什么说逻辑回归是广义的线性模型
1公式角度
在Sigmoid函数的两边乘以(1e^−y)则等式转换为 整理可以得到 等式两边同时取对数整理可以得到 把f(y)看成某个事件发生的概率那么这个事件不发生的概率就是1−f(y)两者的比值称为比值比(Odds Ratio)。令f(y)P则可以得到逻辑回归模型的另一种表示方法公式如下 方程式的左边是对数比值比右边是线性方回归。从这个角度看逻辑回归就是广义的线性模型。
2核心要素和对应关系的角度
①广义线性模型GLM的核心要素
☛随机成分响应变量Y服从指数分布族如正态分布、二项分布、泊松分布等。
☛系统成分线性预测器 ☛链接函数将线性预测器η与响应变量的期望值连接起来。
②逻辑回归与GLM的对应关系
☛随机成分伯努利分布
逻辑回归用于二分类问题如成功/失败响应变量服从伯努利分布伯努利分布属于指数分布族满足GLM对随机成分的要求。
☛链接函数Logit函数
逻辑回归使用Logit函数作为链接函数将线性预测器的值η映射到概率p这一步骤将线性预测器的范围−∞,∞)转换为概率区间[0,1]
☛系统成分线性预测器
与线性回归类似逻辑回归的线性预测器是特征变量的线性组合 至此逻辑回归模型及其为什么是广义线性模型已学习完下次学习其实现原理及应用场景。