当前位置：首页 > news >正文

重庆网站建设重庆最加科技优秀个人网站设计

news 2026/4/25 14:51:40

重庆网站建设重庆最加科技,优秀个人网站设计,网站用户体验模型,宁乡做网站地方文章目录 #x1f34b;引言#x1f34b;逻辑回归的原理#x1f34b;逻辑回归的应用场景#x1f34b;逻辑回归的实现 #x1f34b;引言逻辑回归是机器学习领域中一种重要的分类算法#xff0c;它常用于解决二分类问题。无论是垃圾邮件过滤、疾病诊断还是客户流失预测引言逻辑回归的原理逻辑回归的应用场景逻辑回归的实现引言逻辑回归是机器学习领域中一种重要的分类算法它常用于解决二分类问题。无论是垃圾邮件过滤、疾病诊断还是客户流失预测逻辑回归都是一个强大的工具。本文将深入探讨逻辑回归的原理、应用场景以及如何在Python中实现它。逻辑回归的原理逻辑回归是一种广义线性模型Generalized Linear Model简称GLM它的目标是根据输入特征的线性组合来预测二分类问题中的概率。具体来说逻辑回归通过使用Sigmoid函数又称为Logistic函数将线性输出映射到0到1之间的概率值。Sigmoid函数的数学表达式如下其中 P ( Y 1 ∣ X ) P(Y1|X) P(Y1∣X) 表示在给定输入特征X的条件下目标变量Y等于1的概率。 β 0 , β 1 , … , β n \beta_0, \beta_1, \ldots, \beta_n β0,β1,…,βn 是模型的权重参数 X 1 , X 2 , … , X n X_1, X_2, \ldots, X_n X1,X2,…,Xn 是输入特征。逻辑回归的训练目标是找到最佳的权重参数使得模型的预测结果与实际观测值尽可能一致。这通常通过最大化似然函数或最小化对数损失函数来实现。逻辑回归的应用场景逻辑回归在各个领域都有广泛的应用以下是一些常见的场景垃圾邮件检测逻辑回归可以根据邮件的内容和特征来预测一封邮件是否是垃圾邮件。医学诊断在医学领域逻辑回归可以用于预测患者是否患有某种疾病基于患者的临床特征和实验室检测结果。金融风险管理逻辑回归可用于评估客户违约的概率帮助银行和金融机构做出信贷决策。社交网络分析逻辑回归可以用于社交网络中的用户行为分析例如预测用户是否会点击广告或关注某个话题。逻辑回归的实现这里我们准备封装一个逻辑回归的py文件命名为LogisticRegression.py 这里我们首先需要导入需要的库 from sklearn.metrics import accuracy_score import numpy as npaccuracy_score函数用于计算分类模型的准确率它是一个评估分类模型性能的常用指标。准确率表示正确分类的样本数量占总样本数量的比例。在机器学习中通常希望模型的准确率越高越好因为它衡量了模型对数据的分类能力。之后我们定义一个LogisticRegression类接下来的代码我们将写在此类中首先是初始化函数 def __init__(self):初始化LinearRegression模型self.coef_ None # 系数self.interception_ None # 截距self._theta Noneself.coef_ None 创建了一个对象属性coef_并将其初始化为None。coef_通常用来存储线性回归模型的系数也称为权重这些系数用于预测目标变量。在初始化时这些系数还没有被计算因此被设置为None。 self.interception_ None 创建了一个对象属性interception_并将其初始化为None。interception_通常用来存储线性回归模型的截距也就是模型在特征值为零时的预测值。在初始化时截距也还没有被计算因此被设置为None。 self._theta None 最后一行代码创建了一个对象属性_theta同样初始化为None。这个属性可能用于存储模型的参数系数和截距但是它以一个下划线 _ 开头这通常表示该属性是类内部使用的不应该直接被外部访问或修改。之后我们定义一个逻辑回归特有的函数 def sigmoid(self, t):return 1 / (1 np.exp(-t))这个函数用来计算Sigmoid函数的值。Sigmoid函数的数学表达式如下其中 t t t 是输入参数。函数使用NumPy库中的np.exp()函数计算 e e e的负t次方然后将1除以这个结果得到Sigmoid函数的值。Sigmoid函数的输出范围是0到1之间当 t t t趋向于正无穷时Sigmoid函数趋近于1而当 t t t趋向于负无穷时Sigmoid函数趋近于0。这使得Sigmoid函数在二分类问题中常用于将线性输出映射到概率值。之后我们定义fit函数用于训练模型采用的方法是批量梯度下降来最小化逻辑回归的损失函数从而找到最优的模型参数这里我将进行详细说明 def fit(self, x_train, y_train, eta0.01, n_iters1e4, epsilon1e-8):根据给定的x_train和y_train 使用梯度下降法训练LogisticRegression模型def J(theta, X_b, y): # 计算损失函数J的值theta是参数y_hat self.sigmoid(X_b.dot(theta))try:return -np.sum(y * np.log(y_hat) (1 - y) * np.log(1 - y_hat)) / len(X_b) # 稍微有点理解迷糊y真实减去y预测平方然后除以个数except:# 返回一个float的最大值return float(inf)def dJ(theta, X_b, y): # theta是一个向量y_hat self.sigmoid(X_b.dot(theta))return X_b.T.dot(y_hat - y) / len(X_b)def gradient_descent(X_b, y, initial_theta, eta, n_iters, epsilon): # 传入一个最大迭代次数1万theta initial_thetaiters 0while iters n_iters:gradient dJ(theta, X_b, y)last_theta thetatheta theta - gradient * etaif abs(J(theta, X_b, y) - J(last_theta, X_b, y)).all() epsilon: # 这里应该是all还是any? 结果好像是一样不加会报错breakiters 1return thetaX_b np.hstack([np.ones((len(x_train), 1)), x_train])# 根据给定的x_train计算出X_binitial_theta np.zeros(X_b.shape[1])# 创建出一个空的theta向量self._theta gradient_descent(X_b, y_train, initial_theta, eta, n_iters, epsilon)self.interception_ self._theta[0]self.coef_ self._theta[1:]return selfdef fit(self, x_train, y_train, eta0.01, n_iters1e4, epsilon1e-8): 这是fit方法的定义它接受训练数据x_train和对应的目标变量y_train作为输入还包括三个可选参数eta学习率默认为0.01、n_iters最大迭代次数默认为1万、epsilon用于判断收敛的小量值默认为1e-8。 def J(theta, X_b, y): 这是一个内部函数用于计算损失函数的值。传入参数包括模型参数theta、带有偏置项的训练数据X_b以及目标变量y。损失函数的定义使用了逻辑回归的交叉熵损失函数。 def dJ(theta, X_b, y): 这是另一个内部函数用于计算损失函数关于参数theta的梯度。梯度是损失函数关于参数的导数它告诉我们在当前参数值下损失函数增加最快的方向。这里使用了逻辑回归的梯度计算公式。 def gradient_descent(X_b, y, initial_theta, eta, n_iters, epsilon): 这是用于执行梯度下降法的内部函数。它接受训练数据X_b、目标变量y、初始参数initial_theta、学习率eta、最大迭代次数n_iters以及收敛判定值epsilon。在循环中它计算梯度并更新参数直到满足停止条件收敛或达到最大迭代次数。 X_b np.hstack([np.ones((len(x_train), 1)), x_train]) 这一行代码创建了一个新的特征矩阵X_b通过在训练数据前面添加一列全为1的列来实现以处理截距项。 initial_theta np.zeros(X_b.shape[1]) 这一行代码创建了一个初始的参数向量initial_theta并将其初始化为全零向量。 self._theta gradient_descent(X_b, y_train, initial_theta, eta, n_iters, epsilon) 这一行代码调用了gradient_descent函数使用梯度下降法来训练模型并获得最优的参数向量self._theta。 self.interception_ self.theta[0] self.coef self.theta[1:] 这两行代码将参数向量self.theta中的第一个元素作为截距项赋值给self.interception将其余的元素作为系数赋值给self.coef。 return self 最后fit方法返回模型对象自身以便进行链式操作。这里我们再定义一个随机梯度下降 def fit_sgd(self, X_train, y_train, n_iters5, t05, t150): # 这里的n_iters代表整个数据看几轮不能取10000assert X_train.shape[0] y_train.shape[0]def dJ_sgd(theta, X_b_i, y_i): # 计算梯度,不需要m了因为是随机挑选出一行数据return X_b_i.T.dot(X_b_i.dot(theta) - y_i) * 2def sgd(X_b, y, initial_theta, n_iters, t05, t150): # 随机梯度下降法def learning_rate(t):return t0 / (t t1)theta initial_thetam len(X_b)for cur_iter in range(n_iters): random_indexs np.random.permutation(m) # 随机打乱样本X_b_new X_b[random_indexs]y_new y[random_indexs]for i in range(m):gradient dJ_sgd(theta, X_b_new[i], y_new[i])theta theta - gradient * learning_rate(cur_iter * m i)return thetaX_b np.hstack([np.ones((len(X_train), 1)), X_train])initial_theta np.random.randn(X_b.shape[1])self._theta sgd(X_b, y_train, initial_theta, n_iters, t05, t150)self.interception_ self._theta[0]self.coef_ self._theta[1:]def fit_sgd(self, X_train, y_train, n_iters5, t05, t150):这是fit_sgd方法的定义与之前的方法不同它使用随机梯度下降来训练模型。接受训练数据X_train和对应的目标变量y_train以及可选的参数n_iters迭代轮数默认为5表示整个数据集会被遍历5次、t0 和 t1用于计算学习率的超参数默认分别为5和50。 assert X_train.shape[0] y_train.shape[0] 这一行代码用于确保训练数据X_train和目标变量y_train的样本数量一致以避免数据维度不匹配的问题。 def dJ_sgd(theta, X_b_i, y_i): 这是一个内部函数用于计算随机梯度下降的梯度。传入参数包括模型参数 theta、一个样本的特征向量 X_b_i以及对应的目标变量 y_i。梯度计算使用了逻辑回归的梯度公式但仅针对单个样本。 def sgd(X_b, y, initial_theta, n_iters, t05, t150): 这是执行随机梯度下降的内部函数。它接受特征矩阵 X_b、目标变量 y、初始参数 initial_theta、迭代轮数 n_iters以及学习率计算的超参数 t0 和 t1。 learning_rate(t) 是一个学习率调度函数根据当前迭代轮数 t 来计算学习率。学习率在每轮迭代中都会发生变化起初较大后来逐渐减小这有助于随机梯度下降的收敛。随机梯度下降的主要循环包括迭代整个数据集 n_iters 次。在每次迭代中首先对样本进行随机打乱打乱顺序然后遍历每个样本计算梯度并更新参数。 X_b np.hstack([np.ones((len(X_train), 1)), X_train]) 这一行代码与之前类似将原始特征矩阵 X_train 转换为带有截距项的特征矩阵 X_b。 initial_theta np.random.randn(X_b.shape[1]) 这一行代码创建了一个随机初始化的参数向量 initial_theta用作随机梯度下降的起点。 self._theta sgd(X_b, y_train, initial_theta, n_iters, t05, t150) 这一行代码调用了 sgd 函数来执行随机梯度下降训练模型并获取最优的参数向量 self._theta。 self.interception_ self.theta[0] self.coef self.theta[1:] 这两行代码将参数向量 self.theta 中的第一个元素作为截距项赋值给 self.interception将其余的元素作为系数赋值给 self.coef。最后我们进行预测的处理 def predict_prob(self, X_predict):X_b np.hstack([np.ones((len(X_predict), 1)), X_predict])return self.sigmoid(X_b.dot(self._theta))def predict(self, X_predict):return np.array(self.predict_prob(X_predict) 0.5, dtypeint)def score(self, x_predict, y_test):y_predict self.predict(x_predict)return accuracy_score(y_test, y_predict)def __repr__(self):return LogisticRegression() predict_prob(self, X_predict): 这个方法用于对输入的特征数据 X_predict 进行预测并返回预测的概率值。首先它将输入数据 X_predict 扩展为带有截距项的特征矩阵 X_b然后使用模型的参数 _theta 和 sigmoid 函数来计算每个样本的概率值。这个方法返回的是每个样本属于正类别的概率值范围在0到1之间。 predict(self, X_predict): 这个方法使用 predict_prob 方法返回的概率值来进行二分类预测。它将概率值与阈值0.5进行比较如果概率值大于等于0.5则预测为正类别1否则预测为负类别0。返回的结果是一个包含0和1的数组表示每个样本的预测类别。 score(self, x_predict, y_test): 这个方法用于评估模型的性能。它接受输入数据 x_predict 和对应的真实目标变量 y_test并使用 predict 方法来进行预测。然后它计算模型的准确率Accuracy分数通过与真实标签进行比较来确定模型的预测精度。最终这个方法返回模型的准确率作为性能评估的指标。 repr(self): 这是一个特殊方法用于定义模型对象的字符串表示。当您创建模型对象并尝试打印它时将返回该字符串以便更好地描述模型。在这里字符串表示简单地返回了 “LinearRegression()”表示这是一个线性回归模型。接下来我们用鸢尾花数据进行实践一下首先还是导入库 from sklearn.datasets import load_iris from LogisticRegression import LogisticRegression import numpy as np之后做一些前期数据选择分割数据集的准备 iris load_iris() y iris.target X iris.data[y2,:2] y y[y2] plt.scatter(X[y0,0],X[y0,1]) plt.scatter(X[y1,0],X[y1,1]) plt.show() X_train,X_test,y_train,y_test train_test_split(X,y)运行结果如下之后我们进行拟合预测 log_reg LogisticRegression() log_reg.fit(X_train,y_train) log_reg.score(X_test,y_test)运行结果如下之后我们创建一个用于可视化模型决策会边界的函数 def x2(clf,x1):return (-clf.interception_-x1*clf.coef_[0])/clf.coef_[1]并绘制图像 x_plot np.linspace(4,7,100) y_plot x2(log_reg,x_plot) plt.plot(x_plot,y_plot,colorr) plt.scatter(X[y0,0],X[y0,1]) plt.scatter(X[y1,0],X[y1,1]) plt.show()plt.scatter(X[y 0,0], X[y 0,1]) 和 plt.scatter(X[y 1,0], X[y 1,1]) 这两行代码用于绘制数据点的散点图。第一行绘制了属于类别0的数据点第二行绘制了属于类别1的数据点。这样你可以在图中看到不同类别的数据点的分布情况。运行结果如下接下来我们用测试集来演示一下 plt.plot(x_plot,y_plot,colorr) plt.scatter(X_test[y_test0,0],X_test[y_test0,1]) plt.scatter(X_test[y_test1,0],X_test[y_test1,1]) plt.show()挑战与创造都是很痛苦的但是很充实。

查看全文

http://www.hkea.cn/news/14409463/