当前位置: 首页 > news >正文

有哪些做网站的品牌28创业商机网

有哪些做网站的品牌,28创业商机网,南阳网站排名优化,做网站以后的趋势4.1 Logistic回归算法简介 Logistic回归#xff0c;也称为logistic回归分析#xff0c;是一种广义的线性回归分析模型。它常用于数据挖掘#xff0c;疾病自动诊断#xff0c;经济预测等领域。Logistic回归是一种用于解决二分类问题的机器学习方法#xff0c;可以估计某种事… 4.1 Logistic回归算法简介 Logistic回归也称为logistic回归分析是一种广义的线性回归分析模型。它常用于数据挖掘疾病自动诊断经济预测等领域。Logistic回归是一种用于解决二分类问题的机器学习方法可以估计某种事物的可能性。它是一种线性分类器针对的是线性可分问题。该模型根据给定的自变量数据集来估计事件的发生概率由于结果是一个概率因此因变量的范围在 0 和 1 之间 Logistic回归的名称来源于其使用的逻辑函数该函数将连续的输入映射到位于0和1之间的输出。这个逻辑函数在处理二分类问题时特别有用因此被命名为logistic回归。至于logistic回归的起源它是由统计学家在20世纪初提出的用于解决二项分布的问题。然而它在实际应用中被广泛使用是在二战以后特别是在机器学习和数据挖掘领域。 4.2 算法的基本原理 Logistic回归逻辑回归是一种统计方法主要用于预测二分类多分类不常用不做介绍下同结果称为因变量可以是某疾病是否复发、是否死亡、是否再入院等。逻辑回归的基本思想是使用逻辑函数通常是Sigmoid函数将线性回归模型的输出转换成概率。这种转换使得逻辑回归模型能够处理分类问题尤其是二分类问题。 通俗来讲就是根据数据集进行分类分类的依据标准是概率。找到一个概率阈值例如50%样本属于A类的概率大于50%则为A类反之为B类。但实际上不是所有的数据我们都可以一股脑的将他们填充进模型内部进行训练在统计学中是有前置条件这些特征需要相互独立。 Sigmoid函数 在线性回归模型中输出一般是连续的对于每一个输入x都有一个对应的输出y。该模型的定义域和值域都是无穷的。但是对于分类问题输入可以是连续的[-∞, ∞]但输出则是离散的通常只有两个值0和1。那么如何将输出限制在[0,1]这个区间呢这需要我们找到一个函数∅(x)这个函数必须满足定义域为[-∞,∞]而值域为[0,1]。这样就可以将大于0.5的输出判断为属于1类小于0.5的输出判断为0类这就完成了分类问题的预测。我们选择了Sigmoid函数该函数能够将线性回归问题扩展到非线性回归问题——逻辑回归(Logistic回归)。 首先我们处理二分类问题。由于分成两类我们便让其中一类标签为0另一类为1。Sigmoid函数对于输入的每一组数据都能映射成0~1之间的数。并且如果函数值大于0.5就判定属于1否则属于0。而且函数中需要待定参数通过利用样本训练使得这个参数能够对训练集中的数据有很准确的预测。这个函数就是sigmoid函数该函数可通过公式1计算求得。 图1给出了Sigmoid函数在不同坐标尺度下的两条曲线图。当x为0时Sigmoid函数值为0.5。随着x的增大对应的Sigmoid值将逼近于1;而随着x的减小Sigmoid值将逼近于0。如果横坐标刻度足够大Sigmoid函数看起来很像一个阶跃函数。 图1 Sigmoid函数图 梯度上升法 我们介绍的第一个最优化算法叫做梯度上升法。梯度上升法基于的思想是:要找到某函数的最大值最好的方法是沿着该函数的梯度方向探寻。如果梯度记为▽则函数(x,y)的梯度由下式(2)表示。 这是机器学习中最易造成混淆的一个地方,但在数学上并不难,需要做的只是牢记这些符号的意义。这个梯度意味着要沿x的方向移动 沿y的方向移动 。其中函数f(x,y)必须要在待计算的点上有定义并且可微。梯度上升算法沿梯度方向移动了一步梯度算子总是指向函数值增长最快的方向。这里所说的是移动方向而未提到移动量的大小。该量值称为步长记做α。用向量来表示的话梯度上升算法的选代公式可由公式3表示。该公式将一直被迭代执行直至达到某个停止条件为止比如迭代次数达到某个指定值或算法达到某个可以允许的误差范围。 4.3 算法实例 以疝气病症马的死亡率为列基于Logistic回归算法实现分类。这里的数据包含368个样本和28个特征。从一些文献中了解到疝病是描述马胃肠痛的术语。然而这种病不一定源自马的胃肠问题其他问题也可能引发马疝病。该数据集中包含了医院检测马疝病的一些指标有的指标比较主观有的指标难以测量例如马的疼痛级别。 实例操作可分为五个过程。1.收集数据:给定数据文件。2.准备数据:用Python解析文本文件并填充缺失值。3.分析数据:可视化并观察数据。4.训练算法:使用优化算法找到最佳的系数。5.测试算法:为了量化回归的效果需要观察错误率。根据错误率决定是否回退到训练阶段通过改变迭代的次数和步长等参数来得到更好的回归系数。 收集数据 数据文件以txt格式存储包含368行样本记录每行对应一匹马的检测数据。文件首行为特征名称包括27个客观指标如白细胞计数、体温、心率等和1个主观指标疼痛级别取值范围为1-10的整数。部分记录存在缺失值例如疼痛级别字段中约有15%的数据为空其他客观指标的缺失率低于5%。数据集最后一列为二分类标签0表示存活1表示死亡。 准备数据 loadDataSet的函数其主要功能是从testSet.txt文件中读取数据并将数据处理成特征矩阵dataMat和标签向量labelMat后返回。loadDataSet函数会打开指定的testSet.txt文件逐行读取文件内容对每行数据进行处理提取出特征和标签信息然后将特征存储在dataMat列表中标签存储在labelMat列表中最后返回这两个列表。 相关代码如下 def loadDataSet():     dataMat []; labelMat []     fr open(testSet.txt)     for line in fr.readlines():         lineArr line.strip().split()         dataMat.append([1.0, float(lineArr[0]), float(lineArr[1])])         labelMat.append(int(lineArr[2]))     return dataMat,labelMat 图2 准备数据 分析数据 plotBestFit函数其主要功能是根据给定的权重向量weights对数据集进行可视化展示同时绘制出逻辑回归模型的决策边界。plotBestFit函数接收一个权重向量weights作为输入该权重向量通常是通过逻辑回归的梯度上升等优化算法得到的。函数会加载数据集将数据集中不同类别的样本分别用不同颜色和标记绘制在散点图上并且根据权重向量绘制出逻辑回归模型的决策边界最后显示绘制好的图形。 相关代码如下 def plotBestFit(weights):     import matplotlib.pyplot as plt     dataMat,labelMatloadDataSet()     dataArr array(dataMat)     n shape(dataArr)[0]     xcord1 []; ycord1 []     xcord2 []; ycord2 []     for i in range(n):         if int(labelMat[i]) 1:             xcord1.append(dataArr[i,1]); ycord1.append(dataArr[i,2])         else:             xcord2.append(dataArr[i,1]); ycord2.append(dataArr[i,2])     fig plt.figure()     ax fig.add_subplot(111)     ax.scatter(xcord1, ycord1, s30, cred, markers)     ax.scatter(xcord2, ycord2, s30, cgreen)     x arange(-3.0, 3.0, 0.1)     y (-weights[0]-weights[1]*x)/weights[2]     ax.plot(x, y)     plt.xlabel(X1); plt.ylabel(X2);     plt.show() 图3 分析数据 图4 决策边界 训练算法 gradAscent的函数它实现了梯度上升算法用于求解逻辑回归模型中的最优权重参数。gradAscent函数接收两个参数dataMatIn是输入的特征矩阵classLabels是对应的类别标签向量。函数的目标是通过梯度上升算法找到使得逻辑回归模型似然函数最大化的权重向量。 相关代码如下 def gradAscent(dataMatIn, classLabels):     dataMatrix matrix(dataMatIn)             #convert to NumPy matrix     labelMat matrix(classLabels).transpose() #convert to NumPy matrix     m,n shape(dataMatrix)     alpha 0.001     maxCycles 500     weights ones((n,1))     for k in range(maxCycles):              #heavy on matrix operations         h sigmoid(dataMatrix*weights)     #matrix mult         error (labelMat - h)              #vector subtraction         weights weights alpha * dataMatrix.transpose()* error #matrix mult     return weights 图5 训练算法 测试算法 multiTest函数其功能是多次调用colicTest函数并计算这些调用结果的平均错误率。colicTest函数会返回一个 0 到 1 之间的随机数当作错误率而multiTest函数会多次调用colicTest函数然后计算并输出平均错误率。 相关代码如下 def multiTest():     numTests 10; errorSum0.0     for k in range(numTests):         errorSum colicTest() print (after %d iterations the average error rate is: %f % (numTests, errorSum/float(numTests))) def colicTest():     frTrain open(horseColicTraining.txt); frTest open(horseColicTest.txt)     trainingSet []; trainingLabels []     for line in frTrain.readlines():         currLine line.strip().split(\t)         lineArr []         for i in range(21):             lineArr.append(float(currLine[i]))         trainingSet.append(lineArr)         trainingLabels.append(float(currLine[21]))     trainWeights stocGradAscent1(array(trainingSet), trainingLabels, 1000)     errorCount 0; numTestVec 0.0     for line in frTest.readlines():         numTestVec 1.0         currLine line.strip().split(\t)         lineArr []         for i in range(21):             lineArr.append(float(currLine[i]))         if int(classifyVector(array(lineArr), trainWeights))! int(currLine[21]):             errorCount 1     errorRate (float(errorCount)/numTestVec)     print (the error rate of this test is: %f % errorRate)     return errorRate 图6 测试算法 4.4 六悔铭 六悔铭 北宋名相寇准 官行私曲失时悔富不俭用贫时悔艺不少学过时悔见事不学用时悔醉发狂言醒时悔安不将息病时悔。 它告诉我们人生在世应当珍惜时间及时行乐但也不要忘记自律和自省。无论是为官、为富还是为人都应当以诚信、节俭、学习、自律为准则这样才能避免在人生的道路上留下遗憾。‍‍‍‍‍‍‍‍‍有些事错过了就是一辈子。人生没有回头路每一步都算数每一步都该慎重考虑。谁也不想等到老了坐在摇椅上满脑子都是“如果当初”。
http://www.hkea.cn/news/14339655/

相关文章:

  • 网站改版设计费进什么科目wordpress 一键部署
  • 网站建立时间查询管理咨询公司利润率
  • 自己做网站需要什么软件下载网络服务单位招标
  • 邢台哪有学做网站的苏州网站开发建设公司
  • 深圳网站建设便宜信科网络网站建设前期应该做哪些准备
  • 站长统计是什么意思微信公众号怎么开发小程序
  • 服务类网站建设策划书做外贸怎样上国外网站
  • 公司网站建设属于软件销售如何统计网站访问量
  • 海东市城市规划建设局网站园林建设网站
  • 长宁网站设计广州市区
  • 网站统计排名西安网站推广
  • iis默认网站路径活动软文模板
  • 网站飘动开发购物平台网站费用
  • 查询建设资质的网站仿造整个网站
  • 微网站 网页黄页官网
  • 沈阳网站制作列表网wordpress获取自定义分类名
  • 福州企业网站建设建设考试网站
  • 网站建设公司的市场开发方案网站制作要多少钱
  • 美橙互联建站中国电子商务平台有哪些
  • 广州建设工程中心网站做期货网站
  • 河北省建设厅官方网站顺德网站建设价格
  • 建设网站的视频专科函授网页设计实训报告
  • 网站开发属于无形资产吗域名注册多少钱
  • 丰南建设局网站山东城市建设职业学院图书馆网站
  • 网络购物网站备案seo81
  • 美食介绍网站模板做地方网站论坛
  • 网站后台 ftp网络培训的优点包括
  • 公司网站建设好室内装修公司需要什么资质
  • 基于phpt漫画网站开发百度地图导航手机版免费下载
  • 食品网站的网页设计怎么不花钱建网站