当前位置: 首页 > news >正文

路由器 做网站做网站可以找设计公司吗

路由器 做网站,做网站可以找设计公司吗,自己做网站需要花钱吗,门户网站后台建设模块正规方程求解线性回归 首先正规方程如下#xff1a; Θ ( X T X ) − 1 X T y \begin{equation} \Theta (X^T X)^{-1} X^T y \end{equation} Θ(XTX)−1XTy​​ 接下来通过线性代数的角度理解这个问题。 二维空间 在二维空间上#xff0c;有两个向量 a a a和 b b b Θ ( X T X ) − 1 X T y \begin{equation} \Theta (X^T X)^{-1} X^T y \end{equation} Θ(XTX)−1XTy​​ 接下来通过线性代数的角度理解这个问题。 二维空间 在二维空间上有两个向量 a a a和 b b b若 b b b投影到 a a a要怎么做很简单做垂线 那么投影后的向量记为 p p p那么 b b b和 p p p之间的error记为 e b − p eb-p eb−p。同时 p p p在 a a a上所以 p p p一定是 a a a的 x x x标量倍记为 p x a pxa pxa。因为 e e e垂直 a a a所以 a T ( b − x a ) 0 a^T(b-xa)0 aT(b−xa)0 即 x a T a a T b xa^Taa^Tb xaTaaTb得到 x a T b a T a x\frac{a^Tb}{a^Ta} xaTaaTb​ 那么 p x a a a T b a T a pxaa\frac{a^Tb}{a^Ta} pxaaaTaaTb​ 根据上面的公式如果 a a a翻倍了那么投影不变如果 b b b翻倍了投影也翻倍。投影是由一个矩阵 P P P完成的 p P b pPb pPb那么投影矩阵 P P P P a a T a T a P\frac{aa^T}{a^Ta} PaTaaaT​ 用任何向量乘这个投影矩阵你总会变换到它的列空间中。同时显然有 P T P P^TP PTP , P 2 P P^2P P2P即投影两次的结果还是和第一次一样。 高维空间 为什么要做投影呢 因为 A x b Axb Axb可能无解比如一堆等式比未知数还多就可能造成无解。那么该怎么办只能求解最接近的哪个可能解哪个才是最接近的呢问题是 A x Ax Ax总是在 A A A的列空间中而 b b b不一定在。所以要怎么微调 b b b将它变为列空间中最接近它的那一个那么就将问题换作求解有解的 A x ^ p A\hat{x}p Ax^p。所以得找最好的那个投影 p p p以最好的接近 b b b这就是为什么要引入投影的原因了。 那么我们来看高维空间这里以三维空间举例自然可以推广到n维空间。 现在有一个不在平面上的 b b b向量想要将 b b b投影在平面上平面可以由两个基向量 a 1 a_1 a1​和 a 2 a_2 a2​表示。同样的 b b b投影到平面上的误差记为 e b − p eb-p eb−p这个 e e e是垂直平面的。 p x 1 ^ a 1 x 2 ^ a 2 A x ^ p\hat{x_1}a_1\hat{x_2}a_2A\hat{x} px1​^​a1​x2​^​a2​Ax^我们想要解出 x ^ \hat{x} x^。因为 e e e是垂直平面所以有 b − A x ^ b-A\hat{x} b−Ax^垂直平面即有 a 1 T ( b − A x ^ ) 0 a_1^T(b-A\hat{x})0 a1T​(b−Ax^)0, a 2 T ( b − A x ^ ) 0 a_2^T(b-A\hat{x})0 a2T​(b−Ax^)0表示为矩阵乘法便有 A T ( b − A x ^ ) A e 0 A^T(b-A\hat{x})Ae0 AT(b−Ax^)Ae0 这个形式与二维空间的很像吧。对于 A e 0 Ae0 Ae0可知 e e e位于 A T A^T AT的零空间也就是说 e e e垂直于于 A A A的列空间。由上面式子可得 A T A x ^ A T b A^TA\hat{x}A^Tb ATAx^ATb 继而 x ^ ( A T A ) − 1 A T b \hat{x}(A^TA)^{-1}A^Tb x^(ATA)−1ATb 这不就是我们的正规方程吗。到这里我们的正规方程便推导出来了但为了内容完整我们下面收个尾。 p A x ^ A ( A T A ) − 1 A T b P A ( A T A ) − 1 A T P T P P 2 P pA\hat{x}A(A^TA)^{-1}A^Tb \\ PA(A^TA)^{-1}A^T\\ P^TP\\ P^2P pAx^A(ATA)−1ATbPA(ATA)−1ATPTPP2P 这些结论还是和二维空间上的一样 P T P P^TP PTP , P 2 P P^2P P2P即投影两次的结果还是和第一次一样。 最小二乘法 正规方程的一个常见应用例子是最小二乘法。从线性代数的角度来看正规方程是通过最小二乘法求解线性回归问题的一种方法。以下是正规方程的概述 1. 模型表示 在线性回归中我们假设目标变量 y y y 与特征矩阵 X X X 之间存在线性关系 y ^ X θ \hat{y} X \theta y^​Xθ 其中 y ^ \hat{y} y^​ 是预测值一个 m m m 维列向量。 X X X 是特征矩阵 m × n m \times n m×n每行代表一个样本每列代表一个特征。 θ \theta θ 是模型参数权重向量。 2. 目标函数 我们的目标是最小化预测值与实际值之间的误差通常使用残差平方和 J ( θ ) ∥ y − X θ ∥ 2 J(\theta) \|y - X\theta\|^2 J(θ)∥y−Xθ∥2 3. 求解过程 为了找到使得 J ( θ ) J(\theta) J(θ) 最小的 θ \theta θ我们可以通过对 J ( θ ) J(\theta) J(θ) 关于 θ \theta θ 的导数求解设导数为零 ∇ J ( θ ) − 2 X T ( y − X θ ) 0 \nabla J(\theta) -2X^T(y - X\theta) 0 ∇J(θ)−2XT(y−Xθ)0 展开后得到 X T X θ X T y X^T X \theta X^T y XTXθXTy 4. 正规方程 这个方程称为正规方程其形式为 X T X θ X T y X^T X \theta X^T y XTXθXTy 5. 解的唯一性 若 X T X X^T X XTX 是可逆的即列向量线性无关则可以通过求逆得到参数的解 θ ( X T X ) − 1 X T y \theta (X^T X)^{-1} X^T y θ(XTX)−1XTy 如果 X T X X^T X XTX 不可逆即存在多重共线性则正规方程可能没有唯一解。 6. 几何解释 从几何的角度正规方程可以被视为在特征空间中寻找一个超平面使得目标变量 y y y 的投影与预测值 X θ X \theta Xθ 之间的误差最小化。 总结 正规方程通过线性代数的方法为线性回归提供了解的表达式使得我们可以有效地计算参数。其核心思想是通过最小化残差平方和寻找最佳拟合的线性模型。 梯度下降求解线性回归 import numpy as np def linear_regression_gradient_descent(X: np.ndarray, y: np.ndarray, alpha: float, iterations: int) - np.ndarray:m, n X.shapetheta np.zeros((n, 1))for _ in range(iterations):predictions X thetaerrors predictions - y.reshape(-1, 1)updates X.T errors / mtheta - alpha * updatesreturn np.round(theta.flatten(), 4)其他都好理解下面主要讲梯度updates的推导 1. 定义损失函数 线性回归的损失函数通常是均方误差Mean Squared Error, MSE MSE 1 2 m ∑ i 1 m ( h θ ( x ( i ) ) − y ( i ) ) 2 \text{MSE} \frac{1}{2m} \sum_{i1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2 MSE2m1​i1∑m​(hθ​(x(i))−y(i))2 这里 h θ ( x ( i ) ) X ( i ) ⋅ θ h_\theta(x^{(i)}) X^{(i)} \cdot \theta hθ​(x(i))X(i)⋅θ 是模型的预测值 y ( i ) y^{(i)} y(i) 是实际值。 2. 对损失函数求导 为了最小化损失函数我们需要对参数 θ \theta θ 求导 ∂ MSE ∂ θ ∂ ∂ θ ( 1 2 m ∑ i 1 m ( h θ ( x ( i ) ) − y ( i ) ) 2 ) \frac{\partial \text{MSE}}{\partial \theta} \frac{\partial}{\partial \theta} \left( \frac{1}{2m} \sum_{i1}^{m} (h_\theta(x^{(i)}) - y^{(i)})^2 \right) ∂θ∂MSE​∂θ∂​(2m1​i1∑m​(hθ​(x(i))−y(i))2) 应用链式法则首先求导内部的平方项 ∂ ∂ θ ( h θ ( x ( i ) ) − y ( i ) ) 2 2 ( h θ ( x ( i ) ) − y ( i ) ) ⋅ ∂ h θ ( x ( i ) ) ∂ θ \frac{\partial}{\partial \theta} (h_\theta(x^{(i)}) - y^{(i)})^2 2(h_\theta(x^{(i)}) - y^{(i)}) \cdot \frac{\partial h_\theta(x^{(i)})}{\partial \theta} ∂θ∂​(hθ​(x(i))−y(i))22(hθ​(x(i))−y(i))⋅∂θ∂hθ​(x(i))​ 而且 h θ ( x ( i ) ) X ( i ) ⋅ θ h_\theta(x^{(i)}) X^{(i)} \cdot \theta hθ​(x(i))X(i)⋅θ所以 ∂ h θ ( x ( i ) ) ∂ θ X ( i ) \frac{\partial h_\theta(x^{(i)})}{\partial \theta} X^{(i)} ∂θ∂hθ​(x(i))​X(i) 将这个结果代入 ∂ MSE ∂ θ 1 m ∑ i 1 m ( h θ ( x ( i ) ) − y ( i ) ) X ( i ) \frac{\partial \text{MSE}}{\partial \theta} \frac{1}{m} \sum_{i1}^{m} (h_\theta(x^{(i)}) - y^{(i)}) X^{(i)} ∂θ∂MSE​m1​i1∑m​(hθ​(x(i))−y(i))X(i) 3. 用向量表示 将上述和式转换为向量形式。定义误差向量 errors predictions − y \text{errors} \text{predictions} - y errorspredictions−y 其中 predictions X ⋅ θ \text{predictions} X \cdot \theta predictionsX⋅θ。这样梯度可以表示为 gradient 1 m ( X T ⋅ errors ) \text{gradient} \frac{1}{m} (X^T \cdot \text{errors}) gradientm1​(XT⋅errors) 4. 结论 因此梯度的计算公式来源于损失函数的求导过程通过向量化的方式将每个样本的误差与特征相乘得出对每个参数的影响。这是梯度下降法中更新参数的基础。
http://www.hkea.cn/news/14420757/

相关文章:

  • 无锡网站建济南网站推广服务
  • 陕西建设注册中心网站wordpress keyword
  • 品牌网站设计有哪些建议网络团队
  • 网站建设a2345c 网站开发中间层怎么写
  • 怎么做收费网站手机门户WordPress主题
  • 网店的网站设计方案广告主广告商对接平台
  • 外包软件西安seo服务
  • 做网站视频存储驻马店公司做网站
  • 网站服务器架设中美俄最新军事新闻
  • 中国建设银行注册网站体外产品的研发网站如何建设
  • 网站建设dede什么网站需要经营性备案
  • 企业建立网站的原因合肥网络推广公司乐蜂
  • 网站建设做网站好吗三明住房建设局网站
  • 简洁手机导航网站模板下载安装重大违法建设项目举报网站
  • 国产成年做视频网站wordpress文章怎么写
  • 网站建设优化服务信息招商外包公司
  • server2003网站建设福建高速公路建设指挥部网站
  • 网站做多个页面简述企业网站建设的目的
  • dede旅游网站源码中国建设工程信息网站
  • 做网站如何通过流量赚钱吗photoshop手机版
  • 冠县网站建设价格北京网络运营推广团队
  • 重庆企业网站开发服务五十一团 黑龙江生产建设兵团知青网站
  • 个人博客网站开发开发手机端网站模板
  • html做网站例子制作古城西安网页
  • 百度一对一解答长沙seo优化推广
  • 地图网站怎么做的中国互联网网站性能
  • 唐山网站建设怎么样wordpress大图模板
  • 易联网站制作设计制作公司网站
  • 人力资源网站怎么建设营销型网站的缺点
  • 网教网站源码网站做多久