当前位置: 首页 > news >正文

pc端网站怎么做自适应个人优秀网站

pc端网站怎么做自适应,个人优秀网站,网络推广的基本手段,百度云用流量做网站目录 Cumulative Gain Target Transformation Cumulative Gain 如果采用与累积效应曲线完全相同的逻辑#xff0c;但将每个点乘以累积样本 Ncum/N#xff0c;就会得到累积增益曲线。现在#xff0c;即使曲线的起点具有最高的效果#xff08;对于一个好的模型来说#x…目录 Cumulative Gain Target Transformation Cumulative Gain 如果采用与累积效应曲线完全相同的逻辑但将每个点乘以累积样本 Ncum/N就会得到累积增益曲线。现在即使曲线的起点具有最高的效果对于一个好的模型来说它也会因为相对规模较小而缩小。看一下代码变化在于我现在每次迭代都会将效果乘以行/大小。此外我还可以选择按 ATE 对曲线进行归一化处理这就是为什么我还要在每次迭代时从效果中减去归一化处理的原因 def cumulative_gain_curve(df, prediction, y, t,ascendingFalse, normalizeFalse, steps100):effect_fn effect(tt, yy)normalizer effect_fn(df) if normalize else 0size len(df)ordered_df (df.sort_values(prediction, ascendingascending).reset_index(dropTrue))steps np.linspace(size/steps, size, steps).round(0)effects [(effect_fn(ordered_df.query(findex{row}))-normalizer)*(row/size)for row in steps]return np.array([0] effects)cumulative_gain_curve(test_pred, cate_pred, sales, discounts) 如果您不想费心实现所有这些函数可以使用Python库为您处理这些问题。您可以简单地从fklearn因果模块中导入所有曲线及其AUC from fklearn.causal.validation.auc import * from fklearn.causal.validation.curves import * 三种模型的累积增益和归一化累积增益如下图所示。在这里CATE 排序较好的模型是曲线与代表 ATE 的虚线之间面积最大的模型要将模型性能总结为一个数字只需将归一化累积增益曲线上的数值相加即可。就 CATE 排序而言数值最大的模型将是最佳模型。下面是您目前评估的三个模型的曲线下面积AUC。请注意ML 模型的面积为负值因为它对 CATE 进行了反向排序 AUC for rand_m_pred: 6.0745233598544495 AUC for ml_pred: -45.44063124684 AUC for cate_pred: 181.74573239200615 同样您可以将模型的性能浓缩为一个数字这一点也非常了不起因为它可以自动选择模型。不过虽然我很喜欢最后这条曲线但在使用时还是需要注意一些问题。首先在你看到的所有曲线中重要的是要记住曲线中的每个点都是一个估计值而不是地面真实值。它是对某一特定群体--有时是非常小的群体--的回归斜率的估计值。既然是回归估计值它就取决于 T 和 Y 之间的关系是否正确。即使是随机化如果治疗与干预结果之间的关系是一个对数函数那么将效果估计为一条直线就会得出错误的结果。如果知道干预反应函数的形状就可以将效应函数调整为 y~log(t) 的斜率而不是 y~t。但要做到这一点您需要知道正确的形状。 其次这些曲线并不真正关心你是否正确地计算了 CATE。它们只关心排序是否正确。例如如果您将任何一个模型的预测值减去-1,000它们的累积增益曲线将保持不变。因此即使您对 CATE 的估计存在偏差这种偏差也不会在这些曲线中显示出来。现在如果您只关心干预的优先次序这可能不是问题。在这种情况下排序就足够了。但是如果您关心的是如何精确估算 CATE那么这些曲线可能会误导您。如果您有数据科学背景您可以将累积增益曲线与 ROC 曲线相提并论。同样具有良好 ROC-AUC 的模型并不一定经过校准。 第三或许也是最重要的一点上述所有方法都需要无偏差数据。如果存在任何偏差你对分组或 ATE 的效果估计都将是错误的。如果干预不是随机的从理论上讲你仍然可以使用这些评估技术前提是你之前通过使用 IPW 的正交化等方法对数据进行了去偏差处理。不过我对此有点怀疑。相反我强烈建议你投资一些实验数据哪怕只是一点点只用于评估目的。这样您就可以专注于效应异质性而不必担心混杂因素的悄然出现。 因果模型评估是一个仍在发展中的研究领域。因此它仍有许多盲点。例如目前展示的曲线只能告诉您一个模型在 CATE 排序方面有多好。我还没有找到一个很好的解决方案来检查您的模型是否能正确预测 CATE。我喜欢做的一件事是在使用累积增益曲线的同时使用量子效应曲线图因为前者能让我了解模型的校准程度后者能让我了解模型对 CATE 的排序情况。至于归一化累积增益它只是一个使可视化更容易的放大图。但我承认这并不理想。如果你正在寻找像 R2 或 MSE 这样的总结性指标--它们都是预测模型中常用的指标--我很遗憾地告诉你在因果建模领域我还没有找到与它们类似的指标。不过我还是找到了目标转换。 Target Transformation 事实证明即使无法观察到真实的干预效果 也可以创建一个目标变量来近似预期效果 其中μy 是干预结果的模型μt 是治疗的模型。这个目标很有意思因为 . 请注意它看起来很像回归系数的计算公式分子是 Y 与 T 之间的协方差分母是 T 的方差。不过它不是用期望值来定义的而是在单位水平上计算的。 由于该目标近似于真实干预效果您可以用它来计算偏差指标如均方误差 (MSE)。如果您的 CATE 模型在预测个体水平效应 方面表现良好那么相对于该目标其预测的 MSE 应该很小。 但有一个问题。当接近干预平均值时该目标的噪声会非常大分母会趋向于零。要解决这个问题可以对 较小的点进行加权使其重要性降低。例如您可以通过 对单位进行加权 要对此目标进行编码您可以简单地划分结果和治疗模型的残差 X [C(month), C(weekday), is_holiday, competitors_price]y_res smf.ols(fsales ~ {.join(X)}, datatest).fit().residt_res smf.ols(fdiscounts ~ {.join(X)}, datatest).fit().residtau_hat y_res/t_res 接下来您可以使用它来计算所有模型的MSE。注意我也如何使用前面讨论的权重 from sklearn.metrics import mean_squared_errorfor m in [rand_m_pred, ml_pred, cate_pred]:wmse mean_squared_error(tau_hat, test_pred[m],sample_weightt_res**2)print(fMSE for {m}:, wmse) 根据这个加权MSE再次用于估计CATE的回归模型比其他两个表现更好。还有这里还有一些有趣的东西。ML模型的性能比随机模型要差。这并不奇怪因为ML模型试图预测Y而不是τi。 只有当效应与结果相关时预测 Y 才能很好地对 τi 进行排序或预测。这种情况一般不会发生但在某些情况下可能会发生。其中有些情况在商业中相当常见因此值得一探究竟。
http://www.hkea.cn/news/14526353/

相关文章:

  • 永兴县网站建设服务商网站的基本要素
  • 网站定制排名企业信息管理系统案例
  • 如何将网站搭在阿里云网站设计注册怎么做
  • 申请域名后 怎么把网站部署上去建设贷款网站哪家好
  • 长沙网站服务器南宁网站建设nayuwang
  • 响应式旅行社展业网站开发调研报告wordpress自定义编辑器
  • 东莞建站模板代理电子商务网站建设中应注意哪些问题
  • 静态网站怎么做百度推广网页设计教程这本书讲什么
  • 北京网站手机站建设公司电话wordpress更改文章宽度
  • 我的世界有什么做的视频网站网站建设中啥意思
  • 上海模板建站多少钱自建网站工具
  • 网站备案密码找回中建三局招聘出国务工
  • 石家庄市栾城区建设局网站app网站的电话是什么
  • 网站设计深圳公司网站建设 技术可行性
  • 北海市网站建设一般通过男网友
  • 如何建设网站站点东莞标志设计公司
  • 京东第一次做网站网络项目资源网
  • 画廊网站建设wordpress 取一类文章
  • 做网站可以使用rem单位吗网站点击排名优化
  • 网站换域名做301六安网站建设找哪家
  • 跨境电商网站建设开发杭州点餐app开发
  • 青海格尔木建设局网站免费空间做淘宝客网站
  • 网站的会员系统怎么做wordpress 轻博客主题
  • 哪个网站可以做身份核验温州捷创网站建设
  • 辽宁营销型网站建设云南省城乡建设厅网站
  • 浙江建设信用网新网$网站优化
  • 怎么优化网站关键词网站及网页设计费用
  • 德保网站建设研究生培训机构排名
  • 美食分享网站怎么做网站关键词和网页关键词的样本
  • 随州网站建设有限公司网站建设 电子政务