当前位置: 首页 > news >正文

怎么把网站做的更好制作一个网站平台

怎么把网站做的更好,制作一个网站平台,世界十大网站开发公司,网站建设更改目录 Diff-in-Diff with Covariates Diff-in-Diff with Covariates 您需要学习的 DID 的另一个变量是如何在模型中包含干预前协变量。这在您怀疑平行趋势不成立#xff0c;但条件平行趋势成立的情况下非常有用#xff1a; 考虑这种情况#xff1a;您拥有与之前相同的营销数…目录 Diff-in-Diff with Covariates Diff-in-Diff with Covariates 您需要学习的 DID 的另一个变量是如何在模型中包含干预前协变量。这在您怀疑平行趋势不成立但条件平行趋势成立的情况下非常有用 考虑这种情况您拥有与之前相同的营销数据但现在您拥有全国多个地区的数据。如果你绘制出每个地区的干预结果和对照结果你会发现一些有趣的现象 mkt_data_all (pd.read_csv(./data/short_offline_mkt_all_regions.csv).astype({date:datetime64[ns]})) 干预前的趋势在一个地区内似乎是平行的但在不同地区之间却不是。因此如果在这里简单地运行 DID 的双向固定效应规范就会得到有偏差的 ATT 估计值 print(True ATT: , mkt_data_all.query(treated*post1)[tau].mean())m smf.ols(downloads ~ treated:post C(city) C(date),datamkt_data_all).fit()print(Estimated ATT:, m.params[treated:post])True ATT: 1.7208921056102682Estimated ATT: 2.068391984256296 您需要以某种方式考虑每个地区的不同趋势。您可能会认为只需在回归中加入地区作为额外的协变量就能解决问题。但请再想一想还记得使用单位固定效应如何消除任何时间固定协变量的影响吗这不仅适用于不可观测的混杂因素也适用于跨时间恒定的地区协变量。最终的结果是天真地将其加入回归是无害的。您将得到与之前相同的结果  m smf.ols(downloads ~ treated:post C(city) C(date) C(region),datamkt_data_all).fit()m.params[treated:post]2.071153674125536 要想在 DID 模型中正确包含干预前协变量您需要回顾一下 DID 的工作原理即估算两个重要部分干预基线和控制趋势。然后将控制趋势投射到治疗基线中。这意味着您必须分别估计每个地区的控制趋势。矫枉过正的做法是对每个地区分别进行差分回归。您可以在各个地区之间循环或者将整个 DID 模型与地区虚拟变量进行交互 m_saturated smf.ols(downloads ~ (post*treated)*C(region),datamkt_data_all).fit() atts m_saturated.params[m_saturated.params.index.str.contains(post:treated)]attspost:treated 1.676808 post:treated:C(region)[T.N] -0.343667 post:treated:C(region)[T.S] -0.985072 post:treated:C(region)[T.W] 1.369363 dtype: float64 请记住ATT 估计值应根据基线组来解释在本例中基线组为东部地区。因此对北部地区的影响为 1.67-0.34对南部地区的影响为 1.67-0.98以此类推。接下来您可以使用加权平均法对不同的 ATT 进行汇总其中一个地区的城市数量就是权重 reg_size (mkt_data_all.groupby(region).size()/len(mkt_data_all[date].unique()))base atts[0]np.array([reg_size[0]*base][(attbase)*sizefor att, size in zip(atts[1:], reg_size[1:])]).sum()/sum(reg_size)1.6940400451471818 尽管我说这是矫枉过正但这其实是个不错的主意。它很容易实现也很难出错。不过它也有一些问题。例如如果你有很多协变量或连续协变量这种方法就不切实际了。因此我认为您应该知道还有另一种方法。与其将区域与治疗后和治疗后虚拟变量交互您可以只与治疗后虚拟变量交互。这个模型将分别估计每个地区受治疗者的趋势治疗前和治疗后的结果水平但它将拟合一个截距移动到受治疗者和治疗后时期 m smf.ols(downloads ~ post*(treated C(region)),datamkt_data_all).fit()m.summary().tables[1] 与 post:treated 相关的参数可以解释为 ATT。它与您之前得到的 ATT 并不完全相同但非常接近。出现这种差异的原因是--您现在应该知道--回归按方差对各地区的 ATT 进行了平均而之前是按地区大小进行平均的。这意味着回归会使干预分布更均匀方差更大的地区占更大比重。 第二种方法运行速度更快但缺点是需要仔细考虑如何进行交互。因此我建议您只有在真正了解自己在做什么的情况下才使用这种方法。或者在使用之前先尝试建立一些模拟数据在这些数据中您知道真实的 ATT然后看看能否用您的模型恢复它。请记住为每个地区运行一个 DID 模型并求取平均结果并不丢人。事实上这是一个特别聪明的想法。
http://www.hkea.cn/news/14481709/

相关文章:

  • 优设设计师网站百度网页地图
  • 专门做护理PDCA的网站企业数字展厅
  • 湖南现在有什么网站做农副产品网站邮箱接口怎么设置
  • 南昌网站排名优化报价唯品会专门做特卖的网站
  • 深圳网站建设主页大学网站群建设方案
  • 网站建设与维护要求wordpress注册直接显示密码错误
  • 网络公司 网站建设两个网站php 一个空间
  • 设计素材网站名称网站专题页怎么做
  • 给朋友做的相册网站没有了iframe框架做网站
  • 做服饰的有哪些网站dede企业网站源码
  • 网站建设在哪个软件下做福建抖音代运营开户
  • 电影网站如何做seowordpress阅读更多标签
  • 怎么用dw做地图网站企业网站建设服务哪家好
  • 济南网站建设李尚荣网站推广公司黄页
  • 太原建设厅网站临沂网站制作公司哪家好
  • 基于o2o的旅游网站建设查看注册过的网站
  • 做响应式网站的流程大型网站系统解决方案
  • 网站制作 用户登录系统wordpress电影站开发
  • wordpress网站采集插件网站开发的具体流程
  • 网站如何推广引流wordpress用什么服务器配置
  • 重庆电商网站建设湖北建设网站信息查询中心
  • 苏州网站建设制作网络公司学校响应式网站模板
  • 厦门企业做网站四川建设发布网
  • 简述一个商务网站建设的步骤中通顺昌建设有限公司网站
  • 网站建设技术方案模板在百度怎么建立自己的网站吗
  • 免费域名分发网站夸克搜索引擎
  • 重庆平台网站建设价格帮人家做网站难吗
  • 做美食分享网站源码网站域名怎么选择
  • 顶尖的设计网站开发公司总经理岗位职责
  • 做网站的人会不会拿走我的网站宝安网站建设深圳信科