当前位置: 首页 > news >正文

做营销型网站公司电影网站内页

做营销型网站公司,电影网站内页,个人网站设计需求分析,北仑静态网站建设DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseli… DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseline换为lightgbm基线不加任何特征线上得分0.52214 添加baseline特征线上得分0.78176 暴力衍生特征并微调模型参数线上得分0.86068 2023.08.23 数据分析、衍生特征0.87488 衍生特征、模型调参0.89817 交流分享视频 【DataWhale“用户新增预测挑战赛”交流分享-哔哩哔哩】 https://b23.tv/zZMLtFG 1.赛题理解 这次比赛特征主要可以分为以下三个维度 行为维度eid、udmap udmap的key处理成了类别特征 时间维度common_ts 进行了时间戳特征的提取day, hour, minute 用户维度x1~x8 2. 数据可视化分析 使用以下代码绘制前还需做一些设置具体可以参考如下链接 https://www.kaggle.com/code/jcaliz/ps-s03e02-a-complete-eda/notebook 该notebook内提供了丰富的可视化分析代码和思路值得参考。 绘制代码 def plot_cate_large(col):data_to_plot (all_df.groupby(set)[col].value_counts(True)*100)fig, ax plt.subplots(figsize(10, 6))sns.barplot(datadata_to_plot.rename(Percent).reset_index(),hueset, xcol, yPercent, axax,orientv,hue_order[train, test])x_ticklabels [x.get_text() for x in ax.get_xticklabels()]# Secondary axis to show mean of targetax2 ax.twinx()scatter_data all_df.groupby(col)[target].mean()scatter_data.index scatter_data.index.astype(str)ax2.plot(x_ticklabels,scatter_data.loc[x_ticklabels],linestyle, marker., colorcolors[4],markersize15)ax2.set_ylim([0, 1])# Set x-axis tick labels every 5th valuex_ticks_indices range(0, len(x_ticklabels), 5)ax.set_xticks(x_ticks_indices)ax.set_xticklabels(x_ticklabels[::5], rotation45, haright)# titlesax.set_title(f{col})ax.set_ylabel(Percent)ax.set_xlabel(col)# remove axes to show only one at the endhandles []labels []if ax.get_legend() is not None:handles ax.get_legend().legendHandleslabels [x.get_text() for x in ax.get_legend().get_texts()]else:handles ax.get_legend_handles_labels()[0]labels ax.get_legend_handles_labels()[1]ax.legend().remove()plt.legend(handles, labels, locupper center, bbox_to_anchor(0.5, 1.08), fontsize12)plt.tight_layout()plt.show() 2.1 用户维度特征分布分析 可视化分析说明 研究离散变量[eid, x3, x4, x5‘,x1, x2, x6,x7, x8]的分布蓝色是训练集黄色是验证集分布基本一致粉色的点是训练集下每个类别每种取值的target的均值也就是target1的占比 该图主要分析类别数较少的离散变量 训练集和测试集分布比较均匀x1主要集中在 x14 x2分布比较均匀x6基本集中在1和4两个值x7分布比较均匀可能是一个关键特征x8可能是性别特征特征重要性较低udmap_key为提取出的特征存在缺失值 x3主要集中在41下占比太大特征重要性很低 x4中各个类别下target的分布变化较大可能是一个关键特征 x5中各个类别同x4,target的分布变化较大可能是一个关键特征但特征数量太多在衍生特征时需要注意避免产生稀疏性 2.2 时间特征分布分析 主要绘制了common_ts中 day 和 hour 的变化情况 day的值和用户增长有很大的关系可以发现在10、14和17新用户有明显的增长老用户对应也呈现出增长趋势 绘制了从day10到day18的新老用户变化情况新老用户的数量在每天的各个时间段呈现基本相同的趋势进一步观察原始数据可以发现三个峰的出现是因为在该三个时间段数据量较其他时间段多可以进一步绘制出各个时间段人数占全天人数的占比图来进一步分析数据
http://www.hkea.cn/news/14464490/

相关文章:

  • 网站开发与系统开发室内设计师工作室
  • 中国能建设计公司网站专门代写平台
  • 常用的网站开发语言平面设计和网页设计哪个好
  • 施工程找工程做哪个网站好深圳网站制作建设服务公司
  • 外贸网站模板 外贸网站制作公共资源交易中心有实权吗
  • 做旅游网站用什么颜色永兴网站开发
  • 关于网站建设外文文献柘城网站建设
  • 中国站长网入口做一套网站开发多少钱
  • 安溪网站建设长春市长春网站建设
  • 柳州网站建设数公式大全学历提升销售好做吗
  • 宁波网站建设开发服务wordpress插件pdf
  • 公司网站建设的作用与意义自动化设备东莞网站建设
  • asp做静态网站芜湖网站开发公司
  • 哪个商城网站建设好建设asp网站视频教程
  • 深圳便宜的网站建设百度官网平台
  • 重庆北碚网站建设深圳做app网站公司
  • 企业数据查询网站海曙网站制作
  • 抖音小程序在哪里杭州新站整站seo
  • 做图表好用网站或软件google和百度等相关网站的广告词
  • 网站都要交域名费么公司网址一般是什么
  • 用asp.net做购物网站手机系统网站
  • wordpress用网站测速廊坊seo霸屏
  • 吉林省软环境建设网站三端互通传奇发布网
  • 网站推广存在的问题温州网站的优化
  • 网站keyword如何排列网站建设有什么工作
  • 微信公众号 手机网站七初SEO网站建设
  • 食品行业网站建设网站策划技巧
  • 网站怎么做优化推广seo的实现方式
  • 怎样开网站免费网站大全下载
  • 常州网站建设优化h5营销