当前位置: 首页 > news >正文

做营销型网站公司崇左网页设计

做营销型网站公司,崇左网页设计,手机模板网站生成制作软件,网站推广任务 ip点击DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseli… DataWhale 机器学习夏令营第三期 学习记录二 (2023.08.23)——可视化分析1.赛题理解2. 数据可视化分析2.1 用户维度特征分布分析2.2 时间特征分布分析 DataWhale 机器学习夏令营第三期 ——用户新增预测挑战赛 学习记录二 (2023.08.23)——可视化分析 2023.08.17 已跑通baseline换为lightgbm基线不加任何特征线上得分0.52214 添加baseline特征线上得分0.78176 暴力衍生特征并微调模型参数线上得分0.86068 2023.08.23 数据分析、衍生特征0.87488 衍生特征、模型调参0.89817 交流分享视频 【DataWhale“用户新增预测挑战赛”交流分享-哔哩哔哩】 https://b23.tv/zZMLtFG 1.赛题理解 这次比赛特征主要可以分为以下三个维度 行为维度eid、udmap udmap的key处理成了类别特征 时间维度common_ts 进行了时间戳特征的提取day, hour, minute 用户维度x1~x8 2. 数据可视化分析 使用以下代码绘制前还需做一些设置具体可以参考如下链接 https://www.kaggle.com/code/jcaliz/ps-s03e02-a-complete-eda/notebook 该notebook内提供了丰富的可视化分析代码和思路值得参考。 绘制代码 def plot_cate_large(col):data_to_plot (all_df.groupby(set)[col].value_counts(True)*100)fig, ax plt.subplots(figsize(10, 6))sns.barplot(datadata_to_plot.rename(Percent).reset_index(),hueset, xcol, yPercent, axax,orientv,hue_order[train, test])x_ticklabels [x.get_text() for x in ax.get_xticklabels()]# Secondary axis to show mean of targetax2 ax.twinx()scatter_data all_df.groupby(col)[target].mean()scatter_data.index scatter_data.index.astype(str)ax2.plot(x_ticklabels,scatter_data.loc[x_ticklabels],linestyle, marker., colorcolors[4],markersize15)ax2.set_ylim([0, 1])# Set x-axis tick labels every 5th valuex_ticks_indices range(0, len(x_ticklabels), 5)ax.set_xticks(x_ticks_indices)ax.set_xticklabels(x_ticklabels[::5], rotation45, haright)# titlesax.set_title(f{col})ax.set_ylabel(Percent)ax.set_xlabel(col)# remove axes to show only one at the endhandles []labels []if ax.get_legend() is not None:handles ax.get_legend().legendHandleslabels [x.get_text() for x in ax.get_legend().get_texts()]else:handles ax.get_legend_handles_labels()[0]labels ax.get_legend_handles_labels()[1]ax.legend().remove()plt.legend(handles, labels, locupper center, bbox_to_anchor(0.5, 1.08), fontsize12)plt.tight_layout()plt.show() 2.1 用户维度特征分布分析 可视化分析说明 研究离散变量[eid, x3, x4, x5‘,x1, x2, x6,x7, x8]的分布蓝色是训练集黄色是验证集分布基本一致粉色的点是训练集下每个类别每种取值的target的均值也就是target1的占比 该图主要分析类别数较少的离散变量 训练集和测试集分布比较均匀x1主要集中在 x14 x2分布比较均匀x6基本集中在1和4两个值x7分布比较均匀可能是一个关键特征x8可能是性别特征特征重要性较低udmap_key为提取出的特征存在缺失值 x3主要集中在41下占比太大特征重要性很低 x4中各个类别下target的分布变化较大可能是一个关键特征 x5中各个类别同x4,target的分布变化较大可能是一个关键特征但特征数量太多在衍生特征时需要注意避免产生稀疏性 2.2 时间特征分布分析 主要绘制了common_ts中 day 和 hour 的变化情况 day的值和用户增长有很大的关系可以发现在10、14和17新用户有明显的增长老用户对应也呈现出增长趋势 绘制了从day10到day18的新老用户变化情况新老用户的数量在每天的各个时间段呈现基本相同的趋势进一步观察原始数据可以发现三个峰的出现是因为在该三个时间段数据量较其他时间段多可以进一步绘制出各个时间段人数占全天人数的占比图来进一步分析数据
http://www.hkea.cn/news/14427476/

相关文章:

  • 长沙百度网站排名优化王也身高
  • seo推广团队北京新站优化
  • 莱芜网站seo如何做自己的小说网站
  • 中山网站建设开发海外平台有哪些
  • 天津手机版建站系统价格网站建设开发团队介绍
  • 做音乐网站多少钱申请网站免费
  • 郑州网站seo外包长沙房价2022年最新房价
  • 一级a做爰片免费网站丶网站免费源码大全不用下载
  • 长春专业做网站的公司网站开发项目流程图模板
  • 安溪网站建设重庆建设工程信息网官网官方
  • wordpress密码网站建设优化服务市场
  • 宁波网站建设开发服务网站建设是属于软件吗
  • 阿里云 wordpress建站网站低保图用什么做
  • 怎么做好网站搜索引擎优化购物网站建设的需求
  • 网站开发api和微端wordpress 小工具原理
  • 绵阳网站建站公司网站的维护
  • 郑州网站建设哪家公司好做网站交接什么时需要交接
  • 精品网的功能和服务网站大图片优化
  • 详情页制作模板seo 服务
  • .net网站开发中注册页面凡科快图官网下载
  • 哪些网站用.ren域名电子商务平台名词解释
  • 网站开发主要职责找回网站后台
  • 网站建设阐述网页和网站区别是什么
  • 怎么做网站的访问量网站开发及维护招聘
  • 吉林省软环境建设网站花房姑娘直播
  • 咸宁网站定制成都旅游必去景点有哪些
  • 淘客做的领券网站php能开发大型网站
  • 网站程序上传工具呼和浩特房地产网站建设
  • 首钢建设二公司网站郑州网站优化公司
  • 如何更快的学习.net网站开发网站建设业务前景