当前位置: 首页 > news >正文

网站建设推广岗位深圳网站开发

网站建设推广岗位,深圳网站开发,汉口北做网站,宁波seo网站建设费用pandas pandas是基于python写的#xff0c;底层的数据结构是Numpy数据(ndarray)。pandas自身有两个核心的数据结构#xff1a;DataFrame和Series#xff0c;前者是二维的表格数据结构#xff0c;后者是一维标签化数组。 polars polars是用Rust#xff08;一种系统级编程…pandas pandas是基于python写的底层的数据结构是Numpy数据(ndarray)。pandas自身有两个核心的数据结构DataFrame和Series前者是二维的表格数据结构后者是一维标签化数组。 polars polars是用Rust一种系统级编程语言具有非常好的并发性和性能写的支持Python、Rust和NodeJS。主要特性有 快Polars从零开始没有任何扩展依赖底层设计import速度非常快。I/O完美支持常见的数据存储层本地、云存储、数据库。使用简单使用它的内置操作Polars内部决定使用最有效的方法执行。核外Polars支持使用它的streaming API操作核外数据转化。基于磁盘的内存映射技术大数据下允许数据在磁盘和内存之间进行高效的交换。可以处理比机器可用RAM更大的数据集。并行Polars在不增加额外配置事会充分利用机器可利用的cpu可利用的所有核。矢量查询引擎Polars使用Apache Arrow一种列式数据格式Arrow内存格式支持零拷贝读取以实现闪电般快速的数据访问而无需序列化开销。以矢量的方式处理queries。它使用SIMD单指令多数据一种并行处理方式优化CPU的利用。 pandas vs polars 性能pandas提供了强大的数据分析功能对处理小数据集更方便。polars利用多线程和内存映射技术具有更快的速度适合处理大型数据集。 内存使用Pandas在加载数据时需要将其完全读入内存polars支持streaming API操作核外数据转化可以在处理大型数据集时降低内存使用从而减少了内存限制。 数据操作pandas具有丰富的数据操作和处理方法使用DataFrame进行数据清洗、转换、分组、聚合等操作Polars提供了类似于SQL的查询操作使得对数据进行筛选、转换和聚合更加直观。 生态系统pandas已经非常成熟具有大量的学习文档、教程和扩展库polars相对较新对应的文档、教程等资源较少。 适用场景pandas更适用于中小型数据集的数据分析和处理polars更适用于大型数据集或追求更高性能的数据分析和处理场景。 运行时间对比 数据读取 # train.parquet: 2.35G %time train_pdpd.read_parquet(/Users/Downloads/archive/train.parquet) #Pandas dataframe %time train_plpl.read_parquet(/Users/Downloads/archive/train.parquet) #Polars dataframeCPU times: user 3.85 s, sys: 8.69 s, total: 12.5 s Wall time: 10.4 s CPU times: user 3.07 s, sys: 2.22 s, total: 5.29 s Wall time: 3.39 s 聚合操作 %%time # pandas query nums [num_7, num_8, num_9, num_10, num_11, num_12, num_13, num_14, num_15] cats [cat_1, cat_2, cat_3, cat_4, cat_5, cat_6] train_pd[nums].agg([min,max,mean,median,std]) %%time # Polars query train_pl.with_columns([ pl.col(nums).min().suffix(_min), pl.col(nums).max().suffix(_max), pl.col(nums).mean().suffix(_mean), pl.col(nums).median().suffix(_median), pl.col(nums).std().suffix(_std), ])CPU times: user 6.06 s, sys: 4.19 s, total: 10.3 s Wall time: 15.8 s CPU times: user 4.51 s, sys: 5.49 s, total: 10 s Wall time: 8.09 s 查询后计算 # Pandas filter and select %time train_pd[train_pd[cat_1]1][nums].mean() # Polars filter and select %time train_pl.filter(pl.col(cat_1) 1).select(pl.col(nums).mean()) CPU times: user 730 ms, sys: 1.65 s, total: 2.38 s Wall time: 4.24 s CPU times: user 659 ms, sys: 3.22 s, total: 3.88 s Wall time: 2.12 s 分类再聚合 %time Function_3 train_pd.groupby([user])[nums].agg(mean) %time Function_3 train_pl.groupby(user).agg(pl.col(nums).mean())CPU times: user 2.4 s, sys: 938 ms, total: 3.33 s Wall time: 3.46 s CPU times: user 6.92 s, sys: 2.68 s, total: 9.6 s Wall time: 1.78 s 分组的列逐渐增加 # PANDAS: TESTING GROUPING SPEED ON 5 COLUMNS cols [] for cat in [user, cat_1, cat_2, cat_3, cat_4]:cols[cat] sttime.time() temptrain_pd.groupby(cols)[num_7].agg(mean) entime.time() print(f{cat}:{round(en-st, 4)}s) # POLARS: TESTING GROUPING SPEED ON 5 COLUMNS cols [] for cat in [user, cat_1, cat_2, cat_3, cat_4]: cols[cat] sttime.time() temptrain_pl.groupby(cols).agg(pl.col(num_7).mean()) entime.time() print(f{cat}:{round(en-st, 4)}s) 每增加一列进行groupby后计算所需要的时间: cols耗时[“user”]0.7666s[“user”,“cat_1”]1.8221s[“user”,“cat_1”,“cat_2”]9.4581s[“user”,“cat_1”,“cat_2”,“cat_3”]15.1409s[“user”,“cat_1”,“cat_2”,“cat_3”,“cat_4”]16.5913s cols耗时[“user”]0.498s[“user”,“cat_1”]1.1978s[“user”,“cat_1”,“cat_2”]3.4107s[“user”,“cat_1”,“cat_2”,“cat_3”]4.4749s[“user”,“cat_1”,“cat_2”,“cat_3”,“cat_4”]4.6821s 排序 cols[user,num_8] # columns to be used for sorting # Sorting in Pandas %time a train_pd.sort_values(bycols,ascendingTrue) #Sorting in Polars %time b train_pl.sort(cols,descendingFalse) CPU times: user 31.9 s, sys: 7.28 s, total: 39.2 s Wall time: 46.2 s CPU times: user 32.2 s, sys: 7.04 s, total: 39.2 s Wall time: 11.6 s
http://www.hkea.cn/news/14375872/

相关文章:

  • 湖北建站管理系统信息黑色网站
  • 免费淘宝客网站模板wordpress添加自定义导航
  • phpmysql网站开发项目式教程南昌百度快速排名优化
  • 90设计网站是不是没有视频模板有服务器如何做网站
  • 网站域名可以改么网站建设与企业发展
  • 朔州网站建设哪家便宜免费域名分发
  • 河北省建设资格执业中心网站常州免费做网站
  • 网站备案信息传商城网站建设要求
  • 最简单的免费网站制作模板济南网站建设seo优化
  • 桓台新城建设有限公司网站图文素材库免费
  • 泰安建设银行网站嘉定华亭网站建设
  • 长治哪家公司做网站好湛江建站程序
  • 麦当劳的网站优化建议介绍几个有趣的网站
  • 互联网获客seo关键词查询工具
  • 建设一个网站需要多久ui设计工资
  • 有哪些做的好的营销型网站大连app开发多少钱
  • 自己网站的关键词怎么改毕业设计做视频网站设计
  • 戚墅堰做网站肇庆网络推广
  • 禅城网站建设哪家好电子商务网站是什么意思
  • 公司设计网站有什么好处兰州网站建设哪里好
  • 小说网站建设多少钱建网站费用
  • 网站界面版式互联网如何做推广
  • 哪个旅游网站做的最好哈尔滨专门做网站
  • 如何制作自己的网站模版中山有哪些网站建立公司
  • 长沙做网站优化想开一个做网站的公司
  • 刘家窑网站建设娃哈哈软文推广
  • 网站建站主机流量多网站
  • 易语言可以做网站嘛我的ip地址查询
  • 网站设计师工资怎样域名注册新网
  • 用ps网站首页怎么做个体工商户可以网站建设吗