当前位置: 首页 > news >正文

橙色在网站中的应用自己建设企业网站

橙色在网站中的应用,自己建设企业网站,专注于响应式网站开发,长春seo结算深入解析 DataFrame.groupby 和 agg 的用法及使用场景 1. groupby 的基本用法语法#xff1a;示例#xff1a; 2. agg 的基本用法语法#xff1a;示例#xff1a; 3. first、sum、lambda 的用法3.1 first示例#xff1a; 3.2 sum示例#xff1a; 3.3 lambda示例#xff… 深入解析 DataFrame.groupby 和 agg 的用法及使用场景 1. groupby 的基本用法语法示例 2. agg 的基本用法语法示例 3. first、sum、lambda 的用法3.1 first示例 3.2 sum示例 3.3 lambda示例 4. reset_index 的用法语法示例 5. 综合示例groupby agg 的完整用法6. 总结 在数据分析和处理中pandas 是一个非常强大的工具。其中DataFrame.groupby 和 agg 是两个常用的功能它们可以帮助我们对数据进行分组、聚合和转换。本文将详细讲解 groupby 和 agg 的用法以及如何结合 first、sum、lambda 和 reset_index 来实现复杂的数据处理。 1. groupby 的基本用法 groupby 是 pandas 中用于分组数据的函数。它的核心思想是将数据按照某个或某些列的值进行分组然后对每个分组进行操作。 语法 DataFrame.groupby(byNone, axis0, levelNone, as_indexTrue, sortTrue, group_keysTrue, squeezeFalse, observedFalse)by指定分组的列名或列名列表。as_index是否将分组列作为索引默认为 True。sort是否对分组键进行排序默认为 True。 示例 假设我们有一个包含学生成绩的 DataFrame import pandas as pddata {Name: [Alice, Bob, Alice, Bob, Alice],Subject: [Math, Math, Science, Science, Math],Score: [85, 90, 88, 92, 95] }df pd.DataFrame(data) print(df)输出 Name Subject Score 0 Alice Math 85 1 Bob Math 90 2 Alice Science 88 3 Bob Science 92 4 Alice Math 95我们可以按照 Name 列进行分组 grouped df.groupby(Name) print(grouped.groups)输出 {Alice: [0, 2, 4], Bob: [1, 3]}2. agg 的基本用法 agg 是 groupby 对象的一个方法用于对分组后的数据进行聚合操作。它可以接受一个函数、字符串如 sum、mean或字典指定不同列的聚合方式。 语法 DataFrame.groupby(...).agg(func, *args, **kwargs)func聚合函数可以是字符串、函数或字典。 示例 我们继续使用上面的 df计算每个学生的平均分 result df.groupby(Name).agg({Score: mean}) print(result)输出 Score Name Alice 89.333333 Bob 91.0000003. first、sum、lambda 的用法 在 agg 中我们可以使用多种聚合函数来处理数据。以下是常用的几种 3.1 first first 用于获取每个分组中第一行的值。 示例 result df.groupby(Name).agg({Subject: first, Score: mean}) print(result)输出 Subject Score Name Alice Math 89.333333 Bob Math 91.0000003.2 sum sum 用于计算每个分组中数值列的总和。 示例 result df.groupby(Name).agg({Score: sum}) print(result)输出 Score Name Alice 268 Bob 1823.3 lambda lambda 是一种匿名函数可以在 agg 中自定义聚合逻辑。 示例 假设我们想将每个学生的 Score 转换为字符串并在前面加上 Score: result df.groupby(Name).agg({Score: lambda x: Score: str(x.sum())}) print(result)输出 Score Name Alice Score: 268.0 Bob Score: 182.04. reset_index 的用法 reset_index 用于重置 DataFrame 的索引。当使用 groupby 和 agg 后分组列会作为索引如果需要将其还原为普通列可以使用 reset_index。 语法 DataFrame.reset_index(levelNone, dropFalse, inplaceFalse, col_level0, col_fill)drop是否丢弃索引列默认为 False。 示例 result df.groupby(Name).agg({Score: mean}).reset_index() print(result)输出 Name Score 0 Alice 89.333333 1 Bob 91.0000005. 综合示例groupby agg 的完整用法 现在我们来看一个更复杂的例子结合 first、sum、lambda 和 reset_index 来处理数据。 假设我们有一个包含边信息的 DataFrame data {edge_key: [A, A, B, B, C],source: [X, X, Y, Y, Z],target: [P, P, Q, Q, R],text_unit_ids: [[1, 2], [3], [4], [5, 6], [7]],weight: [10, 20, 30, 40, 50],description: [Edge A, Edge A, Edge B, Edge B, Edge C],human_readable_id: [A1, A2, B1, B2, C1],id: [1, 2, 3, 4, 5] }df pd.DataFrame(data) print(df)输出 edge_key source target text_unit_ids weight description human_readable_id id 0 A X P [1, 2] 10 Edge A A1 1 1 A X P [3] 20 Edge A A2 2 2 B Y Q [4] 30 Edge B B1 3 3 B Y Q [5, 6] 40 Edge B B2 4 4 C Z R [7] 50 Edge C C1 5我们希望对 edge_key 进行分组并进行以下操作 source 和 target 取第一行的值。text_unit_ids 合并为一个列表。weight 求和。description 拼接为一个字符串。human_readable_id 和 id 取第一行的值。 代码如下 def _aggregate_text_unit_ids(x):return [item for sublist in x for item in sublist]def _add_quotes(s):return f{s}updated_edges_df df.groupby(edge_key).agg(source(source, first),target(target, first),text_unit_ids(text_unit_ids, _aggregate_text_unit_ids),weight(weight, sum),description(description, lambda x: .join(x.apply(_add_quotes))),human_readable_id(human_readable_id, first),id(id, first), ).reset_index(dropTrue)print(updated_edges_df)输出 source target text_unit_ids weight description human_readable_id id 0 X P [1, 2, 3] 30 Edge AEdge A A1 1 1 Y Q [4, 5, 6] 70 Edge BEdge B B1 3 2 Z R [7] 50 Edge C C1 56. 总结 通过本文我们学习了 groupby 和 agg 的基本用法以及如何结合 first、sum、lambda 和 reset_index 来实现复杂的数据处理。这些功能在数据分析和处理中非常实用能够帮助我们高效地完成任务。 希望这篇文章能帮助你更好地理解和使用 groupby 和 agg。如果你有任何问题或想了解更多欢迎在评论区留言 Happy Coding!
http://www.hkea.cn/news/14531071/

相关文章:

  • 济南网站建设团队岳阳做网站公司
  • 徐州建设企业网站个人的网站怎么备案表
  • 服装网站wordpress 备份到云盘
  • 高质量的装修公司赣州seo快速霸屏
  • 商务网站推广目标有哪些平果县免费网站哪家好
  • 网站开发的发展网站建设多少钱一个平台
  • 深圳市宝安区邮政编码泰州百度seo
  • 便宜网站设计注册一个小网站
  • 茶叶网站模板ui动效网站
  • 如何创办一个赚钱的网站大连自助建站
  • 百度收录多的是哪些网站组织部网站建设方案
  • 被称为网站开发神器安徽省建设部干部网站
  • 广东成都网站建设推广公司外贸网站模板制作
  • 南京网站设计课程平台公司有哪些
  • 网站建设有什么意见网站设计公司 无锡
  • 昆明制作网站费用企业做网站需要什么条件
  • 网站开发源码售卖合同吉林建站
  • 网站 板块 模块关于营销策划的方案
  • 做外贸翻译用那个网站河北seo网站优化价格
  • 做网站 多页面网址怎么弄最新的网络营销方式
  • 临清住房建设网站中国互联网企业排名前十名
  • 网站平台建设属于什么采购wordpress多个标签页
  • 营销网站 建设 高端有哪些可以建设网站的单位
  • 杭州网站seo软件开发类型
  • 网站的项目建设周期建设网站需要备案么
  • 张家口人社app最新下载做网站优化价格
  • seo网站推广排名新手学做网站难吗
  • 怎么看别人的wordpress重庆seo快速优化
  • 上海网站建设公司怎么分辨好坏有没有做游戏评测的网站
  • win7在局域网做网站网站优化设计方案怎么做