Pandas中groupby+agg的两种写法区别小结

张

张建站

2026/4/3 23:50:40

10分钟阅读

在使用 Pandas 做数据统计时groupby agg是绕不开的操作。但很多人包括我自己在实际项目中都会遇到一个问题为什么明明只是做个统计结果 DataFrame 却变成了 MultiIndex后面 merge、导 Excel、画图全都开始报错追根溯源问题往往出在groupby agg的写法选错了本文结合真实工程经验详细讲清楚 Pandas 中 agg 的两种常见写法以及为什么在工程场景下强烈推荐其中一种。一、一个非常真实的使用场景假设你在做检测评测统计有如下数据classpart1TPFPFNGT_countcowv015106cowv014015dogv023214目标是按 class part1 统计 TP / FP / FN / GT 数量二、第一种写法很多人最常用但最容易踩坑123groupby_dfdf.groupby([class,part1]).agg({TP:sum,FP:sum,FN:sum,GT_count:sum})这段代码有问题吗没有。但它返回的结果结构是class 和 part1 变成了 MultiIndex统计结果才是列也就是说你拿到的是一张多级索引 DataFrame。MultiIndex 在工程中会带来什么问题以下问题你大概率都会遇到导出 Excel 前必须 reset_index()和其他表 merge 时经常报错新同事很难快速理解数据结构后面再算指标时代码变得很别扭分析阶段还能接受工程阶段非常痛苦三、第二种写法Pandas 官方推荐强烈建议123456789groupby_df(df.groupby([class,part1], as_indexFalse).agg(TP(TP,sum),FP(FP,sum),FN(FN,sum),GT(GT_count,sum),))返回结果是什么样class | part1 | TP | FP | FN | GT分组字段是普通列没有 MultiIndex看起来就是一张“标准统计表”四、两种写法的核心区别对比对比点第一种写法第二种写法分组字段位置Index普通列索引类型MultiIndex普通 Index是否需要 reset_index是否列名是否可控否是扩展复杂统计不优雅非常自然工程实用性较低很高五、真实项目中的差距会越来越大当统计需求升级比如你还想算平均置信度唯一 track 数第一种写法会越来越臃肿1234567df.groupby([class,part1]).agg({TP:sum,FP:sum,FN:sum,score:mean,track_id:nunique})而第二种写法依然清晰1234567df.groupby([class,part1], as_indexFalse).agg(TP(TP,sum),FP(FP,sum),FN(FN,sum),avg_score(score,mean),track_cnt(track_id,nunique),)

Unity URP SRP Batcher 完全指南 URP/HDRP 下的核心批处理机制，大幅降低 CPU 开销

SRP Batcher 是 Unity Scriptable Render Pipeline (SRP) 的核心优化技术，通过减少 CPU 与 GPU 之间的数据传输开销，显著提升渲染性能。本文将深入解析其工作原理、使用方法及最佳实践。一、什么是 SRP BatcherSRP Batcher 是 Unity 为 Scriptable Rende…...

2026/4/3 23:48:06 阅读更多 →

竞技游戏设计实战：从核心机制到玩家体验的全面解析

1. 竞技游戏设计的核心要素竞技游戏之所以能让人欲罢不能，关键在于它像一台精密的机器——每个齿轮都必须严丝合缝。我参与过三款MOBA手游的平衡性调优，最深的体会是：好的设计就像隐形的导演，既给玩家自由发挥的空间，…...

2026/4/3 23:47:21 阅读更多 →

AD 2024 激活与汉化实战：从破解文件到中文界面的完整指南

1. 准备工作：获取必要文件与环境确认在开始激活和汉化Altium Designer 2024之前，我们需要做好充分准备。首先确保你已经完成了软件的基础安装，这个步骤通常包括运行安装程序、选择安装路径以及等待安装进度条完成。我遇到过不少朋友因为着急…...

2026/4/3 23:47:19 阅读更多 →

【技术干货】GLM 5.1 + 开源 Agent：从模型到长跑智能体的完整实战思路

摘要本文从工程视角拆解 GLM 5.1 在智能体（AI Agent）场景中的优势，对比纯聊天模式与工具调用/长任务工作流的差异，并给出基于 OpenAI 兼容接口的实战示例。文末附上基于（xuedingmao.com）的统一多模型接入方…...

2026/3/29 0:01:51 阅读更多 →

Audio Pixel Studio部署案例：树莓派4B轻量部署Audio Pixel Studio可行性验证

Audio Pixel Studio部署案例：树莓派4B轻量部署Audio Pixel Studio可行性验证 1. 项目背景与目标 Audio Pixel Studio作为一款轻量级音频处理工具，其设计初衷就是为开发者提供简单易用的语音合成与人声分离功能。本次验证旨在探索在树莓派4B这样的低功耗…...

2026/3/29 0:03:10 阅读更多 →

电子课本下载工具：高效赋能教育资源获取的技术革新

电子课本下载工具：高效赋能教育资源获取的技术革新【免费下载链接】tchMaterial-parser 国家中小学智慧教育平台电子课本下载工具项目地址: https://gitcode.com/GitHub_Trending/tc/tchMaterial-parser 在数字化教育快速发展的今天，教育资源的…...

2026/3/29 0:03:12 阅读更多 →