织梦狗教程 / 实例代码 / Python实例代码 / 正文

如何防止Groupby超越指数？

织梦狗教程 Python实例代码

2022-09-22

How to prevent groupby from surclassing index?(如何防止Groupby超越指数？)

本文介绍了如何防止Groupby超越指数？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

假设您有以下半MultiIndex object

import pandas as pd
df = pd.DataFrame({
    'c': {
        ('r', 'r1'): 1.,
        ('r', 'r2'): 2.,
    },
})
print(df)
#       c
# r r1  1
#   r2  2

让我们重点关注分层索引，即垂直索引。首先，请注意，正如预期的那样，我们拥有

>>> df.index.__class__.__name__
'MultiIndex'

重点是pandas.DataFrame.groupby可能-classdf.index取决于最终的级数是否为1。

>>> dfg = df.groupby(axis=0, level=0).sum() >>> dfg.index.__class__.__name__ 'Index'

防止/纠正此类行为的最干净方法是什么？目前，我同意

>>> dfg.index = pd.Index((c,) for c in dfg.index) # Doing so is equivalent to using `pd.MultiIndex.from_tuples` >>> dfg.index.__class__.__name__ 'MultiIndex'

为什么？_{查看评论：没有XY问题...}
假设您要将求和的值传播到更低的级别。SO上提出的解决方案都不适合我。可读性不足和/或隐藏了有趣的临时计算。原来，在源和处理MultiIndex实例时，执行此类传播变得相当容易。

>>> df_ = df.copy() # copy for the sake of illustration >>> df_.iloc[:, :] = dfg # Actually equivalent to `df_.update(dfg)` >>> df_ c r r1 3 r2 3 # whereas without correction: # c # r r1 nan # r2 nan

NB：此方法适用于所有dfg.index.nlevels。

推荐答案
尝试使用pd.DataFrame.align：

df.align(dfg, level=0)

输出：

( c r r1 1.0 r2 2.0, c r r1 3.0 r2 3.0)

注意：每个数据帧具有相同索引的元组。

然后，

pd.concat(list(df.align(dfg, level=0)), axis=1)

然后您可以获得连接的数据帧，如下所示：

c c r r1 1.0 3.0 r2 2.0 3.0

这篇关于如何防止Groupby超越指数？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持编程学习网！

织梦狗教程
本文标题为：如何防止Groupby超越指数？

上一篇：函数在多索引 pandas 数据帧中的应用

下一篇：在多索引中排序日期(&Q)

基础教程推荐

学习HTML

学习jQuery

学习Laravel

学习CSS3

学习Vue.js

学习Bootstrap5

学习ThinkPHP

学习AJAX

猜你喜欢

合并具有多个索引和列值的数据帧 2022-09-22

在使用Beam IO ReadFromPubSub模块时，是否可以拉取具 2022-09-22

在 pandas 中使用带有多重索引的.loc 2022-09-22

IBM Watson SpechtoTextV1错误-Python 2022-09-22

在MDCard Kivy中添加ScrollView 2022-09-21

如何按索引定制skLearning交叉验证迭代器？ 2022-09-21

跟在带量词的前瞻后面有什么作用？ 2022-09-22

玛雅巨蟒比例图片 2022-09-21

如何将我自己的类对象存储到hdf5中？ 2022-09-21

在VBA中调用python代码：权限错误 2022-09-22

最新文章

2022-09-22 跟在带量词的前瞻后面有什么作用？

2022-09-22 在多索引中排序日期(&Q)

2022-09-22 如何防止Groupby超越指数？

2022-09-22 函数在多索引 pandas 数据帧中的应用

2022-09-22 解释多索引日期时间

热门文章

编程基础

学习PHP

学习JAVA

学习ASP.NET

学习Python

热门标签

 织梦 dedecms php 正则表达式匹配 video mysql 远程连接过滤器监听器多进程图片上传无刷新加载 jdk Socket 循环语句排序算法冒泡排序防盗链采集下拉菜单 smarty 系统日志数据结构析构函数随机数递归 Referer 错误码运算符驱动程序小游戏序列化 MyBatis Stream SimpleXML 二进制 mysql去重

织梦狗教程网是一个专为初学者打造的前端开发和软件编程的学习网站，可以为编程者和程序员提供海量技术文档,以便编程初学者快速入门，提升开发技术水平和工作效率。

编程基础

HTML/CSS
JAVASCRIPT
PHP
JAVA
ASP.NET
Python

编程教程

编程基础
编程教程
编程问答
实例代码

© 2023-2024 织梦狗教程网版权所有并保留所有权网站地图 ICP备案号：粤ICP备20019714号

网站首页 HTML/CSS 菜单 Layui Yii2

网站首页
HTML/CSS

HTML
HTML5
CSS
CSS3
Sass
Layui
Bootstrap3
Bootstrap4
Bootstrap5
AppML
Font Awesome
Foundation5

JAVASCRIPT

JavaScript
jQuery
AngularJS
AngularJS2
Vue.js
Vue3
React
TypeScript
EasyUI
Node.js
AJAX
JSON
Echarts
Highcharts

PHP

PHP
Laravel
CakePHP
CodeIgniter
Zend
Symfony
Yii2
Phalcon
ThinkPHP
Smarty

JAVA

JAVA
Spring
Hibernate
Struts
Play
GWT
Jsp
Maven
Servlet

ASP.NET

ASP.NET
C#
Web Pages
Razor
MVC
Web Forms

Python

Python
Python 3
Django

Go

Go
Docker
Beego
Buffalo
Echo
Gin
Iris
Revel

Ruby

C

C++

Perl

Lua

Rust

Scala

VB

移动端

Android
Swift
ionic
Kotlin
HarmonyOS