对多索引数据帧的列进行排序

Sorting columns of multiindex dataframe(对多索引数据帧的列进行排序)

本文介绍了对多索引数据帧的列进行排序的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个非常大的多索引数据帧,大约有500列,每列有2个子列。

数据帧df如下所示:

                  B2                  B5             B3
bkt              A1      A2           A2      A1     Z2      C1
Date                                                                        
2019-06-11       0.8     0.2          -6.0    -0.8   -4.1    -0.6    
2019-06-12       0.8     0.2          -6.9    -1.6   -5.3    -1.2    

df.columns
MultiIndex(levels=[['B2', 'B5', 'B3', .....], ['A1', 'A2' ......]],
           labels=[[1, 1, ....], [1, 0, ....]],
           names=[None, 'bkt'])

我尝试仅对列名进行排序,并保持每列中的值不变,以获得以下所需的输出:

                 B2                  B3             B5
bkt              A1      A2          C1      Z2     A1      A2
Date                                                                        
2019-06-11       ..
2019-06-12       ..

..表示原始数据帧中的值。我只是没有重新打字。

安装

df = pd.DataFrame([
    [.8, .2, -6., -.8, -4.1, -.6],
    [.8, .2, -6.9, -1.6, -5.3, -1.2]
],
    pd.date_range('2019-06-11', periods=2, name='Date'),
    pd.MultiIndex.from_arrays([
        'B2 B2 B5 B5 B3 B3'.split(),
        'A1 A2 A2 A1 Z2 C1'.split()
    ], names=[None, 'bkt'])
)

推荐答案

使用sort_index并将其分配回来

df.columns=df.sort_index(axis=1,level=[0,1],ascending=[True,False]).columns

在Pir中,我们不需要创建df的副本,只需对列进行修改

df.columns=df.columns.sort_values(ascending=[True, False])

这篇关于对多索引数据帧的列进行排序的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!

本文标题为:对多索引数据帧的列进行排序

基础教程推荐