pandas value_counts include all values before groupby(PANDA VALUE_COUNTS包含GROUP BY之前的所有值)
本文介绍了PANDA VALUE_COUNTS包含GROUP BY之前的所有值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
假设我有以下数据帧:
df = pd.DataFrame([['a',1, -1], ['a', 1, -1], ['b', 0, -1], ['c', -1, -1]] ,columns = ['col1', 'col2', 'col3'])
df
col1 col2 col3
0 a 1 -1
1 a 1 -1
2 b 0 -1
3 c -1 -1
现在我想按列对df进行分组,并分别计算col1列中的值出现的次数。
groupby_df = df.groupby('col1')
for a,b in groupby_df:
print("{0} ->
{1}".format(a, b['col1'].value_counts().sort_index()))
我得到:
a ->
a 2
Name: col1, dtype: int64
b ->
b 1
Name: col1, dtype: int64
c ->
c 1
Name: col1, dtype: int64
但是我想单独统计出现的次数,并且仍然包括所有列值,如下所示:
a ->
a 2
b 0
c 0
Name: col1, dtype: int64
b ->
a 0
b 1
c 0
Name: col1, dtype: int64
c ->
a 0
b 0
c 1
Name: col1, dtype: int64
如有任何帮助,我们将不胜感激!
推荐答案
尝试使用.reindex():
import pandas as pd
df = pd.DataFrame([['a',1, -1], ['a', 1, -1], ['b', 0, -1], ['c', -1, -1]] ,columns = ['col1', 'col2', 'col3'])
# Create index using unique values of col1.
uniques = pd.Index(df['col1'].unique())
# Group.
groupby_df = df.groupby('col1')
# Use reindex to assign and autoamtically align the value counts with the index.
for a, b in groupby_df:
print(b['col1'].value_counts().sort_index().reindex(uniques, fill_value = 0))
给予:
a 2
b 0
c 0
Name: col1, dtype: int64
a 0
b 1
c 0
Name: col1, dtype: int64
a 0
b 0
c 1
Name: col1, dtype: int64
这篇关于PANDA VALUE_COUNTS包含GROUP BY之前的所有值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
织梦狗教程
本文标题为:PANDA VALUE_COUNTS包含GROUP BY之前的所有值
基础教程推荐
猜你喜欢
- Kivy 使用 opencv.调整图像大小 2022-01-01
- Python,确定字符串是否应转换为 Int 或 Float 2022-01-01
- 比较两个文本文件以找出差异并将它们输出到新的文本文件 2022-01-01
- Python 中是否有任何支持将长字符串转储为块文字或折叠块的 yaml 库? 2022-01-01
- 在 Django Admin 中使用内联 OneToOneField 2022-01-01
- 对多索引数据帧的列进行排序 2022-01-01
- kivy 应用程序中的一个简单网页作为小部件 2022-01-01
- 在 Python 中将货币解析为数字 2022-01-01
- matplotlib 设置 yaxis 标签大小 2022-01-01
- 究竟什么是“容器"?在蟒蛇?(以及所有的 python 容器类型是什么?) 2022-01-01
