平均值相同的两组数据该如何进行分组?

数据聚合与分组运算——GroupBy技术(1),有需要的朋友可以下。

pandas了灵活高效的groupby,它使你能以一种自然的方式对数据集切片、切块、等操作。

  • 根据或多个键(可以是、数组或DataFrame列名)拆分pandas对象。
  • 计算分组,如计数、平均值、标准差,或。
  • 对DataFrame的列应用各种各样的。
  • 应用组内转换或其他运算,如规格化、线性回归、排名或选取子集等。
  • 执行分位数分析其他分组分析。

1、分组键可以有多种形式,且类型不必相同

  • 列表或数组,其长度与待分组的轴一样。
  • 字典或Sers,给出待分组轴上的值与分组名之对应关系。
  • ,用于处理轴索引或索引中的各个。
  • 后三种都只是快捷方式而已,其最终目的仍然是产生一组用于拆分对象的值。

    2、首先来看看下面简单的型数据集(以DataFrame的形式):

    假设你想要按key1分组,并计算data1列的平均值,可以访问data1,并根据key1groupby:

    3、如果一次传入多个数组,就会得到不同的结果:

    通过两个键对数据了分组,得到的Sers具有层次化索引(由唯一的键对组成):

    无论你拿groupby做什么,都有可能会用到GroupBy的size,它可以返回含有分组大小的Sers:

    GroupBy对象迭代,可以产生一组二元(由分组名和数据块组成)。看看下面简单的数据集:

    -0.592994 b two 对于多重键的情况,的第元素将会是由键值组成的:

    对于由DataFrame产生的GroupBy对象,如果用(单个字符串)或一组(字符串数组)列名对其索引,就能实现选取部分列聚合的目的,即:

    7、通过字典或Sers分组

    除数组以外,分组信息还可以其他形式存在,来看DataFrame示例:

    -0..251905 Sers也有同样的,它可以被看做固定大小的映射。对于上面那个例子,如果用Sers作为分组键,则pandas会检查Sers以确保其索引跟分组轴是对齐的:

    相较于字典或Sers,Python在定义分组映射关系时可以更有创意且更为抽象。任何被当做分组键的都会在各个索引值上被一次,其返回值就会被用作分组。

    具体点说,以DataFrame为例,其索引值为人的名字。假设你希望根据人名的长度分组,虽然可以求取字符串长度数组,但其实仅仅传入len:

    将跟数组、列表、字典、Sers混合也不是,因为任何东西最终都会被转换为数组:

    层次化索引数据集最的地方在于它能够根据索引级别聚合。要实现该目的,通过level关键字传入级别编号或:

}

SQL经常将聚合函数与GROUP BY进行组合,对数据进行分组统计分析,python在分析数据中也可以实现相同的功能,而且python也是用GROUPBY

  • 如果是基于单列进行分组,括号中可以填入列名,如'用户类型',也可以填入Series,如df['用户类型']
  • 如果是基于多列进行分组,括号中可以填入列名组成的列表,如["用户类型","区域"],也可以填入Series组成的列表,如[df["用户类型"],df["区域"]

df.groupby()生成的也是DataFrame,有时可能需要在统计分析前选择列,可按照筛选列的方法进行操作,具体见,不设置筛选时,默认是选择全部列

例如你只需要对7月销售额进行统计分析,可以写成df.groupby("用户类型")["7月销售额"]

  • 对选择出来的列进行单一统计
  • 对选择出来的列进行多种统计,此时需要借助aggregate方法,对分组后选择的列同时进行多种统计
  • 对选择出来的列,不同列进行不同的统计,如一个列进行求和,一个列进行求平均,仍需要借助aggregate方法,不过这个时候需要传入以列名为键,统计函数为值的字典

默认以分组中的某列或某些列为索引,但有时候我们并不想要这样的索引,此时有两种方法处理:

}

高傑西 回答:4 浏览量:16

在Excel中如何将两组数据分组?

是这样的,有以下数据如下a组和b组序数 a b1 11 502 12 553 10 454 13 495 10 536 11 50如何通过Excel或者其它软件将6列分为两组,要求是每组的a的平均值最接近以及b的平均值也最接近。一楼说的还是不太明白,应该是我表述的不清楚,我再用下面的例子说一下。姓名 语文 数学曹一 70 90罗二 60 95张三 70 100李四 50 80王五 90 60黄六 80 70刘七 88 90曾九 90 70莫十 90 90 将这些学生分成两组,使得两组的数学平均成绩和语文平均成绩分别最接近。二楼同志的可以认为我是依据平均分给这些学生分组。当然实际情况中有很多学生,也有很多科目,所以想找个方法来分组,这样的话可以更精确,也可以省很多时间。 当然不必局限于用Excel,其它容易学的软件都可以。

基础入门 讲师: 张光欢

本教程四个模块 《Excel操作技巧》是以Excel2016为工具,主要应用与我们日常办公的数据整理,存储归类等技巧操作,《Excel函数与公式》对我们整理好的数据进行统计分析,《数据透视表》主要是对整理的数据进行分析,《图表呈现》对整理好的数据,做图表呈现,更直观的看懂我们的数据背后的秘密。

}

我要回帖

更多关于 excel计算符合条件的平均值 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信