一行代码制作数据分析交叉表,太便捷了

网站建设3年前发布
51 0 0
202303061034119160c78584e1ab1c88d3618754d81b5ec4110a295,在前文中我们了解到Pandas模块中的pivot_table()函数可以用来制作数据透视表。,那我们按照惯例,首先导入模块并且来读取所要使用到的数据集,引用的依然是之前制作数据透视表的数据集,那这里小编是通过自定义一个函数,然后通过调用该函数来读取数据,在实际工作当中每个人都可以根据自己的喜好来操作:,output,2023030610295851fa472732c0ad3d0de1200e56766a47fce4f9160,交叉表是用于统计分组频率的特殊透视表。简单来说,就是将两个或者多个列中不重复的元素组成一个新的DataFrame,新数据的行和列交叉的部分值为其组合在原数据中的数量,我们先来看一个简单的例子,代码如下:,output,2023030610341386e9256664fae6adf0a98879a01f121325148c436,在行方向上代表的是不同的地区,而在列方向上代表的则是不同的咖啡种类,出来的结果表示的是不同地区不同咖啡种类的汇总数据,,output,例如我们筛选出地区是中部地区并且品种是茶饮的数据,出来的结果总共有336条数据,和交叉表中的结果一致。,20230306102959369a6d39639024dc37f8489387ab69da70aa3f834,我们可以对列名以及行索引更换名字,通过调用rownames参数以及colnames参数,代码如下:,output,2023030610300058b2aa7766fb0bd07c789372e3a1a376626d1a422,除了咖啡的品类之外,我们还想要知道到底不同品种的咖啡在批发和零售之间销量的数据,就可以这么来操作:,output,20230306103000295c7be685aa71768108146f4afd185e407bf1353,或者是,output,202303061030012966b2628a7056c80ac8281becac6b3e5c1146251,输出的DataFrame数据集当中的列有两层,最上面的是咖啡的种类,然后紧接着第二层的便是不同的市场,当然我们也可以在行方向上添加多个层次的索引,代码如下:,output,20230306103001f8f231b8808bfd3d699053abd8388a8b9f0088525,和pd.pivot_table()函数一样,我们也可以通过调用当中的margin参数来给整合出来的数据做一个加总,代码如下:,output,20230306103003a33ee0002e27faa899d2800a74a7b0433fe3aa622,我们还能指定该列的列名。,output,20230306103413668ce72408f44ee8c130319b0d00c23c8e9ab3124,另外还有参数normalize用来将所有值除以值的总和进行归一化。,output,2023030610300314db18133bba60b7621553c4461c61a173ea26332,我们从美观的角度出发,想要保留两位小数,代码如下:,output,20230306103414d7918f9249449b3e958890deca1f456f0c8bab922,要是和之间的margin参数相结合来使用的话,将所有的结果汇总到一起等于100%,代码如下:,output,20230306103004183034997d2bcfc93586400b075e75453467d0900,最后还有values以及aggfunc两参数,其中aggfunc参数具体指的是指定聚合函数,例如平均数、求和以及中位数等统计方法,对value参数指定的连续性变量的列进行计算。,output,当前数据集中“market”、“region”、“product_category”、“product”四列是离散型变量,而有“cost”、“inventory”、“net_profit”、“sales”四列是连续性变量,分别代表的是成本、库存、净利润以及销量,其中我们想针对不同地区、不同咖啡种类的成本做一个平均值,那么代码如下:,output,2023030610300459eb598951c21b96f00038254ce8507cd127cc539,要是我们想要对计算出来的结果保留两位小数,代码如下:,output,20230306103005f12b9fa2896d2ec47870784f5401f46a28fab1522,当然要是针对存在缺失值的情况,我们也可以替换成其他值来处理,代码如下:,output,20230306103006e57e61c2692c9e6bcf540604b8eddfef5a1a2a926
© 版权声明

相关文章