快速认识 Pandas 的十大索引

网站建设4年前发布
34 0 0

索引在我们的日常生活中其实是很常见的,就像:,上面不同的场景都可以看做是一个具体的索引应用:通过索引我们能够快速定位数据。,因此,基于实际需求出发创建的索引对我们的业务工作具有很强的指导意义。在Pandas中创建合适的索引则能够方便我们的数据处理工作。,20230305225909a443ab7226be999cd992192101573c1a9b631b276,官网学习地址:https://pandas.pydata.org/docs/reference/api/pandas.Index.html,下面通过实际案例来介绍Pandas中常见的10种索引,以及如何创建它们。,Index是Pandas中的常见索引函数,通过它能够构建各种类型的索引,其语法为:,20230306102051c7bdbd99814152c50f85373cc5c2172bd097d8751,导入两个必需的库:,默认的数据类型是int64,In [2]:,Out[2]:,在创建的时候,还能够直接指定数据类型:,In [3]:,Out[3]:,在创建的时候指定名称name和数据类型dtype:,In [4]:,Out[4]:,In [5]:,Out[5]:,使用元组来进行创建:,In [6]:,Out[6]:,使用集合来进行创建。集合本身是无序的,所以最终的结果并不一定是按照给定的元素顺序:,In [7]:,Out[7]:,生成一个区间内的索引,主要是基于Python的range函数,其语法为:,202303052259133906e0b92b8eb1b87e91734c5c1709050285cd194,下面通过多个例子来讲解:,In [8]:,默认结果中起始值是0,结束值是8(不包含),步长是1:,Out[8]:,In [9]:,Out[9]:,改变步长为2:,In [10]:,Out[10]:,In [11]:,将结果用list显示出来,没有包含stop的值8:,Out[11]:,下面的案例中将步长改成-1:,In [12]:,Out[12]:,In [13]:,Out[13]:,指定数据类型是int64整型,In [14]:,Out[14]:,In [15]:,Out[15]:,In [16]:,Out[16]:,如果在数据中包含小数则会报错:,In [17]:,20230305225916f488df83835d8363017891d781ba578c17a211867,数据类型是无符号的UInt64,In [18]:,Out[18]:,In [19]:,Out[19]:,In [20]:,Out[20]:,2023030522591883ccc4c90fb865e4e8d0524d1682c07c79b7b7205,数据类型是Float64位的浮点型,允许小数出现:,In [22]:,Out[22]:,In [23]:,Out[23]:,In [24]:,Out[24]:,注意:在Pandas1.4.0的版本中,上面3个函数全部统一成了pd.NumericIndex方法,新的 IntervalIndex 通常使用interval_range()函数来进行构造,基本用法:,In [24]:,Out[24]:,In [25]:,Out[25]:,In [26]:,Out[26]:,In [27]:,Out[27]:,In [28]:,Out[28]:,在下面的例子中我们以一批衣服的尺码作为模拟数据:,In [29]:,Out[29]:,In [30]:,Out[30]:,In [31]:,Out[31]:,In [32]:,Out[32]:,CategoricalIndex 索引对象也可以从 Categorical() 方法进行实例化得到:,In [33]:,Out[33]:,In [34]:,Out[34]:,以时间和日期作为索引,通过date_range函数来生成,具体语法为:,以时间和日期作为索引,通过date_range函数来生成,具体例子为:,In [35]:,Out[35]:,In [36]:,Out[36]:,In [37]:,Out[37]:,In [38]:,Out[38]:,In [39]:,显示的结果中以一个季度-3个月为频率:,Out[39]:,In [40]:,Out[40]:,pd.PeriodIndex是一个专门针对周期性数据的索引,方便针对具有一定周期的数据进行处理,具体用法如下:,生成pd.PeriodIndex对象的方式1:指定开始时间、周期频率,In [41]:,Out[41]:,In [42]:,Out[42]:,In [43]:,Out[43]:,In [44]:,20230305225919799866903e290bf795b994f3c9351346905ea3607,生成pd.PeriodIndex对象的方式2:直接使用pd.PeriodIndex方法,In [45]:,Out[45]:,In [46]:,Out[46]:,In [47]:,Out[47]:,生成pd.PeriodIndex对象的方式3:利用date_range函数先生成DatetimeIndex对象,In [48]:,Out[48]:,In [49]:,Out[49]:,In [50]:,202303061020513594c9e62a5d23f5bda626e997f15a546543f2448,创建方式1:指定数据和最小单元,In [51]:,Out[51]:,In [52]:,Out[52]:,In [53]:,Out[53]:,In [54]:,Out[54]:,创建方式2:通过timedelta_range函数来间接生成,In [55]:,Out[55]:,In [56]:,Out[56]:,In [57]:,Out[57]:,In [58]:,Out[58]:,2023030610205284ec2c262e2a29416322415f476d7bdc44f9e7730,

© 版权声明

相关文章