分享30个超级好用的Pandas实战技巧

网站建设4年前发布
39 0 0

read_csv()用来读取csv格式的数据集,当然我们这其中还是有不少玄机在其中的。,我们只是想读取数据集当中的某几列,就可以调用其中的usecols参数,代码如下:,output,主要用到的是parse_dates参数,代码如下:,output,主要调用的是dtype这个参数,同时合适的数据类型能够为数据集节省不少的内存空间,代码如下:,用到的是index_col这个参数,代码如下:,output,用到的是nrows参数,代码如下:,output,要是数据集当中存在着一些我们并不想包括在内的内容,可以直接跳过,skiprows参数,代码如下:,要是遇到了空值,我们可以将空值用其他的值来代替,代码如下:,对于布尔值而言,我们也可以设定换成是其他的值来代替,代码如下:,还可以从多个csv文件当中来读取数据,通过glob模块来实现,代码如下:,我们的表格数据存在于pdf文件当中,需要从pdf文件当中来读取数据,代码如下:,通过调用pandas_profilling模块,三行代码直接生成数据分析的报告,代码如下:,pandas能够表示的数据类型有很多,我们希望筛选出来的数据包含或者是不包含我们想要的数据类型的数据,代码如下:,主要调用的是infer_objects()方法,代码如下:,我们手动地进行数据类型的转换,要是遇到不能转换的情况时,errors='coerce'将其换转成NaN,代码如下:,用到的是astype方法,代码如下:,rename()方法进行列的重命名,代码如下:,add_prefix()方法以及add_suffix()方法,代码如下:,调用的是assign方法,当然除此之外还有其他的方法可供尝试,代码如下:,同样也是用到insert方法,代码如下:,调用的是drop()方法,代码如下:,要是我们想要对列名做出一些改变,代码如下:,我们要是想要查看在数据集当中空值所占的比例,代码如下:,output,我们可以选择将空值去除掉,或者用平均值或者其他数值来进行填充,代码如下:,对于一些浮点数的数据,我们希望可以保留小数点后的两位或者是三位,代码如下:,output,对于指定的一些数据,我们希望是高亮显示,代码如下:,output,

© 版权声明

相关文章