您的当前位置:首页pythonpandas里面的一些函数及用法

pythonpandas里面的一些函数及用法

2020-05-12 来源:爱问旅游网
pythonpandas⾥⾯的⼀些函数及⽤法

1.pd.set_option()

# 显⽰所有列

pd.set_option('display.max_columns', None)

pd.set_option('display.max_columns', 5) #最多显⽰5列# 显⽰所有⾏

pd.set_option('display.max_rows', None)

pd.set_option('display.max_rows', 10)#最多显⽰10⾏#显⽰⼩数位数

pd.set_option('display.float_format',lambda x: '%.2f'%x) #两位#显⽰宽度

pd.set_option('display.width', 100)#

import warnings

warnings.filterwarnings('ignore') # 关闭运⾏时的警告

np.set_printoptions(linewidth=100, suppress=True) # 打印numpy时设置显⽰宽度,并且不⽤科学计数法显⽰pd.set_option('display.width', 100) # pandas设置显⽰宽度pd.set_option('precision', 1) # 设置显⽰数值的精度

2.head()函数

Returns the first or last parts of a vector, matrix, table, data frame or function.

Since head() and tail() are generic functions, they may also have been extended to other classes.

返回向量、矩阵、表、数据框或函数的前(或者最后)⼀部分。head()和tail()相似,他们也可能被扩展到其他类

3.get_dummies()函数

get_dummies 是利⽤pandas实现one hot encode的⽅式。one hot encode 的思想是:

将离散型特征的每⼀种取值都看成⼀种状态,若你的这⼀特征中有N个不相同的取值,那么我们就可以将该特征抽象成N种不同的状态,one-hot编码保证了每⼀个取值只会使得⼀种状态处于“激活态”,也就是说这N种状态中只有⼀个状态位值为1,其他状态位都是0。

pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)[source]

例如:

import pandas as pddf = pd.DataFrame([ ['green' , 'A'], ['red' , 'B'], ['blue' , 'A']]) df.columns = ['color', 'class'] pd.get_dummies(df)

get_dummies 前:

get_dummies 后:

上述执⾏完以后再打印df 出来的还是get_dummies 前的图,因为你没有写

df = pd.get_dummies(df)

可以对指定列进⾏get_dummies

pd.get_dummies(df.color)

将指定列进⾏get_dummies 后合并到元数据中

df = df.join(pd.get_dummies(df.color))

因篇幅问题不能全部显示,请点此查看更多更全内容