1.pd.set_option()
# 显⽰所有列
pd.set_option('display.max_columns', None)
pd.set_option('display.max_columns', 5) #最多显⽰5列# 显⽰所有⾏
pd.set_option('display.max_rows', None)
pd.set_option('display.max_rows', 10)#最多显⽰10⾏#显⽰⼩数位数
pd.set_option('display.float_format',lambda x: '%.2f'%x) #两位#显⽰宽度
pd.set_option('display.width', 100)#
import warnings
warnings.filterwarnings('ignore') # 关闭运⾏时的警告
np.set_printoptions(linewidth=100, suppress=True) # 打印numpy时设置显⽰宽度,并且不⽤科学计数法显⽰pd.set_option('display.width', 100) # pandas设置显⽰宽度pd.set_option('precision', 1) # 设置显⽰数值的精度
2.head()函数
Returns the first or last parts of a vector, matrix, table, data frame or function.
Since head() and tail() are generic functions, they may also have been extended to other classes.
返回向量、矩阵、表、数据框或函数的前(或者最后)⼀部分。head()和tail()相似,他们也可能被扩展到其他类
3.get_dummies()函数
get_dummies 是利⽤pandas实现one hot encode的⽅式。one hot encode 的思想是:
将离散型特征的每⼀种取值都看成⼀种状态,若你的这⼀特征中有N个不相同的取值,那么我们就可以将该特征抽象成N种不同的状态,one-hot编码保证了每⼀个取值只会使得⼀种状态处于“激活态”,也就是说这N种状态中只有⼀个状态位值为1,其他状态位都是0。
pandas.get_dummies(data, prefix=None, prefix_sep='_', dummy_na=False, columns=None, sparse=False, drop_first=False)[source]
例如:
import pandas as pddf = pd.DataFrame([ ['green' , 'A'], ['red' , 'B'], ['blue' , 'A']]) df.columns = ['color', 'class'] pd.get_dummies(df)
get_dummies 前:
get_dummies 后:
上述执⾏完以后再打印df 出来的还是get_dummies 前的图,因为你没有写
df = pd.get_dummies(df)
可以对指定列进⾏get_dummies
pd.get_dummies(df.color)
将指定列进⾏get_dummies 后合并到元数据中
df = df.join(pd.get_dummies(df.color))
因篇幅问题不能全部显示,请点此查看更多更全内容