Python数据预处理的数据的获取与清理实训的实验代码
Python数据预处理的数据获取与清理实训的实验代码如下:
# 导入所需要的库
import pandas as pd
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt
# 读取数据文件
data = pd.read_csv('data.csv')
# 查看前五行数据
print(data.head())
# 查看数据类型信息
print(data.info())
# 统计各列总体统计量
print(data.describe())
# 检测是否存在异常值(这里使用Z-score方法) z = np.abs(stats.zscore(data)) print (np.where(z > 3))
# 用boxplot来可视化异常值 data_outliers = data[['Col1','Col2','Col3']] plt.boxplot (x= data_outliers) plt.show()
# 删除异常值 indexs = np . where (z > 3) [0] data_new = data . drop (indexs) print (data_new . head ())
免责声明:
以上内容除特别注明外均来源于网友提问,创作工场回答,未经许可,严谨转载。