调用航班延误预测的已保存xgboost模型代码
```python
import xgboost as xgb
from sklearn.preprocessing import LabelEncoder
import pandas as pd
import numpy as np
# 读入数据,并进行特征处理和标签转换
df = pd.read_csv('data/train.csv') # 读取数据集
le = LabelEncoder() # 标签转换器
df['ORIGIN'] = le.fit_transform(df['ORIGIN']) # 将原始地点的字符串转化为整形的标签
# 分割特征和标签,并将标签转化为0,1的形式
X,y = df[['MONTH', 'DAY_OF_MONTH', 'DAY_OF_WEEK', 'ORIGIN', 'DEST','CRS_DEP_TIME']].values, df['ARRIVAL'].map(lambda x: 0 if x <= 15 else 1).values
# 划分数据集:20%测试集,80%训练集
offset = int(X.shape[0] * 0.2)
X_train, y_train = X[:offset], y[:offset]
X_test, y_test = X[offset:], y[offset:]
# 用xgboost进行分类预测
model=xgb.XGBClassifier()
model.fit(X=X_train,y=y_train) # 训练模型
preds=model.predict(X=X_test) # 预测 print("预测准确度 : %.2f" % (accuracy * 100)) # 打印出准
创作工场
免责声明:
以上内容除特别注明外均来源于网友提问,创作工场回答,未经许可,严谨转载。
点击这里>>使用🔥专业版,更聪明、更完整、更原创!