1.导入必要的库: import pandas as pd import numpy as np import matplotlib.pyplot as plt 2.载入数据: # 加载csv文件 df = pd.read_csv('data.csv') 3.探索数据: # 查看数据集的大小 print(df.shape) # 查看数据集的列名 print(df.columns) # 查看数据集的前5行 print(df.head()) 4.数据预处理: # 检查缺失值 print(df.isnull().sum()) # 填充缺失值 df.fillna(0, inplace=True) # 标准化数据 from sklearn.preprocessing import StandardScaler scaler = StandardScaler() scaled_data = scaler.fit_transform(df) 5.数据可视化: # 绘制散点图 plt.scatter(scaled_data[:,0], scaled_data[:,1]) plt.xlabel('Feature 1') plt.ylabel('Feature 2') plt.show() 6.建立模型: # 加载机器学习库 from sklearn.linear_model import LinearRegression # 建立线性回归模型 model = LinearRegression() model.fit(scaled_data[:,0].reshape(-1,1), scaled_data[:,1]) 7.评估模型: # 计算R2值 from sklearn.metrics import r2_score preds = model.predict(scaled_data[:,0].reshape(-1,1)) print(r2_score(scaled_data[:,1], preds))
上一篇: 下一篇:

相关推荐

随机推荐

  1. Qoo10趣天日本广告投标助手
  2. 西西趣天采集插件2.0升级版
  3. 西西电商图片下载助手
  4. 西西趣天韩国批量上货助手最新版
  5. 西西趣天日本批量上货助手最新版
  6. dupeGuru – 电脑重复文件查找工具,支持跨平台使用!
  7. Caesium – 图片批量压缩软件
  8. 7-Zip 免费解压软件
  9. TrayS 绿色免安装版 (任务栏美化工具)
  10. AirDroid 3.7.2.1 Android 设备管家远程控制
  11. Snipaste截图软件下载
  12. Everything 1.4.1.1026 文件搜索工具
  13. chromium浏览器伪造sni工具网页版
  14. 迅雷下载去广告VIP绿色精简最终版11.1.12.1692
  15. 免费听音乐 MusicFree 音乐播放器接口完整版