使用 SciPy 提供的普通最小二乘法分别计算 3 个特征与目标之间的一元线性回归模型拟合参数。 加载数据集 import pandas as pd data = pd.read_csv( ‘http://labfile.oss.aliyuncs.com/courses/1211/Advertising.csv’, index_col=0) data.head() 数据集包含 4 列,共 200 行。每个样本代表某超市销售相应单位件商品所需要支出的广告费用。以第一行为例,表示该超市平均销售 22.1 件商品,需要支出的电视广告费用,广播广告费用以及报刊广告费用为:230.1 美元,37.8 美元和 69.2 美元。将前 3 列视作特征,最后一列视作目标值。 计算拟合参数 import numpy as np from scipy.optimize import leastsq ### 代码开始 ### (≈ 10 行代码) m=2 def func(w, x): return w[0]+w[1]*x def err_func(w, x, y): return y-func(w, x) params_tv = leastsq(err_func,[1, 1], args=(data[‘tv’], data[‘sales’])) params_radio = leastsq(err_func,[1, 1], args=(data[‘radio’], data[‘sales’])) params_newspaper = leastsq(err_func,[1, 1], args=(data[‘newspaper’], data[‘sales’])) ### 代码结束 ### 输出: (array([7.03259358, 0.04753664]), array([9.3116381 , 0.20249578]), array([12.35140707, 0.0546931 ])) 拟合结果绘图 from matplotlib import pyplot as plt %matplotlib inline ### 代码开始 ### (≈ 10 行代码) fig, axes=plt.subplots(1, 3, figsize=(20,5)) axes[0].scatter(data[‘tv’], data[‘sales’]) axes[0].plot(data[‘tv’], func(params_tv[0], data[‘tv’]), color=’red’) axes[0].set_xlabel(‘tv’) axes[0].set_ylabel(‘sales’) axes[1].scatter(data[‘radio’], data[‘sales’]) axes[1].plot(data[‘radio’], func(params_radio[0], data[‘radio’]), color=’red’) axes[1].set_xlabel(‘radio’) axes[1].set_ylabel(‘sales’) axes[2].scatter(data[‘newspaper’], data[‘sales’]) axes[2].plot(data[‘newspaper’], func(params_newspaper[0], data[‘newspaper’]), color=’red’) axes[2].set_xlabel(‘newspaper’) axes[2].set_ylabel(‘sales’) ### 代码结束 ### (1)请给出拟合结果绘图(10分) 多元线性回归模型 使用 scikit-learn 提供的线性回归方法建立由 3 个特征与目标组成的多元线性回归模型。 计算拟合参数 from sklearn.linear_model import LinearRegression ### 代码开始 ### (≈ 4 行代码) model = LinearRegression() model.fit(data[[‘tv’, ‘radio’, ‘newspaper’]], data[‘sales’]) ### 代码结束 ### model.coef_, model.intercept_ # 返回模型自变量系数和截距项 输出: (array([ 0.04576465, 0.18853002, -0.00103749]), 2.9388893694594103) 模型检验 使用 statsmodels 库提供的相关方法来完成上面多元回归模型的拟合优度检验和变量显著性检验。 import statsmodels.api as sm x=sm.add_constant(data[[‘tv’, ‘radio’, ‘newspaper’]]) model=sm.OLS(endog=data[‘sales’], exog=x) results=model.fit() ### 代码结束 ### results.summary2() # 输出模型摘要 (2)给出模型输出结果(10分) (3)对上述实验结果进行分析(10分) 江苏开放大学 235 0 领5金币 问题反馈 反馈回复 推广有佣金 内容查看查看价格2 元VIP 7折升级VIP立即购买申请退款 看广告免费获取 点点赞赏,手留余香 给TA打赏 0 猜你喜欢 案例分析:不满12岁骑共享单车导致事故,你认为共享单车公司应当承担责任吗? 2023-10-04 假定你是江苏开放大学学生艾中华,给你的朋友Hans写一封电子邮件,向他介绍Deepseek及其创始人梁文峰(Liang Wenfeng)。 2025-03-03 2025年春江苏开放大学软件技术导论050307第2次过程性考核作 2025-04-21 2024年春江苏开放大学个人与团队管理050275形成性考核作业四(期末综合大作业) 2024-04-29 2024年秋江苏开放大学计算机应用基础060019第二次形成作业(Word 操作) 2024-10-15 2025年春江苏开放大学软件技术导论050307第3次过程性考核作 2025-04-21 评论0 请先 登录
评论0