最小二乘法实际应用:大气二氧化碳浓度数据拟合
创作时间:
作者:
@小白创作中心
最小二乘法实际应用:大气二氧化碳浓度数据拟合
引用
CSDN
1.
https://m.blog.csdn.net/qq_50930131/article/details/144274004
最小二乘法是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。这种方法广泛应用于回归分析中,特别是在线性回归模型中。本文将通过一个实际案例,演示如何使用最小二乘法拟合大气二氧化碳浓度数据。
使用最小二乘法拟合大气二氧化碳浓度数据。数据保存在monthly_co2.xls文件中(只截取部分)。
Python需要安装的库
- xlrd
- numpy
- pandas
- matplotlib
绘制图像代码(绘制整体数据趋势图)
# -*- coding: utf-8 -*-
"""
@File : 绘制趋势图.py
@Time : 2024/11/27 23:52:44
@Version :
@Desc :
"""
"""
@Python version : 3.8.7
@matplotlib version : 3.5.1
@pandas version : 1.4.2
@numpy version : 1.22.3
"""
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.ticker import MultipleLocator #从ticker中导入MultipleLocator类
df = pd.read_excel(io="./monthly_co2.xls", header=2) # 数据在第一个sheet中
# 删除索引为0的行
df.drop(index=0, inplace=True) # 删除第三行数据 直接在原始dataframe上修改
df.replace(-99.99, np.nan, inplace=True) # 处理缺失值
df.dropna(inplace=True) # 删除缺失值的行
# df['Year_Month'] = df['Yr'] + (df['Mn'] - 1) / 12 # 将年份和月份转换为小数形式
# [:, 0] 表示选择所有行
df['Year_Month'] = df.iloc[:, 0] + (df.iloc[:, 1] - 1) / 12 # 使用列index索引而不是名称索引
x_vec = df['Year_Month'].values # x
y_vec = df.iloc[:, 2].values # y
# matplotlib字体设置
plt.rcParams['font.family'] = "Times New Roman" # 设置全局字体
# marker='o' 散点图绘制为圆形
# edgecolor='r' 设置圆圈的边缘颜色为红色
custom_color = '#f0a1a8'
plt.scatter(x_vec, y_vec, marker='o', edgecolors=custom_color, facecolors='none', label='Actual Data') # 原始数据
plt.xlabel("Year_Month", fontsize=16)
plt.ylabel("CO2 Concentration [ppm]", fontsize=16)
plt.title("Trend Chart of CO2 Concentration Over Time", fontsize=20) # 二氧化碳浓度随时间变化趋势图
plt.legend(loc='upper left')
# 美化图表
plt.rcParams['axes.facecolor'] = 'lightgray'
plt.rcParams['legend.fontsize'] = 10 # 设置图例字体大小
# 刻度值设置
ax = plt.gca() # 获取当前坐标轴
ax.xaxis.set_major_locator(MultipleLocator(10)) # 设置x轴的主刻度间隔
ax.xaxis.set_minor_locator(MultipleLocator(5)) # 设置x轴的次刻度间隔
ax.yaxis.set_major_locator(MultipleLocator(20)) # 设置y轴的主刻度间隔
ax.yaxis.set_minor_locator(MultipleLocator(10)) # 设置y轴的次刻度间隔
plt.grid(True, color='gray', linestyle='--', linewidth=0.5) # 添加自定义样式网格线
plt.show()
二次函数拟合
# -*- coding: utf-8 -*-
"""
@File : 二次函数拟合结果.py
@Time : 2024/11/28 11:19:38
@Version :
@Desc :
"""
"""
@Python version : 3.8.7
@matplotlib version : 3.5.1
@pandas version : 1.4.2
@numpy version : 1.22.3
"""
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.ticker import MultipleLocator #从ticker中导入MultipleLocator类
df = pd.read_excel(io="./monthly_co2.xls", header=2) # 数据在第一个sheet中

# 删除索引为0的行
df.drop(index=0, inplace=True) # 删除第三行数据 直接在原始dataframe上修改
df.replace(-99.99, np.nan, inplace=True) # 处理缺失值
df.dropna(inplace=True) # 删除缺失值的行
# df['Year_Month'] = df['Yr'] + (df['Mn'] - 1) / 12 # 将年份和月份转换为小数形式
# [:, 0] 表示选择所有行
df['Year_Month'] = df.iloc[:, 0] + (df.iloc[:, 1] - 1) / 12 # 使用列index索引而不是名称索引
x_vec = df['Year_Month'].values # x
y_vec = df.iloc[:, 2].values # y
# 这里添加代码
M = df.shape[0] # 数据点个数
# 方程组的系数矩阵
Phi = np.zeros((M, 3)) # 创建空矩阵
for i in range(M):
Phi[i][0] = 1
Phi[i][1] = x_vec[i]
Phi[i][2] = x_vec[i]**2
# 正规方程组
A = Phi.T @ Phi
b = Phi.T @ y_vec
x = np.linalg.solve(A, b)
print(x)
a_0 = x[0]
a_1 = x[1]
a_2 = x[2]
# f_x = a_2x^2 + a_1x + a_0
varphi_x = lambda x: a_2 * x**2 + a_1 * x + a_0 # 拟合函数
# 可视化图像
y_vec_model = varphi_x(x_vec)
# 均方根误差
RMSE = np.sqrt(np.sum((y_vec - y_vec_model)**2) / M)
print("均方根误差: ", RMSE)
# matplotlib字体设置
plt.rcParams['font.family'] = "Times New Roman" # 设置全局字体
plt.plot(x_vec, y_vec_model-279, label='Fitted Line', color='red')
# marker='o' 散点图绘制为圆形
# edgecolor='r' 设置圆圈的边缘颜色为红色
custom_color = '#f0a1a8'
plt.scatter(x_vec, y_vec-279, marker='o', edgecolors=custom_color, facecolors='none', label='Actual Data') # 原始数据
plt.xlabel("Year_Month", fontsize=16)
plt.ylabel("CO2 Concentration [ppm]", fontsize=16)
plt.title("Trend Chart of CO2 Concentration Over Time", fontsize=20) # 二氧化碳浓度随时间变化趋势图
plt.legend(loc='upper left')
# 美化图表
plt.rcParams['axes.facecolor'] = 'lightgray'
plt.rcParams['legend.fontsize'] = 10 # 设置图例字体大小
# 刻度值设置
ax = plt.gca() # 获取当前坐标轴
ax.xaxis.set_major_locator(MultipleLocator(10)) # 设置x轴的主刻度间隔
ax.xaxis.set_minor_locator(MultipleLocator(5)) # 设置x轴的次刻度间隔
ax.yaxis.set_major_locator(MultipleLocator(20)) # 设置y轴的主刻度间隔
ax.yaxis.set_minor_locator(MultipleLocator(10)) # 设置y轴的次刻度间隔
plt.grid(True, color='gray', linestyle='--', linewidth=0.5) # 添加自定义样式网格线
# 添加RMSE文本信息
# (0.02, 0.85) 以轴的百分比来表示 分别对应x轴和y轴的为转移
plt.text(0.09, 0.95, f"RMSE: {RMSE:.2f}", transform=plt.gca().transAxes, fontsize=18)
plt.show()
程序运行结果:
热门推荐
Open CV:模板匹配
聚焦未来之星:全方位提升儿童注意力训练指南
万通筋骨贴是什么?医生专业解析其成分、功效与使用方法
年金险到期后能不能一次性取出
车祸现场:受损车辆如何评估与修复
水性漆做底漆用还是做面漆用?家居装修这样选最靠谱
宋朝传统版《百家姓》,第137名,“贾姓”的起源和历史,你知道吗?
螺栓连接模型的建立方法
如何创作爆款短视频脚本?
头疼吃什么药止疼最快
大蒜的功效与食用注意事项:从传统到现代的全面解读
泰拉瑞亚肉山打法全攻略 小技巧助你轻松翻越肉山难关
芬兰现象式学习:从理论到课堂实践
Excel中计算健康到期日期的多种方法
【第5期】揭开神秘面纱 王者荣耀未上线英雄大赏
动环监控系统详细介绍
香附子煮水喝有什么功效
中药材香附的功效(香附活血化瘀吗)
大拇指弹响指在家如何康复锻炼按摩
糖尿病患者可以喝玉米粥吗?医生给出专业解答
菩提老祖的原形是谁,难怪他不让孙悟空报师门?看他最后去了哪儿
加味补肝汤:中医方剂助力改善眼干眼花飞蚊症
正确使用电风扇的方法
云开发与AI:智能化时代的技术融合
2025成都必看展览推荐:从福尔摩斯到波普艺术
米酒、黄酒、白酒、啤酒、葡萄酒及果露酒,哪一种更适合中国人呢?
专家解读:艾司奥美拉唑能否长期服用?
黑巧克力热量高吗?一文读懂黑巧克力的热量与食用建议
2025年城镇职工基本医疗保险门诊报销标准详解
海军军服怎么看军衔?