基于线性回归的大学申请成功率预测实战
创作时间:
作者:
@小白创作中心
基于线性回归的大学申请成功率预测实战
引用
CSDN
1.
https://m.blog.csdn.net/Ayyyyyyy8/article/details/143398151
本文将介绍如何使用线性回归模型预测大学申请成功率。通过实际案例,展示从数据导入、模型训练到结果预测的完整过程。
实践代码
1. 引入相对应的库
在开始之前,我们需要导入必要的库。这里我们主要使用pandas
进行数据处理,使用sklearn
中的LinearRegression
进行模型训练。
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
2. 导入数据
接下来,我们导入数据并查看其基本信息。
data = pd.read_csv('admission_data.csv')
print(data.head())
print(data.info())
3. 数据切割
我们需要将数据分为特征(X)和目标变量(y),然后将其分为训练集和测试集。
X = data.drop('Chance of Admit ', axis=1)
y = data['Chance of Admit ']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
4. 模型训练
使用线性回归模型对训练集进行训练。
model = LinearRegression()
model.fit(X_train, y_train)
5. 模型预测
在测试集上进行预测,并计算评价指标。
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f'Mean Squared Error: {mse}')
print(f'R-squared: {r2}')
6. 新数据预测
使用训练好的模型对新数据进行预测。
new_data = pd.DataFrame({
'GRE Score': [337],
'TOEFL Score': [120],
'University Rating': [5],
'SOP': [5],
'LOR ': [5],
'CGPA': [10],
'Research': [1]
})
new_prediction = model.predict(new_data)
print(f'Predicted Admission Chance: {new_prediction[0]}')
分析结论
- 根据模型进行的方差分析得出:使用该模型进行预测误差不大(误差为:0.005195),并且模型R-squared值大于0.6(R-squared 值为:0.73077)说明该模型良好。
- 但根据新的申请测试者的数据来看(使用数据的都是接近最大值),该申请者预测成功率为百分之53左右(具体值为:0.536057) ,说明该大学的offer较难获得。
热门推荐
中世纪欧洲贵族的称号为什么也是公侯伯子男爵
定风波苏轼原文及翻译和赏析
最新版机动车驾驶证扣分情形一览表
处理交通违章:选择专业机构的重要性与法律依据
黑苦荞茶产地分布及品质特点
出国留学经历是指什么
传承榜样力量 践行雷锋精神
鼻涕的奥秘:不同颜色,不同“警报”
“过度旅游”成灾,日本尝试用“算法”破局
2025央视春晚:12个主题作文素材+高分论点
淋巴细胞对比值高是什么原因引起的
保姆与雇主的法律关系是什么
美国报税文档管理指南:哪些材料必须保留?3年规则如何执行?
Excel中选中某一行以下所有行的多种方法
在线测试显卡性能时,PhysX应该选择显卡还是CPU?
最新天梯图助你精准选择显卡和CPU,打造完美电脑配置详解
国际权威医学组织公布最有效的3大戒烟工具:电子烟位列其中!
舌苔有点发黑是什么原因
洛杉矶夜间必做的12件事
五大情侣晚上做运动推荐!
白花菜炒鸡蛋
惊天逆转!皇马绝杀巴萨:探究战术变化与关键球员的表现
台湾面食热量表:红烧牛肉面热量最高,这些面食热量最低
对二手烟说“不”
菜油期货手续费结构详解
Excel合并单元格内容中间加个符号的方法
案件后续评估申请书的撰写规范与实务指南
2008年胶济铁路三个月内连续发生两起重大事故,造成近百人死亡
日元什么时候换人民币合适最划算
Win8的声卡驱动安装指南:解决兼容性问题的专业方法