基于线性回归的大学申请成功率预测实战
创作时间:
作者:
@小白创作中心
基于线性回归的大学申请成功率预测实战
引用
CSDN
1.
https://m.blog.csdn.net/Ayyyyyyy8/article/details/143398151
本文将介绍如何使用线性回归模型预测大学申请成功率。通过实际案例,展示从数据导入、模型训练到结果预测的完整过程。
实践代码
1. 引入相对应的库
在开始之前,我们需要导入必要的库。这里我们主要使用pandas
进行数据处理,使用sklearn
中的LinearRegression
进行模型训练。
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
2. 导入数据
接下来,我们导入数据并查看其基本信息。
data = pd.read_csv('admission_data.csv')
print(data.head())
print(data.info())
3. 数据切割
我们需要将数据分为特征(X)和目标变量(y),然后将其分为训练集和测试集。
X = data.drop('Chance of Admit ', axis=1)
y = data['Chance of Admit ']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
4. 模型训练
使用线性回归模型对训练集进行训练。
model = LinearRegression()
model.fit(X_train, y_train)
5. 模型预测
在测试集上进行预测,并计算评价指标。
y_pred = model.predict(X_test)
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)
print(f'Mean Squared Error: {mse}')
print(f'R-squared: {r2}')
6. 新数据预测
使用训练好的模型对新数据进行预测。
new_data = pd.DataFrame({
'GRE Score': [337],
'TOEFL Score': [120],
'University Rating': [5],
'SOP': [5],
'LOR ': [5],
'CGPA': [10],
'Research': [1]
})
new_prediction = model.predict(new_data)
print(f'Predicted Admission Chance: {new_prediction[0]}')
分析结论
- 根据模型进行的方差分析得出:使用该模型进行预测误差不大(误差为:0.005195),并且模型R-squared值大于0.6(R-squared 值为:0.73077)说明该模型良好。
- 但根据新的申请测试者的数据来看(使用数据的都是接近最大值),该申请者预测成功率为百分之53左右(具体值为:0.536057) ,说明该大学的offer较难获得。
热门推荐
嵌入式开发应用场景有哪些,探索嵌入式开发:应用场景一览
燃油宝,是“神器”还是“智商税”?
什么是权力距离丨深度笔记
心电图大致正常是什么情况
中信银行信用卡逾期?教你正确使用邮寄方式应对
Excel公式错误分析:六大常见错误及解决方案
银龄健康 | 细说临终关怀
中考英语:非谓语动词
如何用word自定义关系图
河南许昌十大旅游景点攻略
如何从一个小白到硬件开发高手,学习步骤是什么?
春季长高黄金期,如何科学地帮助孩子长高?
生长激素追高“神器”还是揠苗助长?
小小一口痰,揪出肺结核!
研发数十年、挽救百万人生命,“中国神草”青蒿成为全球良药
无线通信是怎样传递信息的?技术原理及常用类型科普
膳食纤维在减肥中的关键作用:增加饱腹感、改善肠道健康和控制血糖水平
详解国内IND申报要求及相关流程
保险管理业绩怎么评估?
铁棍山药的营养价值和好处
营养在慢性难愈伤口中的作用,一种模式的转变
邀请函英语怎么说?从核心词汇到实例解析
1929年经济危机:解决措施及其历史影响
封狼居胥,饮马瀚海,勒石燕然的历史背景与深意
DHCP的原理与配置详解
自驾游金刀峡攻略
深圳“一次挂号管三天”政策详解:298.4万人次受益,免收1.104亿元挂号费
如何有效降火:饮食、生活习惯与心理调节的综合方法?
深入了解钢筋:建筑中不可或缺的基础知识
在太空建成“信息高速路” 我国卫星互联网进入产业化阶段