问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

机器学习在航空乘客满意度预测中的应用

创作时间:
作者:
@小白创作中心

机器学习在航空乘客满意度预测中的应用

引用
CSDN
1.
https://blog.csdn.net/qq_59091630/article/details/139698973

本文通过机器学习方法(逻辑回归、决策树、随机森林、支持向量机等)对航空乘客满意度关键因素进行数据分析及预测。文章从问题定义到数据处理再到模型应用,层层递进,逻辑严谨。同时,文章还包含了具体的代码实现和结果分析,具有较强的可读性和实用性。

1.引言

这是一次关于航空公司及飞行情况各种相关的软硬件条件对乘客满意度的最终分析。本次实验是比较有实际意义。乘客的满意度对于航空公司而言是一个重要的评价指标,对于初次做飞机的人进行航空公司的选择起到关键的参考作用,同时可以不同情况反馈,督促航空公司做出相对应的改善。
本此实验采用逻辑回归、决策树、随机森林、支持向量机等多种方法,不仅能够帮助我们分析于预测不同因素对乘客满意度的影响,还能互相对比,帮助我们更深入了解这几种常用机器学习算法。
本文的整体流程实现阐述实验实际意义,并说明将会用到的方法;然后正式进行实验阶段:先对实验数据进行分组和预处理,接着对各个因素对乘客满意度进行可视化分析,最后进行满意度预测并对比各个算法的结果,分析其优劣;本文的最后对本次实验的结果根据实际应用意义进行综合分析。

2.实验数据

所有数据中,Gender、Customer Type、Type of Travel、Class与Satisfaction的数据是字符串类型,其他都是整数型或浮点数型。
其中,14个体验维度的数据都是0-5之间的整数型评分数据。

3.数据读取与数据预处理

导包
读入数据

然后开始对数据的预处理,先检查一下有哪些数据是缺失的:

可以看到所有数据中只有Arrival Delay in Minutes是有缺失值的。
可以看到缺失值的占比还是相当小的。
看看完好数据的分布情况来决定用什么方法修补缺失值
显然晚点时间为0的数量远超过其他值,因此我使用0来填充缺失值
可以看到处理完后,就没有缺失值了。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号