问小白 wenxiaobai

资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

机器学习必备公式之Softmax函数

创作时间:

作者:

@小白创作中心

机器学习必备公式之Softmax函数

引用

CSDN

1.

https://m.blog.csdn.net/2303_79000779/article/details/145567605

Softmax函数是机器学习中一个非常重要的工具，特别是在多分类问题中。它能够将一个K维的实值向量转换为一个K维的概率分布，使得每个元素的值在[0, 1]之间，且所有元素的和为1。本文将详细介绍Softmax函数的定义、公式及其推导过程。

第一部分：介绍Softmax函数

Softmax函数是一种常用的归一化函数，通常用于多分类问题中。它将一个K维的实值向量转换为一个K维的概率分布，使得每个元素的值在[0, 1]之间，且所有元素的和为1。

公式：

其中：

是输入向量的第i个元素；
是向量的维度；
是的指数；
分母是所有元素的指数和。

作用：

将输入向量转换为概率分布，便于分类问题中使用。
通过指数运算，放大了不同元素之间的差异。

第二部分：Softmax函数的推导过程

Softmax函数的推导过程可以从概率模型和最大似然估计的角度来理解。以下是详细的推导过程：

2.1 问题背景

在多分类问题中，我们需要将一个K维的实值向量转换为一个概率分布，其中：

每个表示属于第类的概率；
满足且。

我们希望找到一种映射函数（即Softmax函数），能够实现这一转换。

2.2 指数变换

为了将实值向量转换为概率分布，我们可以利用指数函数的性质：

指数函数确保输出为正数；
指数函数的单调性可以保留输入向量中的相对大小关系。

因此，我们首先对每个元素进行指数变换：

2.3 归一化

为了满足概率分布的性质（和为1），我们需要对指数变换后的结果进行归一化。归一化方法是将每个元素除以所有元素的和：

这就是Softmax函数的最终形式。

2.4 最大似然估计的视角

从概率模型的角度，Softmax函数可以通过最大似然估计（Maximum Likelihood Estimation, MLE）推导出来。

假设我们有一个多分类模型，模型的输出表示第类的预测概率。模型的参数是根据训练数据，通过最大化似然函数来优化的。

(a) 似然函数

对于样本，假设其真实标签为第类（即），则模型的似然函数为：

其中：

是真实标签的one-hot编码（，其余）；
是模型的预测概率。

(b) 对数似然函数

为了简化计算，我们取对数似然函数：

由于真实标签是one-hot编码，上式简化为：

(c) 最大化对数似然

为了使对数似然最大化，我们需要使最大化。根据Softmax函数的定义：

因此，最大化等价于最大化相对于其他的值。

这一过程可以通过优化交叉熵损失函数（Cross-Entropy Loss）来实现。

总结

Softmax函数的推导可以从以下两个角度理解：

数学角度：通过对实值向量的指数变换和归一化，将输入转换为概率分布。
概率模型角度：通过最大似然估计，推导出Softmax函数是最大化样本似然的最优形式。

Softmax函数在多分类问题中具有广泛的应用，是机器学习和深度学习中非常重要的工具之一。

热门推荐

开学收心，3 招让你快速进入 “学习状态”！

开学收心，3 招让你快速进入 “学习状态”！

作家余华有很多优秀作品，为什么没有获得茅盾文学奖？

作家余华有很多优秀作品，为什么没有获得茅盾文学奖？

足总杯：诺丁汉森林VS伊普斯维奇；2C1拿捏6倍！

足总杯：诺丁汉森林VS伊普斯维奇；2C1拿捏6倍！

还有1.6万+套库存！深圳安居房政策可能松绑吗？

还有1.6万+套库存！深圳安居房政策可能松绑吗？

3 种实用方法，轻松实现 Windows 11 定时关机

3 种实用方法，轻松实现 Windows 11 定时关机

上班族租房指南：如何缩短通勤时间

上班族租房指南：如何缩短通勤时间

左胸上方疼痛原因及应对方法

左胸上方疼痛原因及应对方法

如何分析化工原料的市场供需？这种供需关系有哪些变化趋势？

如何分析化工原料的市场供需？这种供需关系有哪些变化趋势？

美国学校的宗教现状与影响

美国学校的宗教现状与影响

双黄线调头规则全解析：实线禁调头，虚线需谨慎

双黄线调头规则全解析：实线禁调头，虚线需谨慎

金属雕花板运输及施工需注意什么？

金属雕花板运输及施工需注意什么？

美国留学电气工程专业的工资水平如何

美国留学电气工程专业的工资水平如何

美国机电工程专业详解：学校排名、就业前景与发展趋势

美国机电工程专业详解：学校排名、就业前景与发展趋势

海景房机箱优缺点

海景房机箱优缺点

张明楷因果关系案例与答案解析：理解因果关系的运用与判断

张明楷因果关系案例与答案解析：理解因果关系的运用与判断

HIV病毒在空气中存活时间

HIV病毒在空气中存活时间

如何选择水稻优良品种

如何选择水稻优良品种

YOLOV10：参数越少，速度越快，性能更高的新一代目标检测框架

YOLOV10：参数越少，速度越快，性能更高的新一代目标检测框架

18位长寿健在的著名演员，年龄最大103最小86，均是熟悉老艺术家

18位长寿健在的著名演员，年龄最大103最小86，均是熟悉老艺术家

科学家或许已经真正解开意识之谜

科学家或许已经真正解开意识之谜

哈密瓜几月份成熟上市？如何挑选最新鲜的哈密瓜？

哈密瓜几月份成熟上市？如何挑选最新鲜的哈密瓜？

现在才知道：这样的“空气炸锅”别再用了！妥妥健康杀手

现在才知道：这样的“空气炸锅”别再用了！妥妥健康杀手

上海五里桥街道破解电动自行车充电难题：140个充电桩投入使用

上海五里桥街道破解电动自行车充电难题：140个充电桩投入使用

共享电单车行至中场：洗牌加剧，赚快钱的时代已经远去

共享电单车行至中场：洗牌加剧，赚快钱的时代已经远去

Redis位图（Bitmap）功能详解：常用命令与应用场景

Redis位图（Bitmap）功能详解：常用命令与应用场景

文化的演变与企业变革：领导者的角色和责任——读《组织文化与领导力》

文化的演变与企业变革：领导者的角色和责任——读《组织文化与领导力》

怎样投诉自媒体侵权：全流程解析与法律实务操作指南

怎样投诉自媒体侵权：全流程解析与法律实务操作指南

老祖宗的智慧：朱雀三啄，每天一次，啄掉脸上色斑和皱纹！

老祖宗的智慧：朱雀三啄，每天一次，啄掉脸上色斑和皱纹！

科学家发现，太阳系不仅在银河系以螺旋方式前进，而且还上下穿行

科学家发现，太阳系不仅在银河系以螺旋方式前进，而且还上下穿行

银河系的结构古人和今人对银河的认识

银河系的结构古人和今人对银河的认识

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号