资讯

历史

科技

环境与自然

成长

游戏

财经

文学与艺术

美食

健康

家居

文化

情感

汽车

三农

军事

旅行

运动

教育

生活

星座命理

人工智能概率统计基础——似然函数及其与的交叉熵关系

创作时间:

作者:

@小白创作中心

人工智能概率统计基础——似然函数及其与的交叉熵关系

引用

来源

https://www.cnblogs.com/zhoushusheng/p/18563410

似然函数是概率统计中的一个核心概念，用于衡量参数θ 给定时，观察到数据的可能性。换句话说，似然函数表示已知数据后，模型参数的可能性**。本文将系统地介绍似然函数的定义、性质、计算方法及其在统计学和机器学习中的应用。

似然函数（Likelihood Function）

似然函数是概率统计中的一个核心概念，用于衡量参数θ 给定时，观察到数据的可能性。换句话说，似然函数表示已知数据后，模型参数的可能性。

1. 定义

对于一组观测数据{x1,x2,…,xn}，假设数据由某个概率分布P(x;θ)生成，其中θ 是分布的参数。那么似然函数定义为：

L(θ)=P(x1,x2,…,xn;θ)

即：似然函数是给定参数θ 时，观测到这组数据的联合概率。

2. 与概率密度的关系

虽然似然函数和概率密度函数P(x;θ)看似相同，但它们的解释是不同的：

概率密度函数：
给定参数θ，描述数据的概率分布。
参数固定，数据是变量。
似然函数：
给定数据，描述参数θ 的可能性。
数据固定，参数是变量。

3. 表达式形式

3.1 离散型数据

对于离散型数据，似然函数是概率的乘积：

3.2 连续型数据

对于连续型数据，似然函数是概率密度的乘积：

其中f(xi;θ)是概率密度函数。

3.3 对数似然函数

为了方便优化和数值稳定性，通常取对数得到对数似然函数：

4. 最大似然估计（MLE）

似然函数的主要用途是最大似然估计（Maximum Likelihood Estimation, MLE），即找到使似然函数最大的参数值θ：

或等价于：

在数学、统计学和机器学习中，argmax L 是一个符号表示法，常常用于描述某个函数 L(x) 最大化时的变量 x 的值。

这里最大化对数似然是因为：

对数将乘积转换为求和，简化计算。
数值计算更稳定。

5. 示例

5.1 离散数据

假设有 n 次抛硬币实验，观测结果为x1,x2,…,xn∈{0,1}，概率为：

P(xi =1;p)=p,P(xi =0;p)=1−p

似然函数表示所有n 次实验的联合概率：

取对数：

最大化对数似然可以求得最优参数：

不像乘法的求导法则，累加的导数，直接加进去就行了。这里的log直接举例为ln了。

5.2 连续数据

假设有n 个样本来自正态分布N(μ,σ2)，其概率密度函数为：

似然函数为：

对数似然函数为：

通过对μ 和σ2求导，可以求得最大似然估计：

6. 应用场景

参数估计：

最大似然估计（MLE）是统计建模中最常用的参数估计方法。
如线性回归、逻辑回归等模型中使用 MLE 来估计模型参数。

机器学习模型训练：

损失函数与似然函数直接相关。例如：
逻辑回归中的交叉熵损失是负对数似然。
高斯混合模型（GMM）通过最大化似然训练。

假设检验：

比较不同模型的对数似然值以选择最优模型（如 AIC、BIC）。

贝叶斯方法：

在贝叶斯推断中，似然函数是后验概率计算的重要部分。

简单的似然函数计算例子

假设我们要对一个硬币的正面朝上的概率p 进行估计，基于抛硬币实验的观测数据计算似然函数，并找到最优的参数值p。

1. 问题描述

假设我们进行了 10 次抛硬币实验，结果如下：x=[1,0,1,1,0,1,0,1,1,0]

其中1 表示正面朝上，0 表示反面朝上。
我们的目标是估计p（硬币正面朝上的概率）。

2. 似然函数

每次实验的概率可以用伯努利分布表示：

似然函数表示所有观测结果的联合概率：

展开为：

在我们的数据中：

正面次数：x=1 的个数是 6。
反面次数：x=0 的个数是 4。

因此，似然函数为：

L(p)=p6⋅(1−p)4

3. 对数似然函数

为了简化计算，通常取对数似然：

logL(p)=6log(p)+4log(1−p)

4. 最大似然估计

通过最大化log⁡L(p) 找到最优参数p。

手工计算：对log⁡L(p) 求导，并令导数为 0：

解得：p = 6 / (6+4）=0.6

总结

似然函数：衡量给定参数时，观测数据的可能性。
对数似然函数：简化计算和优化的数学形式。
最大似然估计（MLE）：通过最大化似然函数找到最优参数。
应用：广泛用于统计学、机器学习、假设检验和贝叶斯推断中。

似然函数的核心在于将数据与模型参数联系起来，为参数估计和模型选择提供了基础。

交叉熵损失函数实际上是负对数似然函数（Negative Log-Likelihood, NLL）的一种形式，具体来说，它是逻辑回归模型的似然函数取对数并加负号后得到的。

交叉熵与似然函数的关系

在逻辑回归中：

模型输出的是类别y的条件概率：

其中σ(zi)是 Sigmoid 函数。

目标是通过最大化似然函数，使得模型参数θ 能够最好地拟合数据。

1. 似然函数

似然函数定义为所有样本的联合概率：

对每个样本的概率，分类问题可以表示为：

于是似然函数为：

2. 对数似然函数

取对数得到对数似然函数（Log-Likelihood, LL）：

3. 损失函数（交叉熵）

在模型训练中，我们最小化的是负对数似然：

将负对数似然取平均，就得到了交叉熵损失函数：

总结

交叉熵损失函数是负对数似然的平均形式。
在逻辑回归和分类问题中，最大化似然函数等价于最小化交叉熵损失。
交叉熵损失用于衡量预测的分布（y^ ）与实际分布（y）之间的差异。

本文原文来自cnblogs.com

热门推荐

王者荣耀钟馗最强出装攻略：从版本更新到实战技巧全解析

王者荣耀S38赛季钟馗攻略：技能调整详解与实战技巧

钟馗出装技巧，助你称霸王者峡谷

梨去皮和不去皮的区别

秋燥又到吃梨时，这么多梨你最喜欢哪一种呢？

在家也能“吃”到三亚：两道特色美食制作详解

从蒜蓉龙虾到糟粕醋火锅：三亚两家必打卡海鲜餐厅

三亚海鲜火锅攻略：酸辣糟粕醋vs清甜椰子鸡，三家店值得一试

手机动态照片转视频或GIF表情，两种主流系统操作全攻略

双色球24141期开奖数据分析：这些号码最热！

2024年我国运载火箭发射汇总

日照火箭发射时间，有新消息！观看攻略来了

神舟飞船内实时画面清晰、可实时视频通话，何以实现

火箭是怎么发射的？

儿童友好型医院建设—信息化再赋能！儿童输液启用物联网定位技术，全方位守护患儿安全

美元存款利率飙升至5%，你的钱袋子准备好了吗？