问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

用导数找极值:牛顿的微积分革命

创作时间:
2025-01-21 20:21:27
作者:
@小白创作中心

用导数找极值:牛顿的微积分革命

在数学领域,求极值是一个经典且重要的问题,不仅在学术研究中占有重要地位,还在工程、金融、机器学习等多个领域有着广泛的应用。本文将带你深入了解牛顿如何巧妙地解决这一问题,他的方法不仅开创了微积分的新篇章,还为后世提供了强大的数学工具。

在数学领域,求极值是一个经典且重要的问题,不仅在学术研究中占有重要地位,还在工程、金融、机器学习等多个领域有着广泛的应用。本文将带你深入了解牛顿如何巧妙地解决这一问题,他的方法不仅开创了微积分的新篇章,还为后世提供了强大的数学工具。

从基础出发:传统求极值方法

在高中数学中,我们通常通过公式或几何法来求解极值问题。然而,这些方法在面对复杂函数时往往显得力不从心。例如,在机器学习中,目标函数的最优化处理是一个核心问题;在金融领域,结构化投资产品的设计也需要解决最优化问题;在企业管理中,各类规划问题同样涉及最优化。

那么,什么是极值问题呢?简单来说,就是寻找函数的最大值或最小值。对于有限集合而言,寻找最大值相对简单,可以通过比较算法实现。例如:

def FindLargest(arr):
    largest = arr[0]
    for num in arr:
        if num > largest:
            largest = num
    return largest

然而,对于无限集合的函数,这种方法就不再适用。例如,函数y = -x^2 + 4x的最大值问题,就不能简单地通过代入几个数值来解决。虽然通过图像可以直观地看到最大值约为4,但数学要求我们进行严格的证明。

牛顿的创新:将极值问题转化为函数动态变化趋势的研究

牛顿的伟大之处在于,他没有将最优化问题视为简单的数量大小比较问题,而是将其视为研究函数动态变化趋势的问题。这一转变,为解决极值问题开辟了全新的思路。

让我们以抛物线y = -x^2 + 4x为例,来理解牛顿的思想。为了便于理解,我们关注最高点附近的变化。

在图中,上半部分是前述抛物线,横轴被放大了一倍,以更清楚显示曲线变化细节。各色曲线代表不同点的切线。可以看出,从左到右,抛物线由快变慢,至平稳,最后下降。切线由陡峭变平缓,最高点处变为水平线,随后斜率转负。

量化分析显示,在x=0处,切线斜率(导数)为4。到x=0.5时,斜率减至3,然后依次减至2,1,0,-1,-2等。因此,若将导数函数绘入图中,就呈现出一条直虚线。对比抛物线与导数(虚直线),你是否注意到,曲线达到最高点时,切线恰为水平,导数为零?

这并非巧合。若回顾最大值和导数的定义,两者之间的一致性便不难理解。最大值的含义在于,某点a的函数值f(a)比周围点都大。从最大值点稍微偏移,会发现那些点的函数值略小。在二维图上,这意味着与左右邻点比较。左侧点的函数值小于a,表明左侧点变化趋势向上,导数正;右侧点亦小于a,表明变化趋势向下,导数负。从正导数转为负导数的过程中,必经过导数为零的点,即最大值所在。

因此,寻找函数f(x)的最大值,转化为寻找导数f’(x)为零的点的问题。这一过程实际上是解方程,相比直接求最大值更为简单。这种思路正是牛顿区别于前人的地方。他没有直接解决难题,而是将比较数值大小的问题转化为寻找函数变化拐点的问题,后者更易解决。但要将这两个问题等同,需要一种新工具——导数。

有了导数,求最大值的问题转化为解方程问题。这一方法的优势在于,它适用于任何函数,无需为每种特定函数寻找解题技巧。这也是微积分成为强大数学工具的原因。

方法的局限性与完善

当然,这种方法并非完美无瑕。例如,对于立方函数f(x) = x^3,其导数f’(x) = 3x^2。当x=0时,导数为零,但x=0并非f(x)的最大值点,因为立方函数的最大值最终趋于无穷大。

解决方法是,在找到导数为零的点后,检查其前后点的导数符号是否从正转负。若是,则为最大值点;否则不是。这样补救了一处漏洞。

导数求最大值的方法还有其他漏洞,例如下述函数。它有两个导数为零的点,均符合导数从正转负的条件,但最大值只有一个。左侧点高于右侧,因此左侧为真正最大值,右侧为次之。

对此情况,数学家们首先更精确地定义了最大值。他们将最大值分为两类:

  1. 极大值或局部最大值:即某点的函数值仅需比周围点高;
  2. 整个函数的最大值

因此,一个函数可以有多个极大值,但只能有一个最大值。这样,最大值的定义便无矛盾。但如何在众多局部极大值中找到最大值呢?遗憾的是,目前仍无系统方法解决此问题,只能逐一比较。实际上,这也是计算机进行机器学习时面临的一大挑战,尚未得到解决。

启示与总结

牛顿等人通过研究函数变化趋势,发明了一种追踪函数从低到高,至平稳,再下降的变化过程来求最大值的方法,使人类对事物的理解由静态转向动态。这种方法通用,不局限于特定问题技巧。当然,这种方法也有漏洞,我们需逐一弥补。

此外,牛顿的方法给我们两点重要启示:

  1. 牛顿通过数据模型化,用公式间接思考问题,从侧面反映事物的本质,这种模型思维值得学习!这也是目前科学和工程常用的方法。
  2. 对于三次方函数和其他波动函数的极值问题,虽然最后都会通过if判断进行解决,但是一个模型就可以过滤掉几乎多大半需要思考的问题,留下来的只是小部分的问题处理。所以综合两点可以看出,我们做事情,也要能找到自己的模型,可以快速帮助我们简化操作步骤提高效率才是王道。
© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号