问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

快速提高数学成绩,这是DeepSeek给我们的启发:自我强化

创作时间:
作者:
@小白创作中心

快速提高数学成绩,这是DeepSeek给我们的启发:自我强化

引用
腾讯
1.
https://new.qq.com/rain/a/20250224A09F1W00

DeepSeek模型通过自我强化机制表现出色,这一过程可以类比为小龙女教杨过武功。将这种自我强化机制应用到数学学习中,可以显著提高学习效率和成绩。

何以出色

DeepSeek之所以表现出色,简单来说是模型的自我强化。具体过程如下:

  1. 首先,训练一个基础模型;
  2. 然后,让基础模型按照一定的标准输出内容(编程和数学方向);
  3. 接着,根据事先设置好的优秀答案,让模型参照着自己给自己评分;
  4. 再接着,根据评分、也参照优秀答案,自己调整参数,再次输出。

……

这个过程就相当于:

  • 小龙女教杨过武功,教了一些古墓派基础招式、内功心法、跟人决斗时的方法……杨过学会了,古墓派传人的基础模型有了。
  • 然后,小龙女让杨过以取胜为目的,用古墓派武功找赵志敬决斗(按照标准输出);
  • 接着,决斗完是胜是负很明显——杨过自己就能给自己评分(评分)。
  • 再接着,杨过根据现实,调整自己,再次决斗。(调整参数)
  • ……
  • ……
  • 经过n轮调整,杨过赢了。

这就是强化学习,也是自我学习的过程。在第一个阶段,生成基本模型,大家都差不多——

  • 老师演示、喂资料;
  • 学生识别、记忆、练习。

第二个阶段,DeepSeek调用算力,进行了自我强化——

不足,我就思考,根据思考结果去调整,我努力接近优秀。

如此,模型整体提升得非常快。就像那个下象棋的“狗”,总是会自我迭代。

对应到学数学

在第一个阶段,喂资料学习。相当于老师讲课,老师传授招式。学生收集老师所讲的内容,按照老师说的做——比如对概念的理解上,做题的方式上。做错了,老师提醒你回到正确的方式上来。只要老师好,老师的知识面广,学生整体的表现还是不错的。比如,中考、高考。题型就那么多,考纲上的内容也就那么多,该讲的老师都会讲到。只要你都记住了,也能考出好成绩。

问题是【遗忘】。遗忘无疑是学习的大敌,记性好的、领悟能力强的孩子就非常沾光。所以,在这个体系内,这种孩子效率就高。但只要你肯下功夫,别人一小时搞会的,你用一天,够勤奋你也不至于太差。

还有一种方式,对应DeepSeek第二阶段的学习。上课老师喂资料,该讲的都讲了。老师就给你题目做。数学题因为都有现成的答案,做完对不对一目了然。你自己立马就能得到反馈,而且反馈是自己给自己的:

  • 对了多少,差在哪里;
  • 如何更接近正确答案,你去思考;
  • 思考完调整,调整后继续输出,继续去找反馈……如此往复。
  • 最终你出了好成绩。

第一种比较依赖老师,也需要大量的重复性工作——去记忆、去按正确方法练习;第二种弱化老师,让学生自我学习——一通百通,练习比较少、提升却很快。主打一个【自我调整,越来越接近优秀】。

对应自身

不知道你发现没:两个阶段,一个被动一个主动。如果你想短时间内提升数学成绩,你需要主动的强化学习。当你主动,你内耗就没有了。不会说这个老师不好,那个老师方式不适合你的。也会主动放弃许多边边角角的事情。你就自我强化、专注于自己的发展。只要你对一件事说了我愿意,你就打开了顶级天赋。然后,上课认真听也好,自学也好,你把概念掌握牢固,这是必须的——要有个基础模型。接着你就去做题:

  • 在具体题目上,看看自己离正确答案有多远,不断朝正确答案迭代。
  • 在整体数学成绩上,看看自己离100分有多远,不断去调整自己,最终达到100分。

主动的自我强化,就是自我教育——

哪里好发挥哪里,哪里不行迭代哪里。等于升级版的刻意练习,只是这次给反馈的是你自己。属于带着脑袋来上学。你说快不快?

将来你还能利用这一技能学别的东西,在各个方面开启晋升之道。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号