问小白 wenxiaobai
资讯
历史
科技
环境与自然
成长
游戏
财经
文学与艺术
美食
健康
家居
文化
情感
汽车
三农
军事
旅行
运动
教育
生活
星座命理

17岁高中生神级Prompt,强化系统①→②慢思考

创作时间:
作者:
@小白创作中心

17岁高中生神级Prompt,强化系统①→②慢思考

引用
CSDN
1.
https://m.blog.csdn.net/weixin_42619619/article/details/143795552

最近,一位17岁的高中生津豪在AI模型Claude3.5的Prompt工程领域取得了突破性进展。他开发的Thinking Claude Prompt能够显著提升模型的推理能力,使其思考过程更加接近人类。这一创新不仅在技术社区引起广泛关注,也为AI模型的CoT(Chain of Thought)推理模式研究提供了新的思路。

最近我们的群里可能是最年轻的小伙儿,津豪(17岁),可以说是在某种偶然的灵感迸发同时也是某种必然的直觉下搞出了开启模型慢思考下的Prompt密码,直接把Claude3.5强化成了满血o1。

简单的说,用Prompt把o1级别的CoT,复刻到了Claude3.5中,且思考逻辑更详细、更像人,甚至思考过程都跟o1一样,可规划、展开折叠、反思甚至尝试对解空间的探索与回溯。Prompt的名字,叫Thinking Claude。

具体来说,津豪在尝试将这种类似于人类在思考时候的“内心独白”或者说“意识流”纳入到prompt的过程中先徒手写了一段拟人化的思维链Prompt,这也是Thinking Claude的雏形v0.01版本,并将其扔给Claude使其多次迭代并形成最终版本-相关prompt内容与实践结果大家可参考配图。

在发布了Thinking Claude后,群里圈外的小伙伴们也玩疯了似的基于prompt进行各种“如快速开发一个轻便的计算器、当场造了一个flappy bird、生成了不仅可玩还带AI玩家的德州扑克的尝试;


甚至是在具有挑战性的文学创作过程中,体现了其敏捷且新颖的创作与取材思路…

我们知道,自o1发布以来(今天Google的Gemini-Exp-1114也赶上了),CoT这个游走于模型推理过程中灵魂式的影子便无处不在,从早期的prompt、到模型的test-time、再到模型train-time、甚至基于模块化动态RAG及Multi-Agent的通信交换与协作中均会看到其身影...

我想这种表象除了映射出CoT对于模型应对复杂推理任务的关键意义外,也必然折射出其对于认知推理模式背后机制的本质内涵。

如我之前笔记或文章中多次提到的“模型内隐式参数化推理”与“模型外显式推理”两种推理过程对长程认知流形分布的学习与对应的碎片化泛化能力拼接融合内涵本质的同一。

而不管在test-time正向传播中,还是在train-time反向传播下,CoT作为一种特殊、通用且足够囊括多种泛化分布与探索可能性的pattern过程模式亦都会贯穿于其中,作为认知目标“新衣”的信息(数据)的编织者。

同时,我们也看到了外界更多人对此的关注与讨论,甚至是批判式评价,anyway,我认为这是一项很好的工作,至少是对模型复杂推理能力的一次探底,也进一步印证了CoT这种思维模式对于模型显式的一过性指令提示遵循在复杂推理场景下的潜力与意义。

这不得不让我回忆起今年夏天某种机缘下与这位“前阿里巴巴全球数学竞赛AI赛道”的17岁🏅获得者结识时那样,在他们身上看到了更多的不同与可能。

© 2023 北京元石科技有限公司 ◎ 京公网安备 11010802042949号