Transformer打破三十年数学猜想!算法杀手攻克数学难题
创作时间:
作者:
@小白创作中心
Transformer打破三十年数学猜想!算法杀手攻克数学难题
引用
腾讯
1.
https://new.qq.com/rain/a/20241113A07P8X00
Meta等机构学者近日提出了一种名为PatternBoost的全新算法,该算法通过结合Transformer神经网络,在数学问题中寻找有趣结构,并首次在30多年未解的数学猜想上取得重要进展。
PatternBoost算法的核心思想
PatternBoost算法的核心思想是交替进行「局部搜索」和「全局搜索」:
- 在第一个「局部」阶段,使用传统的经典搜索算法来生成许多理想的构造。
- 在第二个「全局」阶段,使用Transformer神经网络对这些最优构造进行训练。然后,将训练好的Transformer样本用作第一个阶段的种子,并重复该过程。
这种迭代交替方式比传统的贪婪方法或单独的非贪婪增强Transformer方法表现更优。
PatternBoost在多个数学问题中的应用
研究团队在多个极值组合学问题中测试了PatternBoost算法,其中一个经典应用是「无4-圈问题」。在这个问题中,目标是在给定顶点数n的情况下,构造尽可能多的边而不包含4-圈的图。
研究者通过以下步骤应用PatternBoost:
- 生成一个初始数据集,并使用Transformer模型对其进行训练以生成新样本。
- 将这些新样本作为局部搜索的起点,经过多轮迭代后,PatternBoost在这个无4-圈问题上获得了比传统方法更佳的解。
PatternBoost在「许多边没有三角形」问题中的具体应用
研究者首先确定了局部搜索方法和评分函数:
- 局部搜索算法:当搜索到的图还包含三角形时,就删掉其中的一条边;一旦图中已经没有三角形,则在不创建新三角形的情况下,尽可能多地随机添加新边。
- 评分函数:如果图包含任何三角形,给出负无穷大的分数;否则返回边的数量。
具体步骤如下:
- 创建起始数据库:从空图开始,运行局部搜索算法40,000次,保留得分最高的25%作为训练集。
训练Transformer:使用一个简单的2层Transformer模型,经过15,000步训练后,训练集损失降至2.07,测试集损失为2.09。
从Transformer获取新结构:生成100,000个tokenized的新图形,解码得到37,000个有效矩阵。
从Transformer中获得的新结构中,运行本地搜索:将37,000个有效结构图重新输入简单局部搜索算法。
- 重复此过程:提取上一代中最好的10,000个词组,使用之前相同的token对它们进行分词,并在这个新的训练集上微调Transformer。
重要突破与未来展望
PatternBoost不仅找到了几个长期问题的最佳已知解决方案,而且还构造了一个反例,反驳了一个已悬而未决30年的猜想。这一突破性进展引发了对未来可能性的期待:是否所有数学问题都适合机器学习技术?这样的未来令人兴奋。
热门推荐
有限责任公司股东分红的规定及股权代持效力解析
如何通过技术手段取证应对开户威胁
一般意外伤害包括什么
人事专员任职要求中最关键的是什么
鸡蛋期货一手的交易规则是什么?这些规则对市场有什么作用?
志愿服务项目的风险管理
第11位大满贯!广州仔樊振东的2862天和16个第一次
第17金!樊振东实现大满贯
如何正确注销移动电话卡?详细步骤解析
怎样评估一个设备项目的投资回报率是否合理?
跑步运动后膝关节疼痛怎么办?从瘸腿到健步如飞!附自救具体操作表
10首小诗,很短,却极美
【电子通识】电热水壶组成结构及主要器件原理
如何做数据库设计,架构师的必备技能之一(C系架构设计法)
小米净水器设计缺陷引争议:不换滤芯就无法正常显示
婚前共同财产协议书:定义、法律效力与公证指南
如何运用策略实现目标并获得成功?实施策略过程中可能遇到哪些挑战?
干货汇总 | 甲状腺疾病实验室指标的梳理与解读
猫咪吃玉米,正常吗(探讨猫咪饮食偏好和玉米的营养价值)
怎样正确分析ORR图?对ORR图的分析有哪些应用场景?
纯化水电导率检测方法
匿名与安全,在线心理咨询服务的隐私保护实践
在朋友圈中如何优雅地只发文字表达心情与思考
墨鱼泡发的正确方法 墨鱼的做法
个人征信报告怎么打
知识框架图总结:从基础概念到实际应用
上海九院吴坤主任有多少经验?
咳黄痰是风寒感冒还是风热感冒
咳黄痰是风寒感冒还是风热感冒?医生专业解析
机器学习中的升维技术:从概念到实践