DeepSeek与清北应届生:AI创新的双向奔赴
DeepSeek与清北应届生:AI创新的双向奔赴
2025年伊始,一家成立不到两年的中国AI公司DeepSeek再次引发科技圈热议。其最新发布的DeepSeek-V3大模型,仅用1/11算力就达到了超越Llama 3的性能,这一突破性成果背后,是一支由清华大学和北京大学(简称“清北”)应届生为主力的年轻团队。
为什么DeepSeek偏爱清北应届生?
DeepSeek在招聘时明确表现出对清北应届生的偏好,这并非偶然。公司创始人梁文锋曾表示,他们更看重候选人的学术潜力和创新意识,而清北的学生恰好符合这些要求。
从DeepSeek的招聘信息来看,公司提供的薪资待遇极具竞争力:正式员工年薪最高可达154万元,实习生月薪约1万元,日薪500元,并有租房补贴。这种高薪策略显然有助于吸引顶尖人才。
清北AI人才的培养特色
清北两所在AI领域的培养方案各有特色,但都强调了跨学科融合和实践能力的培养。
清华大学求真书院与自动化系联合推出的“数学+人工智能”交叉培养模式,前两年侧重数学基础学习,后两年转向人工智能课程,旨在培养兼具理学思维和工科实践能力的复合型人才。
北京大学智能学院则依托机器感知与智能教育部重点实验室,拥有84名高水平教职员工,包括院士、长江学者等顶尖人才。学院在2012、2017、2022年三次评估中均被评为“优秀类”实验室,显示了其在AI领域的强大实力。
DeepSeek团队的创新突破
DeepSeek团队的年轻成员们展现出了惊人的创新力。例如,DeepSeek-V2的核心创新MLA(Multi-head Latent Attention)架构,就是由北大物理系毕业的高华佐和北邮的曾旺丁提出的。这一创新将显存占用降低到传统MHA架构的5%-13%,大幅提高了训练效率。
在DeepSeekMath项目中,清华博士生邵智宏、北大博士朱琪豪和Peiyi Wang等年轻研究者提出的GRPO(Group Relative Policy Optimization)算法,显著减少了训练资源需求,这一成果甚至被阿里Qwen 2.5采用。
校企合作模式的启示
DeepSeek与清北人才的合作模式,为中国AI产业的发展提供了重要启示。这种模式不仅让企业获得了顶尖研发人才,也使高校学生有机会将理论知识转化为实际成果,实现了产学研的良性互动。
DeepSeek的成功证明,中国AI企业不仅可以依靠应用创新,更可以在基础技术创新上有所作为。正如梁文锋所说:“务必要疯狂地怀抱雄心,且还要疯狂地真诚。”这种追求原始创新的精神,或许正是中国AI产业突破重围的关键。
结语
DeepSeek与清北人才的合作模式,为中国AI产业的发展提供了重要启示。这种模式不仅让企业获得了顶尖研发人才,也使高校学生有机会将理论知识转化为实际成果,实现了产学研的良性互动。
在当前全球AI竞争日益激烈的背景下,DeepSeek与清北人才的合作模式,为中国AI产业的发展提供了重要启示。这种模式不仅让企业获得了顶尖研发人才,也使高校学生有机会将理论知识转化为实际成果,实现了产学研的良性互动。