4训练作弊爆出惊天丑闻AI大佬愤而辞职代码实测崩盘全网炸锅Llama4翻车引发热

TAG标签| 网站地图| 收藏本站

返回首页

4训练作弊爆出惊天丑闻AI大佬愤而辞职代码实测崩盘全网炸锅Llama4翻车引发热

最后编辑时间：2025-05-19 07:01:14 来源：未知作者：未知阅读量：未知

　　4训练作弊爆出惊天丑闻，AI大佬愤而辞职，代码实测崩盘全网炸锅 Llama 4翻车引发热议！Meta刚发布了Llama 4，紧接着就有高层请辞。有消息称，经过多次训练后，Llama 4未能达到顶尖水平，与顶级大模型相比存在明显差距。为了短期内提升指标，高层甚至建议在后训练阶段将多个基准测试集混入训练数据中。一位内部员工dliudliu表示无法接受这种做法，并在辞职信中明确要求不在Llama 4的技术报告中挂名。

　　同时，扎克伯格给全员下达了死命令，要求4月底前完成Llama 4的交付。在这种高压下，已有高管提出辞职。网友Flavio Adamo使用相同的提示词让Llama 4 Maveric和GPT-4制作旋转多边形动画。结果显示，Llama 4生成的多边形不规则且没有开口，小球也不符合物理规律。相比之下，GPT-4的动画虽然不完美，但表现更好。

　　还有人指出，Llama 4在LMarena上存在过拟合现象，涉嫌作弊。沃顿商学院教授Ethan Mollick认为，经常使用AI模型的人可以分辨出哪些是针对基准测试优化的，哪些是真正的进步。不过，另一位内部员工表示并没有遇到这种情况，建议让事情发展一段时间再看。

　　几位AI研究人员在社交媒体上批评Meta在其公告中提到的LM Arena上的Maverick是一个“实验性的聊天版本”。在Llama官网的性能对比图中，最下面一行写着“针对对线 Maverick”，这让人感到有些投机取巧。这种区别对待使开发人员难以准确预测模型在特定上下文中的表现。AI研究人员发现可公开下载的Maverick与LM Arena上托管的模型在行为上有显着差异。

　　据报道，Llama 4内部训练多次仍未能达到开源SOTA基准。领导层决定在后训练过程中混合各种基准测试集，以期望在测试中取得好成绩。爆料者可能来自Meta公司内部。此外，Meta AI研究部副总裁Joelle Pineau申请5月底辞职，但她所在的FAIR组织实际上与负责Llama项目的GenAI独立。GenAI的副总裁Ahmad Al-Dahle并未辞职。

(责任编辑：管理)

上一篇：《无主之地4》肩负重要任务！系列销量破亿的最后一步
下一篇：创意设计点亮汉字之美

随机内容