4训练作弊爆出惊天丑闻AI大佬愤而辞职代码实测崩盘全网炸锅Llama4翻车引发热

最后编辑时间:2025-05-19 07:01:14 来源:未知 作者:未知 阅读量: 未知

  4训练作弊爆出惊天丑闻,AI大佬愤而辞职,代码实测崩盘全网炸锅 Llama 4翻车引发热议!Meta刚发布了Llama 4,紧接着就有高层请辞。有消息称,经过多次训练后,Llama 4未能达到顶尖水平,与顶级大模型相比存在明显差距。为了短期内提升指标,高层甚至建议在后训练阶段将多个基准测试集混入训练数据中。一位内部员工dliudliu表示无法接受这种做法,并在辞职信中明确要求不在Llama 4的技术报告中挂名。

  同时,扎克伯格给全员下达了死命令,要求4月底前完成Llama 4的交付。在这种高压下,已有高管提出辞职。网友Flavio Adamo使用相同的提示词让Llama 4 Maveric和GPT-4制作旋转多边形动画。结果显示,Llama 4生成的多边形不规则且没有开口,小球也不符合物理规律。相比之下,GPT-4的动画虽然不完美,但表现更好。

  还有人指出,Llama 4在LMarena上存在过拟合现象,涉嫌作弊。沃顿商学院教授Ethan Mollick认为,经常使用AI模型的人可以分辨出哪些是针对基准测试优化的,哪些是真正的进步。不过,另一位内部员工表示并没有遇到这种情况,建议让事情发展一段时间再看。

  几位AI研究人员在社交媒体上批评Meta在其公告中提到的LM Arena上的Maverick是一个“实验性的聊天版本”。在Llama官网的性能对比图中,最下面一行写着“针对对线 Maverick”,这让人感到有些投机取巧。这种区别对待使开发人员难以准确预测模型在特定上下文中的表现。AI研究人员发现可公开下载的Maverick与LM Arena上托管的模型在行为上有显着差异。

  据报道,Llama 4内部训练多次仍未能达到开源SOTA基准。领导层决定在后训练过程中混合各种基准测试集,以期望在测试中取得好成绩。爆料者可能来自Meta公司内部。此外,Meta AI研究部副总裁Joelle Pineau申请5月底辞职,但她所在的FAIR组织实际上与负责Llama项目的GenAI独立。GenAI的副总裁Ahmad Al-Dahle并未辞职。

(责任编辑:管理)

随机内容