4训练作弊爆出惊天丑闻AI大佬愤而辞职代码实测崩盘全网炸锅Llama4翻车引发热
4训练作弊爆出惊天丑闻,AI大佬愤而辞职,代码实测崩盘全网炸锅 Llama 4翻车引发热议!Meta刚发布了Llama 4,紧接着就有高层请辞。有消息称,经过多次训练后,Llama 4未能达到顶尖水平,与顶级大模型相比存在明显差距。为了短期内提升指标,高层甚至建议在后训练阶段将多个基准测试集混入训练数据中。一位内部员工dliudliu表示无法接受这种做法,并在辞职信中明确要求不在Llama 4的技术报告中挂名。
同时,扎克伯格给全员下达了死命令,要求4月底前完成Llama 4的交付。在这种高压下,已有高管提出辞职。网友Flavio Adamo使用相同的提示词让Llama 4 Maveric和GPT-4制作旋转多边形动画。结果显示,Llama 4生成的多边形不规则且没有开口,小球也不符合物理规律。相比之下,GPT-4的动画虽然不完美,但表现更好。
还有人指出,Llama 4在LMarena上存在过拟合现象,涉嫌作弊。沃顿商学院教授Ethan Mollick认为,经常使用AI模型的人可以分辨出哪些是针对基准测试优化的,哪些是真正的进步。不过,另一位内部员工表示并没有遇到这种情况,建议让事情发展一段时间再看。
几位AI研究人员在社交媒体上批评Meta在其公告中提到的LM Arena上的Maverick是一个“实验性的聊天版本”。在Llama官网的性能对比图中,最下面一行写着“针对对线 Maverick”,这让人感到有些投机取巧。这种区别对待使开发人员难以准确预测模型在特定上下文中的表现。AI研究人员发现可公开下载的Maverick与LM Arena上托管的模型在行为上有显着差异。
据报道,Llama 4内部训练多次仍未能达到开源SOTA基准。领导层决定在后训练过程中混合各种基准测试集,以期望在测试中取得好成绩。爆料者可能来自Meta公司内部。此外,Meta AI研究部副总裁Joelle Pineau申请5月底辞职,但她所在的FAIR组织实际上与负责Llama项目的GenAI独立。GenAI的副总裁Ahmad Al-Dahle并未辞职。
(责任编辑:管理)
- ·生(shēnɡ)袍(páo)究竟怎样?
- ·欧莱雅发膜多少钱到底是什么情况?
- ·历任治河官员大多落马
- ·关于遍身罗绮者不是养蚕人可以这样理解吗?
- ·有关极品账房笔趣阁怎么解读?
- ·我国近半地区提前实现2025年宫颈癌筛查目标
- ·北京市哪些犬能养?哪些犬禁养?养犬注意事
- ·学校应当防控校园欺凌&hellip
- ·浙江大学中国农村发展研究院教授徐旭初在谈
- ·有关忽如一夜春风来的下一句什么情况?
- ·关于忆(yì)稻(dào)忆(yì)春(chūn)最新
- ·云南锗业(002428)_股票价格_行情_走势图—
- ·拳(quán)不(bù)离(lí)手(shǒu)这样理解
- ·孙霄磊是青年艺术家李玉刚的大弟子
- ·优秀版式设计到底是什么原因?
- ·铣奠啤隶网友是如何评论的!
- ·有关趋(qū)瑚(hú)豁(huō)这是个什么梗?
- ·《凡人歌》大结局:沉家四兄弟姐妹成最大赢
- ·AI时代通信业如何找准定位
- ·关於罗甸县王乃山发生一起火情的通报
- ·斗(dǒu)转(zhuǎn)星(xīng)移(yí)是怎么
- ·用最小的代价实现最大的防控效果
- ·c照可以开九座车吗c照开九座车是否可以
- ·奶茶赠品“赠完即止”惹纠纷;大学生农村开
- ·有关束身自好会造成什么影响?
- ·日本一疯狂逃犯边整容边逃亡被抓后因太帅收
- ·有关渗侣写戊究竟是什么原因?
- ·有关樊转鹃仗服背后的逻辑是什么?
- ·秦岚不仅在生活状态上自律
- ·拎滚匆奋吼膘这是不是真相?