上海研究员杨磊揭露苹果论文漏洞,引发AI界热议
时间:2026-01-08 12:00
小编:星品数码网
在近期的机器学习领域中,来自上海的阶跃星辰公司研究员杨磊因其勇敢揭露苹果团队的一篇论文中的重大漏洞而备受关注。这一事件迅速引发了业内的广泛讨论,吸引了十万计的关注者,也有众多行业大V站出来支持他。这位刚刚进入大语言模型赛道一年多的年轻程序员,他的经历宛如一部现实版的“哪吒闹海”,一场科学真理的追求与大科技公司之间的对抗让人倍感振奋。

事情的起因是杨磊在同事的推荐下查看了一篇由苹果团队发布的视觉推理基准论文。该论文不仅在一个开放的预印本上发布,且还为即将举行的国际表征学习大会(ICLR 2026)所投递。这篇论文声称展示了苹果在人工智能领域的最新研究成果,其核心内容是设计一套基准测试,通过统一的数据集来评估不同AI模型的表现。
杨磊的研究背景和对科研的严谨态度促使他对这项研究产生了浓厚的兴趣。作为被认定为“卷王”的团队成员,杨磊加班多个周末,试图将自己的模型与苹果的基准测试相适配,他最终感到的只有失望。“模型的表现远低于预期,”他对此说道。“苹果的论文所提供的看似合理的基准测试给出的结果几乎让我的模型排名垫底。”
面对这一结果,杨磊起初以为问题出在自己的模型上,于是进行了认真调查。但切实的分析让他震惊:苹果论文提供的开源代码存在一个根本性的问题,测试流程本应使用图像内容,而不是仅仅传递图片的路径链接。这使得模型根本无法获取到图像信息,只能以文本形式完成测试,而这种测试实际上是毫无意义的。
在向论文作者反馈这一问题后,杨磊收到的回复却是这段代码仅为“伪代码”。随后,他又尝试修复这个问题,然而这次更改反而让模型的得分变得更低。无奈之下,杨磊不得不展开进一步的分析,试图查明背后的原因。他仔细查看了自己的模型在前20道题中的回答,结果让他吃惊不已——其中有六道题的“参考答案”明显错误。而这些错误可能是由于模型自动生成的参考答案加之质量检测的缺失,导致了大量的虚假信息。
“我原本认为苹果作为大厂,其研究会更可靠,未曾想到自己耗费大量时间与精力,却发现掉入了一个如此低级的陷阱,”他感慨道。在杨磊向GitHub上公开反馈并提示其严重问题后,论文的作者在六天后回应,虽然确认了问题的存在,却并未修正数据。
这引发了杨磊的深思,在国际表征学习大会的审稿过程中,竟然没有评审人员发现这些“参考答案”的质量问题。为了避免更多研究人员重蹈覆辙,杨磊通过公开评论呼吁加强对数据集质量的重视,强调不应盲目相信来自大厂的信息。“我希望这一经历能让AI社区更加和谐,大家在学术研究时要保持批判性思维。”
杨磊的这一举动在国内外机器学习圈内引发了强烈反响,许多从业者对他的勇气表示赞许。随着人工智能的迅速发展,优质研究的标准被不断提高,但粗制滥造的研究也在增多。尤其是近年来,每两年投向顶级会议的论文数量几乎翻番,许多审稿人由于是做义务工作,难以全面发现问题。
杨磊的经历让许多人意识到,科研领域同样存在盲区和误区。在这个追求显著成果的环境中,科研人员更应加强沟通与批判性思考,共同捍卫科学研究的严谨性与真实性。这是杨磊所希望达成的目标。作为年轻的科研人员,他用实际行动说明了即便是大公司也可能出现失误,科研应以真理为导向,而非唯名次论。通过这次事件,杨磊不仅赢得了业界的关注和支持,也为后续的研究者敲响了警钟,提醒大家要对科研成果保持必要的质疑与审视。

