如果不是因为这起AI技术造假案,南加州大学的明星教授黎颢(Hao Li)和他的公司Pinscreen不会突然受到这么大关注。
缘起于自家公司的工程副总裁Iman Sadeghi的愤怒起诉,他认为,黎颢主要有恶劣的几宗罪:
用手动制作的动画假冒AI生成效果,将造假论文提交至Siggraph大会欺骗群众,此乃其罪一。
用此虚假宣传欺骗投资方软银诈取融资,此乃其罪二。
因反对造假,他被公司解雇并遭遇人身攻击,此乃其罪三。
学术论文造假、产品虚假宣传、殴打员工……一来二去Sadeghi觉得自己忍无可忍,一纸诉状将Pinscreen告上法庭,也将这起案件带到大众眼前。
南加州大学明星教授造假,自家员工给实锤?这起外媒沸沸扬扬争论不止的故事,背后并不简单。
△ 诉状编号BC 709376
“杀马特”教授vs前谷歌工程师
可能因为故事的两位主人公自带光环,整件事情从一开始就尤其显眼。
黎颢在德国卡尔斯鲁厄大学获硕士学位后,前往瑞士苏黎世联邦理工学院攻读博士,之后奔赴普林斯顿和哥伦比亚大学做了几年的博士后。从2014年开始,黎颢开启在南加州大学任助理教授的生涯,教过不少学生,因为发型张扬,还被称为“最杀马特教授”。
△ 黎颢本人
这个形象特别的80后,曾排名微软学术搜索“过去5年计算机图形学领域十大影响力学者”首位,2015年获得了谷歌学院研究奖,常常出没于SIGGRAPH、CVPR等计算机图形学、视觉的顶会上。
2015年,title闪闪发光的黎颢创办了AI视觉公司Pinscreen,在特朗普与希拉里大选期间,Pinscreen做了一系列动态图广为流传,自此名声大振。
△ 希拉里化身鸟叔
另一位当事人Iman Sadeghi也颇有传奇色彩,获得了加州大学圣地亚哥分校(UCSD)计算机图形学博士之后,参与了迪士尼动画《魔发奇缘》中数字发型外观框架的制作,还申请了专利。此后,Sadeghi在谷歌任职软件工程师5年后被黎颢挖来,担任公司工程副总裁。
△ Sedeghi参与的2010年迪士尼电影《魔发奇缘》
而争端的起因,就是Pinscreen推出的一项明星技术:头像自动生成术。Pinscreen官方公布的效果显示,这项技术可以根据一张照片,用AI技术生成对应的卡通头像,且效果甚好。
而此时,Sadeghi却对外爆出,这个公司引以为傲的技术,其实是个彻头彻尾的谎言。
在提交给洛杉矶高等法院的诉状上,Iman列出了Pinscreen和黎颢的诸多罪名,比如欺诈、殴打、违反劳动法、违约等等。
诉状情节跌宕起伏,图文并茂,还附上了大量Skype聊天记录的截图,堪称技术界暑期档大片。
量子位试着从160页诉状中,还原一个预告片出来。
人生初见都是千般好,两人2010年左右刚刚相识的时候,黎颢跟人介绍Iman,说他是“迪士尼和梦工厂头发渲染效果背后的男人”,“渲染头发最厉害的人”。
后来,黎颢创立了Pinscreen。
经过2016年10月到2017年2017年1月的密集招揽,Iman加入了Pinscreen,任工程副总裁。
于是,他们从此产生了越来越多的分歧,直至闹上法庭。
在Iman的一系列控诉之中,引起最广泛讨论的核心问题,是一连串的造假。
诉状称,Iman加入Pinscreen之后逐渐发现公司和CEO黎颢数据造假、学术不端,还欺骗投资人。
Iman说,在提交给计算机图形学会议SIGGRAPH Asia 2017和SIGGRAPH RTL 2017的论文中,在SIGGRAPH RTL进行现场演示时,以及在给投资人做技术演示的时候,Pinscreen号称自动生成的3D形象,其实包含了不少人工制作出来的部分。
△ Pinscreen官网
学术造假
先说说学术上的事儿。
卷入这场官司的研究,是根据一张照片来自动生成3D头像,这是Pinscreen产品的主要功能,也正是黎颢的主要研究方向。他提交给SIGGRAPH Asia 2017的论文,以及在SIGGRAPH 2017 Real-Time Live(RTL)上演示的,都是这样一项研究。
据Iman说,Pinscreen的作战流程通常是这样的:
黎颢先在投给会议的论文里美化夸大一下公司的技术能力,然后,压榨着员工们加班加点,朝着美化出来的效果努力。
如果最终还是没成功实现呢?就到了造假的环节。
比如说黎颢在SIGGRAPH RTL展示的技术,从投稿到演示都被指作弊。
2017年3月底,距4月4日的RTL投稿Deadline只剩几天,黎颢在团队Skype群里说:没时间了,就算造假都没时间了……头发重建我们可能除了作弊之外别无选择了。
接下来,黎颢雇了个德国模型师Leszek,来搞定3D头像的头发。
每个头发要3个小时才能搞定,收100欧元。
黎颢对RTL尤其重视,将它视为“SIGGRAPH上最好的活动”、“SIGGRAPH上唯一要紧的展示”。
既然成功入选,演示当然不能出问题。但是团队技术的进展速度不尽如人意。
2017年6月29日,离8月1日的RTL演示只剩一个月时间,黎颢在他们讨论VR Hair Modeling的群里说:我很担心到彩排的时候什么都没用,又得可耻地作弊了。
演示的Deadline邻近,Iman去休年假了。
而这时候,Pinscreen的软件生成一个3D头像需要1分半钟,发型也不一定对。于是,黎颢决定用提前缓存的头像,当成实时的demo来展示。
他说,“要给人们一种这些头像不是预制的感觉”,“让他们觉得正在计算”。
团队按照这样的决定继续开发着。在这个阶段,有一名Pinscreen员工,专门负责手动为RTL上要展示的头像准备头发。还有员工对自己的发型提出了需求:发际线要低一点。
8月1日,SIGGRAPH RTL上,Pinscreen展示了他们根据一张照片,5秒钟“全自动、实时”生成“全新”头像的技术。
Pinscreen投到SIGGRAPH Asia的论文也同样被指作弊。
这篇论文之前被SIGGRAPH退过稿,Pinscreen修改之后,又投了SIGGRAPH Asia。
重新投稿时,他们遇到了一项比较严格的要求:提交100张图片生成的100个3D头像。
于是,就有了下边这段“找个艺术家创作100顶头发”的对话:
除了头发之外,头像的眼睛也出了问题。黎颢想到了两个解决方案:用深度神经网络,或者先手动搞定。从聊天记录截图来看,他还是比较倾向于后者。
5月22日,Deadline前一天,黎颢给团队下了最后通牒:一个小时,再搞不定就手动。
他还说:“我不相信我们能让它自动实现。”
Iman跑去质问黎颢,得到的答案是大会11月才开,到时候,这些现在需要手动的东西,就都该自动搞定了。
5月23日,黎颢对Iman说:“我们不会去展示自己没有的东西。”
他当时显然没有料到,RTL就是二人交情的终结。
Just F**ked Softbank
除了SIGGRAPH上的专家和围观群众,诉状上还列出了一个更重头的受害者:软银。
2017年8月,软银宣布投资了AI图形创业公司Pinscreen,同一轮的投资方还有Lux Capital和Colopl Next。
根据诉状所述,黎颢6月17日对员工们说,他们和软银签订了投资协议,公司估值达到了1亿美元。
同一天的聊天记录截图显示,黎颢如此总结这次融资:
Pinscreen just f**ked Softbank。
方式和论文上所用的差不多,黎颢在向软银演示技术时,用人工挑选过的发型当作自动生成的来进行展示。
不和平的分手
SIGGRAPH结束后,Iman在8月7日休完了年假回到公司上班。刚到公司1小时,就被解雇了。
他们的分手过程并不和平,但双方对这个过程各执一词。
Iman在诉状中说,他们还因为争夺Sadeghi工作用的笔记本电脑而在办公室发生了混战。Iman从办公室夺门而出,而Pinscreen的员工紧追不舍——他们殴打了Iman,抢回了笔记本电脑。
Iman还在个人主页上晒出了自己的“受伤照”:
黎颢在接受《洛杉矶时报》电话收集时,反驳了所有的诉讼指控,他表示自家的应用程序证明了Pinscreen的技术有效,并表示会在法庭上捍卫自己的技术。
“所有的指控都是100%错误”,黎颢说Sadeghi工作不力而被解雇。在他的口中,Sadeghi是一个“心怀不满的员工”。
对于殴打事件,黎颢说:“没有发生攻击,没有发生殴打。这就像你去踢足球,球场上有人碰了你。什么事也没有。”
关于“混战”所争夺的笔记本电脑,黎颢说,他们想要回这台电脑是因为里面有Pinscreen的源代码。
知乎上也有自称当天在场的匿名用户描述了另一个版本的混战现场。他说Iman不甘心被开除,拿着电脑想跑掉,打了公司一位女性,还想抢走救护员给上着的冰敷袋。而并没有人碰到“比现场每个人都高大”的Iman。
引发热议
现在,当事双方的恩怨未解,而外界也引起了轩然大波。南加州大学教授疑似造假话题,在国内外论坛引起了吃瓜群众的关注。
有自称是知情人士的网友为黎颢站台:
ID魏凌宇的知乎网友称自己是黎颢的博士生,即将入职Pinscreen,并与Sadeghi共事过一段时间。魏凌宇站队黎颢,认为Sadeghi的大部分陈述均为捏造。
“他提供的所谓证据有一部分是他自己用PS伪造的,聊天记录也是无视上下文地剪出来的。”魏凌宇说。
他同时透露出一个细节,就是Sadeghi入职后长时间请假且不参与实际工作,因此才被解雇并非因为并不存在的造假。对于是否存在虚假宣传,魏凌宇表态苹果用户可在美版APP Store下载,至于效果是否造假,用户可自行体验。
也有匿名知乎网友下载APP试用了一下,觉得周迅的合成版比较神似,而章子怡的合成版效果差了些。
△ 周迅版
△ 章子怡版
有Reddit网友开始怀疑,这件事情会不会让更多AI公司造假的内幕被曝光:
这是特殊情况,还是市场普遍的现象?
对于这个严肃的问题,网友自动站成了两队。一队人马认为,这起疑似造假事件其实只是冰山一角,很多“AI”公司都是用人工制造自动的效果。
另一队认为,AI模型的背后,必定有大量的人训练和标注,只要诚实说明人类在幕后的工作,并不要误导科学会议,即使自动化程度不高,也无可非议。
也有网友给出了中立的评价:
八卦很快就会淡忘,但是这个事情,如果说给了我什么启示,那就是应该更强调论文结果的可复现性,科研的“科”字还是要谨记。
是正当参与还是学术造假,不知道你怎么看?
本文转自微信公众号“量子位”,作者安妮、夏乙。文章为作者独立观点,不代表芥末堆立场。
来源:量子位