你不知道的“SCI生成器”

2015-4-30 10:59| 发布者: 安丰贞| 查看: 6308| 评论: 0|来自: 环球科学

摘要: 十年前,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的几个学生发现有些论文发表的过程实在太“水”,就决定利用它们来找个乐子。05届硕士、09届博士Jeremy Stribling,02届工程硕士Dan Aguayo和08届博士Max Krohn,三个人在课程课题的间隙花了一两个星期开发了个小软件叫做“SCI生成器”,它可以自动随机生成完全没有意义的计算机科学“论文”,其中还包含各种以假乱真的图表和引用 ...
       近几年,整个学术出版领域每年新发表的文章高达200万,登在30 000本同行评审的期刊上。

拍摄于2005年,从左到右分别是Dan Aguayo、Max Krohn和Jeremy Stribling。Credit Frank Dabek


       这个数字可能代表着科学水平的进步,但也有人批评随着论文数的增长,出现了很多低质量的“山寨出版商”(predatory publisher),他们每周给研究人员发垃圾邮件广告“征集论文”,只要论文作者交钱给他们,连审都不用审就可以直接发表。

       十年前,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的几个学生发现有些论文发表的过程实在太“水”,就决定利用它们来找个乐子。05届硕士、09届博士Jeremy Stribling,02届工程硕士Dan Aguayo和08届博士Max Krohn,三个人在课程课题的间隙花了一两个星期开发了个小软件叫做“SCI生成器”(英文名为SCIgen,官方网站http://pdos.csail.mit.edu/scigen/scipher.html),它可以自动随机生成完全没有意义的计算机科学“论文”,其中还包含各种以假乱真的图表和引用。

       SCIgen的前身是Krohn之前参与开发的在线学习指导SparkNotes的一部分,后者可以生成语法完全正确的高中生论文。它的原理类似于填词游戏,将“分布式散列表”和“Byzantine容错”这类计算机领域的流行词随机插入文本中。

       这个程序本身其实很粗糙,但它真的忽悠了不少人:在2005年4月,三个人把他们自动生成的论文《Rooter:处理接入点与冗余的典型合一方法》作为非同行评审的论文投给了世界系统学、控制论和信息论多方会议(WMSCI),因为他们听说这个会议的论文接收出了名的“水”。结果,论文被接收了。

       三个学生的骗局最终被研究者们揭穿以后,《波士顿环球报》(The Boston Globe)、CNN和BBC都对此事产生了极大兴趣,作为这篇“论文”的“第一作者”,Stribling的电话都快被打爆了。他自豪地表示,自己被列为第一作者完全是系统随机的安排。

       在全球媒体的关注下,WMSCI大会撤回了给他们的邀请函。不过三位同学可没被吓跑,他们自己募集了2500美元跑去了会议所在的佛罗里达州奥兰多市,在大会举办的地点租了一间房,用假名字、假名片甚至假的胡须,开了他们自己的“分会场”,做的报告内容也是随机生成的。

       这件事在当时看起来可能也只不过是个噱头,就像纽约大学一位物理学家写了一篇胡说八道的文章却被一本研究后现代文化的期刊接收了一样。但SCIgen的影响却出乎意料地大了起来,好多研究者都用它来揭发审查标准过低的学术会议,三个学生的恶作剧更是让世界上最大的技术人员组织,电气与电子工程师学会(IEEE)撤回了对WMSCI大会的赞助。2013年,一位法国研究者在IEEE和Springer出版公司旗下的期刊中发现了超过120篇用SCIgen生成的论文,迫使IEEE和Springer赶紧将它们移除。就在前几天,Springer宣布,他们发布了一个开源软件叫做“Sci探测器”(SciDetect),专门用来自动检测由SCIgen生成的论文。

       之后的MIT三人组走上了不同的人生之路:Aguayo成为了美瑞凯公司(Meraki)的技术主管,Krohn作为SparkNotes和交友网站OKCupid的共同成立者,现在开了一家新成立的公司,叫做Keybase,目标是让密码学更容易为人使用。而Stribling先后在IBM、Google和Nicira工作后,在这个月也加盟了Krohn的Keybase公司。

       但哪怕已经过了十年,他们的SCIgen软件仍然生生不息。Stribling说,论文生成器的页面每年浏览量仍达60万次,导致这个来自MIT计算机与人工智能实验室的网页每几个月都要崩溃一回。软件的开发者至今还一直能收到邮件,有计算机系学生自豪地宣称他们又用SCIgen生成的论文揭穿某某某大会是个水货,或者其他研究者敦促他们赶紧研发其他学科领域的版本。

       “我们原本的目的只是报复一下天天给我们发垃圾邮件的出版商,同时让更多人关注到这种事情的存在,”Stribling说,“从这个角度上说,我们已经超额完成任务了。”说完他又回复到面无表情的状态。

       在SCIgen软件10周年之际,三个人再次聚首,又在谋划对山寨出版商们的下一步会心一击。

       他们写的新软件叫做“SCI加密器”(SCIpher),可以让你把秘密信息转变成一封“征集论文”的垃圾邮件,比如“关于软件定义技术的LYGNY研讨会欢迎您提交论文”。

       而收到这封邮件的人将邮件丢回到软件里,就能得到原始的信息。

       Stribling把SCIpher看做一种传送秘密情报的无聊方式——当然,顺便也嘲笑一下这类“学术会议”荒诞而充满行话的名字。

       “我们从SCIgen的语句库里找出随机的学术流行词,用它们组成可以发音的首字母缩略词,就跟众多真实的学术会议名一样,”Stribling说,“这种方法还有一个好处:加密的邮件通常都会引起侦查员的注意,但有谁会看山寨出版商和野鸡会议发来的垃圾邮件呢。”(翻译:丁家琦)

       原文链接:http://phys.org/news/2015-04-mit-students-world-scientific-journals.html


1

鲜花

握手

雷人

路过

鸡蛋

刚表态过的朋友 (1 人)

最新评论

阅读次数
6308
回复
0
若内容精彩,赶快告诉您伙伴吧

相关专题

    推荐下载 相关帖子

      热门内容

      360网站安全检测平台