原文:Novelty in Science, by Michael J. Black
翻译:修宇亮
信达雅,部分内容在原文基础上有所自由发挥。
对于CVPR这样的顶会,一篇投稿到底该不该中,审稿人往往是有很强烈的主观意愿的。 好似心中有一条金线,达到了就是达到了,没达到就是没达到。 这条金线标准蛮高的,最终能顺利过线的工作,真得有两把刷子才行。 那么问题来了,我们该怎么定义这个“真有两把刷子”?可能会有很多审稿人说,“当然是看这个工作够不够创新喽。” 这没毛病,但我想追问下去
你给我翻译翻译,什么是创新的科学研究?
对于各式各样的审稿人,我是身经百战见的多了。当他们谈“创新”的时候,其实谈的是“复杂”,“难度”,以及“技术含量”。 似乎必须得有这些元素,一篇工作才能算创新。所以呢,我想我们或许可以换个词
“妙”或者说“美感”这样的表述,可以帮我们摒弃掉那些关于方法复杂性和技术含量的讨论,直达科学创新的本质。 哪怕其创作技法很简单,一幅画依然可以是美的, 学术论文也是一样的道理。伦勃朗丰富的细节和色彩是一种美, 毕加索看似简单的曲线构图,也是另一种美。
现在,有了“妙不妙”这个指标,我们可以重新审视一下,那些审稿人对创新性的典型误解:
审稿人常把“简单的思路”和“没有创新性”混为一谈,但事实往往并非如此。有一种常见的审稿意见:
这个思路太简单了,只在目标优化方程的一项上动了动手脚,其他地方和之前的工作一模一样。
如果之前的确没人打过这一项的主意,那么这个改动就是事实上的创新。这个创见的真正价值在于,通过主动的思索找到了这个命门 ——— 一个稍微改动就可以带来明显效果提升的命门。最终基于此,构建出了简约的解决方案。 (译者按:福特斯坦门茨的故事,“画一条线,1美元,知道在哪里画线,9999美元。”)
这类审稿意见的存在,让我的学生们觉得,他们得把方法弄的复杂一点才能博得审稿人的青睐。但我觉得简约比没必要的繁冗更有价值。 越简单越好。比起咔咔整一个“为了复杂而复杂”的模型,在一个已有模型上略加改动就有所提升,更妙一些。
中顶会可太难了。所以审稿人就常觉得,一个工作,无论是思路还是技术方案,得看起来有点难度有点门槛才好。 仿佛文章作者必须得呕心沥血鞠躬尽瘁,这文章才配被录用。尤其是那些小白审稿人,特偏爱那种看起来颇费周折才能做出来的文章。
但一个简约的思路,往往意味着删繁就简,去糟取精,直捣黄龙。这才是科学家该干的事儿。
一个简单的思路,可以意义重大,当然,也有一定几率确是一个无足轻重的改进。这就考验审稿人的水平了,如果一篇论文提了一个很小的点, 但这个点直击症结,取得了其他类似方法都难以望其项背的效果。那么这个微创新,就很有可能不是无足轻重的那种,这工作录用了,整个领域都会受此启发。
不走寻常路往往就是创新之路。甚至从定义上来说,创新就是离经叛道,一条未曾有人涉足的道。但这种惊喜的感觉,往往是转瞬即逝的, 当听到一个很棒的主意,你觉得格局大开,但慢慢地,你会认为这个主意“理所当然”,而且往往是,想法越屌,大家就越容易认为它“理所当然”。 比如这个很典型的审稿意见
这不是很显而易见嘛,这不就是A+B?
理所当然是创新的反义词,所以,如果听完后觉得一个思路理所当然,审稿人往往就会草草下“创新性不够”的结论。但你应该站在一个过去式的视角来看待这个问题, 没审这篇文章之前,你能“理所当然”地想到要这么干嘛?能第一个想到应该这么干,然后干出来了,这本身就是创新。 所以,无论是解释起来很容易,还是一切看起来理所当然,都无损于想法本身的创新性。
审稿人最常见的错误观念,就是觉得创新性和技术细节是绑定在一块的。创新性不光指方法论,它可以有很多表现形式,如果一个数据集有一些已有数据集没有的新特性, 哪怕采集制作这个数据集用到的方法没新意,这个数据集本身也是创新的。方法论也一样,旧瓶装新酒也可以啊,只要别人没想过原来你可以这么装。就是单纯把一个复杂的模块简单化,也可以给人启发。
创新性就像刚才说的“妙”这个词一样,是可以横看成岭侧成峰,远近高低各不同的。在你批评一个工作没有技术创新的时候,扪心自问一句,是不是管中窥豹,格局小了。
不是所有创新都有用处的。它们只是新而已,并不一定真有什么实用价值。但这些可能没什么卵用,但又着实新奇的脑洞,可能会把我们引到一些未曾设想的道路上。所以,审稿人得格外小心一点。 我们很难洞悉这些所谓的“歧途”会把领域引向未知的何处,得承认自己的局限性,我们现在做的各种预测,说白了,也还是跳不出当下现状的窠臼。比如,我常常会看到这样的审稿意见
作者提了一个方法,然而这一切并没有任何卵用
“没有卵用”确实是一个问题,但如果要用这个词来评价一个新脑洞,还是有点操之过急了。审稿人心里要有X数,要有敬畏心理,不要对自己的想象力有过高的估计。
我早期的研究,主要是把鲁棒性统计 (Robust Statistics) 和马尔科夫随机场 (Markov Random Field) 联系了起来,如果说有点创新性,那就是之前确实没人想过可以这么干。 但这套A+B的打法可以搞出来很多有意思的玩意儿,做大了学术的蛋糕,基于此,也延伸出一些新的理论。 我很幸运,尽管开始做的时候没太考虑实用性的事,但现在重新回看这些工作,它们的价值已然显现,之后诸多效果拔群的实用算法都受此启发。
站在事后诸葛亮的角度,你当然可以说,鲁棒性检测和计算机视觉科学的关联是“显而易见的”。 现在,在计算机视觉任务中使用鲁棒检测器,已然是标配,并不比呼吸新鲜到哪里去。 但站在当年那个的时间点,当那个第一个吃螃蟹的人,却是小婴儿喘的第一口气。
人一辈子,会有很多次让你兴奋的时刻,但没有哪一种兴奋,可以比得上智性的火花划破科学长空的那一霎。一切如惊鸿般短暂,却像夏花一般绚烂。
“众里寻她千百度,蓦然回首,那人却在灯火阑珊处”。
灵光一现,你仿佛有了二郎神的第三只眼, 获得了一种全新的洞察世界的角度。你独自屹立在世界尽头的山巅,领略了前人从未曾欣赏过的风景,这就是创见的力量。 闪念的火花,转瞬即逝,但为了一次又一次追逐这一刹那的火花,我已然在科学的路上颠沛流离了一生。
最后需要做的,只不过是把这个抽象的闪念,翻译成具象的代码,实验以及文字。在这个过程中,美妙的思维火花可能只是隐隐约约地闪烁在脑海。 而我对诸位审稿人的请求,即是共情,想象你就是撰稿人,正处在火花飞扬前的黑夜。