首页 > 科技 > 智能家电 > 深度学习集体瓶颈 产业化加速时代CV研究出路在哪里

深度学习集体瓶颈 产业化加速时代CV研究出路在哪里

  ImageNet比赛结束了。

  夏威夷当地时间7月26日,CVPR 2017最后一天,李飞飞教授等学者在ImageNet workshop上缅怀过去8年计算机视觉(CV)发展的ImageNet时代,同时宣布挑战赛最终归于Kaggle。

  同一天上午,WebVision也公布了第一期获奖名单。

  WebVision竞赛由苏黎世联邦理工、Google Reasearch、卡耐基梅隆大学等共同组织。但相较而言,WebVision所用数据集直接从网络爬取,没有经过人工标注,含有大量噪音之外,数据类别和数量也远大于ImageNet比赛所用数据,所以难度也高很多。

  所以,ImageNet为什么结束?WebVision将如何推动CV发展?CV学术与应用研究的出路又在哪?带着这些问题,AI科技评论采访时也指出,

  现在互联网上的数据很多都是视觉与文本信号共同出现,譬如腾讯视频,不仅有视频信息,还有音频信息,还有相应的字幕、评论和弹幕等信息。如何挖掘或者学习他们之间的相关性也是业界的研究热点。

  近年来计算机视觉+NLP相结合,出现了很多热点的研究问题,譬如图像文本匹配、图像描述生成、图像问答等。今年的CVPR的其中一个keynote也是邀请了NLP领域斯坦福大学的知名教授Dan Jurafsky,讨论了language方面的研究进展。因此,多个交叉领域的研究,更能推动研究成果在实际业务场景中的应用。

  所以,讨论完这些方法论后,对于“未来要实现这个突破,还要经历一个怎样的创新期?”这个问题,跨领域机器学习的技术融合,例如计算视觉、自然语言处理、语音识别等的融合;以及学术界与产业界的进一步研究合作,是业内人士普遍希望推进的路径。

  同时,中国互联网公司的众多创新,大多还停留在应用层面或技术层面。而美国创新科技的研究,往往是从理论的根基出发,建立一套完整的思维方式,这也是为什么美国,尤其是硅谷,在过去数十年一直引领创新的原因:他们有能力也有意愿从基础研究出发,与大学、研究机构保持密切关系,共同完成学术创新和商业化。

  如商汤科技CEO徐立所言,AI的火热都不是一夜时间的事情,虽然看起来像是一夜梨花开,但更重要是一直以来源头创新工作的厚积薄发。在本届CVPR,商汤科技与香港中大-商汤科技联合实验被共同录取23篇论文,这个数量远高于BAT。“现在,基础研究不能丢,才能带来足够的时间窗口。AI的发展需要产业和研究相结合,以定义问题,解决问题。”

本文来自投稿,不代表本人立场,如若转载,请注明出处:http://www.souzhinan.com/kj/a128329995.html