欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

专访格灵深瞳邓亚峰:计算机视觉通往光明的未来之路才刚刚开始

11-17 IT文章

原标题:专访格灵深瞳邓亚峰:计算机视觉通往光明的未来之路才刚刚开始

雷锋网 AI 科技评论按:目前,尽管人工智能领域频频涌现「人工智能寒冬」的担忧,然而无论是企业圈还是学术圈,拥抱人工智能的热情只增不减。在这种背景色中,和语音识别、自然语言理解一起并称为人工智能三大主要技术领域的计算机视觉,更成为了 Google、微软、百度、腾讯等国内外科技巨头重点发力的研究领域,以及创业公司进入人工智能领域的重要切入口。

而随着深度学习、人脸识别、物体识别、图像分割、三维重建等技术迎来蓬勃发展以及算法性能大幅提升,计算机视觉在机器人、自动驾驶、AR/VR、医疗等多个领域得到广泛应用,不过,在实际的应用场景中,仍有很多新的技术需求和研究挑战有待解决和突破。对于计算机视觉在实际应用场景中的技术需求,企业圈往往比学术圈了解得多一些;而对于这一领域面临的挑战,创业公司或许更加深有体会。

在雷锋网 AI 科技评论的专访中,人工智能创业公司格灵深瞳 CTO 邓亚峰既从一家创业公司的角度,也从一位在计算机视觉领域深耕 16 载的科学家的视角,针对计算机视觉的发展以及在应用场景落地方面所面临的挑战等问题表达了自己的见解。

专访格灵深瞳邓亚峰:计算机视觉通往光明的未来之路才刚刚开始

邓亚峰,现任格灵深瞳信息技术有限公司首席技术官,毕业于清华大学,具有 16 年的计算机视觉和人工智能方向的研发经验。在过去的工作中,他发表过论文十余篇,申请中国专利超过 100 项,其中已经授权的有 95 项。他曾任职百度深度学习研究院,负责人脸识别方向,曾经多次带领团队在主流的人脸检测、人脸识别竞赛上取得过优异成绩。其主要的兴趣是关注人工智能特别是计算机视觉技术如何从技术、产品和商业角度在真实世界中大规模落地。

计算机视觉的重要性和研究进程

沉浸计算机视觉领域十几年,邓亚峰对于计算机视觉在整个人工智能领域的地位和影响有着非常深刻的理解和体会,他表示:

一方面,人获取信息的方式有很多种,其中 80% 左右获取的信息来自于视觉,视觉本身对于人类的重要性不言而喻,承载这一感官的计算机视觉技术也会对人类以及其所在世界的各个领域产生重要的影响;

另一方面,计算机(机器)视觉是目前最活跃也是投资额最高的人工智能领域之一,它从应用角度来看非常重要,机器人、自动驾驶、智慧医疗、智慧城市、智慧工业、智慧商业、增强现实等多个 AI 应用领域都依赖机器视觉技术。

计算机视觉领域历经 50 多年的发展,到今天为止,在深度学习技术的推动下已经取得了长足进步,可以在一些应用领域达到实用水平,甚至在一些场景下已经超越了人类的水平。而技术逐渐能够在应用领域达到实用水平,也是计算机视觉领域不断吸引大企业不断投入和创业公司不断涌入的重要原因。

针对当下 Google、微软、Facebook 等国外科技巨头与百度、腾讯等国内科技巨头竞相发力计算机视觉领域,AI 科技评论也从中美两国的层面上,问到了邓亚峰对于二者在这一领域的研究进程、侧重点的差异以及各自优劣势的看法。他说道,在这一研究领域中,华人(包括在国外工作的中国人)是非常重要的一股力量,例如在计算机视觉顶级会议的接受论文中,华人学者大概可以占到 40%+。相对而言,美国在基础研究领域有更好的氛围、政策,也吸引了更多的人才,这都使得其在基础技术方面比中国更有优势;而中国在应用方面则更活跃,更有优势,其拥有比美国更巨大的市场、更多数量的数据和更宽容的政策,比如在创业公司数量、融资额度,以及人脸识别等技术水平方面,都是中国更领先。

计算机视觉领域应用场景落地方面的挑战

虽然国内外科技企业以及领域研究学者都积极地推动计算机领域的突破和前进,人脸识别、视频结构化等一系列技术也逐渐走向成熟,但是实际上我们也可以明显看到,现在计算机视觉领域真正的大规模成熟应用还是屈指可数。对于计算机视觉技术在应用场景落地方面存在的瓶颈和问题,他指出,一项技术能否大规模落地,取决于性能指标(准确率、速度)、成本、场景适应性以及创造的价值等几个因素。目前看,计算机视觉技术在上述几个方面都或多或少存在着一些问题。后续,对于准确率和场景适应性,将主要取决于算法方面的精雕细刻、数据量的增长以及算力的提升;而速度和成本方面,则主要取决于硬件的发展以及异构计算优化手段的进步。另外,对于可以创造价值的计算机视觉技术,则需要为其不断找到更有价值、更适合落地的产品场景。

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/4267.html