脸书AI科学家贾扬清:科技巨头为何愿将深度学习框架开源?

时间:2017-07-13 14:57

(原标题:脸书AI科学家贾扬清:科技巨头为何愿将深度学习框架开源?)

当地时间1月11日,在美国圣克拉拉会议中心,当贾扬清结束自己在人工智能先锋大会(AI frontiers)的发言走下讲台时,他像摇滚明星一样被许多人围着。其中有希望能和他合影的学者,媒体记者,还有他许久未见的朋友。

脸书AI科学家贾扬清:科技巨头为何愿将深度学习框架开源?

贾扬清 资料图

作为全球最普遍使用的图像识别开源软件Caffe的作者,贾扬清是人工智能深度学习领域里的佼佼者。在当天的演讲中,贾扬清介绍了自己参与研究的深度学习框架,需要在哪些方面改进。贾扬青说,最为重要的是,要与全球共享成果,开源已有的深度学习框架十分关键。

贾扬清是浙江绍兴人,本科和硕士就读于清华大学,随后在美国加州大学伯克利分校获得计算机科学博士学位。2013年毕业后,他加入谷歌,是谷歌大脑TensorFlow的作者之一。2016年2月从谷歌离职,贾扬清加入Facebook,致力于前沿AI研究和平台开发。

深度学习框架开源已是趋势

目前,在人工智能领域的竞争中,Facebook、谷歌、亚马逊都拥有自己的深度学习框架。Facebook有Torch和Caffe,谷歌有Tensorflow,亚马逊则拥有MXnet。值得一提的是,这三家都无一例外地选择了开源,向开发者公布了自己内部使用的深度学习框架。

随着人工智能的复兴,在深度学习(Deep Learning)的浪潮下,Caffe作为一个高效、实用的深度学习框架受到了国内外的广泛关注。开源深度学习框架,对于开发者来说可以不再需要从复杂的神经网络开始编代码。开发者可以依据自己的需要,使用已有的训练模型,自行训练得到模型的参数,也可以在已有模型上增加自己的训练层数,或是在一开始就选择自己需要的数据分类器。简单来说,一个深度学习框架就是一套积木,各个组件就是某个模型或算法的一部分,你可以自己设计如何使用积木去堆砌符合你数据集的积木。

“我毕业之后一直喜欢开源的这个事情。因为无论自己在哪,开源对于社区做的贡献最多,它能让任何人在任何地方都能用。这让科技没有国界的概念了。到后来,许多人也确实是这样做,开源成为了一种趋势。”贾扬清告诉澎湃新闻()。

将深度学习框架开源,除了便于全球范围内的开发者使用外,在贾扬清看来,这还会给这一领域带来滚雪球的效应。举例来说,一个团队花3万美元做的论文,如果能在第二天就分享给整个社区,那么每天就会有更多的数据产生,整个技术的叠代也会更快。“如果大家需要花一年的时间才能看到论文,那现在AI的发展就不是这个样子了。”贾扬清说。

对于拥有深度学习框架的公司来说,开源也意味着能吸引到更多优秀的人才。因为这些开源的代码库是它们最好的招聘广告,开发者对这些代码感兴趣,自然会聚集到这些平台上来。此外,若自己的深度学习框架得到广泛使用,也会为公司在未来的人工智能敬重中赢下话语权。

2016年11月份,贾扬清和他的同事成功开发出一套深度学习系统,可以完全运行在智能手机上,名为Caffe2Go。Caffe2Go的功能在于可以让用户在手机app中拥有新的相机应用,实时在视频中添加艺术元素。这也是Facebook在深度学习领域的重要突破。

经过60多年的发展,人工智能对于计算机科学产生了深远的影响,但它大部分需要依赖于大型数据中心,这样的局限性让人无法真正使用人工智能的服务。即使有部分人称自己可以做到“实时”用AI处理某物的技术,但实际上仍然有延迟,因为数据必须发送到数据中心,在GPU上运行。

让深度学习框架更快、更便捷地在移动设备中使用,成为这一领域里的另一个趋势。贾扬清告诉澎湃新闻,目前自己的工作还在继续推进Caffe,希望能让它有更多应用领域的突破。在Facebook内部,技术和产品有着良好地沟通,产品环节有新的创意和想法也会和技术部门进行交流。

除此之外,在当天的演讲中,贾扬清还谈到了未来如何更好地建立深度学习框架。他提到了4个因素:可扩展性,轻便,增强计算模式,模块化设计。这4个因素也是Facebook深度学习领域努力的方向。

中国和美国在深度学习里走了两个不同的方向

人工智能先锋大会举办地在圣克拉拉,是硅谷南部的中心,由硅谷人工智能和大数据协会主办,邀请来自谷歌、Facebook、微软和亚马逊等人工智能前沿公司的顶级科学家。

值得一提的是,在第一天的大会现场,不仅是演讲者中有许多中国背景的学者和领域专家,来参会的也主要以华人居多。