百度人工智能这次玩大的!独乐缘何不如众乐?专栏
“世界将从移动优先变成人工智能优先。”当AlphaGo打败世界围棋冠军一战成名之后,有大佬如是感叹。也正基于此背景,从硅谷到北京,人工智能大潮如今皆为热浪滚滚。这个在上世纪50年代和80年代掀起过两次高潮的技术,此时又逢“第三春”。
如果仔细观摩这一轮的人工智能大潮特点,会发现其中细微的变化:过去一年来人工智能和深度学习最重要的发展不在技术,而是商业模式的转变,包括谷歌、微软、IBM等科技都将自己的深度学习IP开源,以及,中国人工智能公司的代表者百度。百度近日正式对外宣布开放其深度学习开源平台PaddlePaddle,让神秘的百度AI技术走出实验室。
开源竞赛引凤来栖,工业与学术界皆利好
开源,意味着将程序的源代码开放,任何人都可以随意拿去使用、修改。表面上看,百度等公司此举就像可口可乐会向社会公布其配方一样不可思议。毕竟天下从来没有免费的午餐。究竟,开源人工智能平台的背后有何目的?对全球人工智能发展,又会产生什么影响?
首先无疑,这又是一场类似Android在手机操作系统领域一样的生态布局。从如今Android和iOS两大系统的差异化表现来看,开放平台无疑将带来更多的价值。百度此次开源同样意义深远。
深度学习平台PaddlePaddle在开源之后,吸引了很多人工智能领域开发者的兴趣,包括一些之前一直在Tensorflow和Caffe上练手的开发者。相比其它,在PaddlePaddle的帮助下,深度学习模型的设计如同编写伪代码一样容易,设计师只需关注模型的高层结构,而无需担心任何琐碎的底层问题。尤其对于中小企业,深度学习的研究几乎没有专利的技术壁垒,并可以节约他们在初期的人力成本,集群购买与维护成本,以及底层算法工具试错成本。
PaddlePaddle的前身是三年前自主研发的深度学习平台Paddle(Parallel Distributed Deep Learning,并行分布式深度学习),且一直为百度内部工程师研发使用。此前已经被部署到百度的30多项主要产品或服务中,包括预估外卖出餐时间、预判网盘损坏时间、精准推荐用户所需信息、大体量图像分类、字符识别(OCR),计算机病毒垃圾信息检测、机器翻译、甚至在自动驾驶等领域。对于研究人员而言,也可以就此平台研究百度人工智能技术,也同时可以公开他们的研究成果,包括论文、博文、代码和专利,与他人共享。简而言之,在经历了农业-工业-服务业后,未来经济社会的一大趋势在于,而是倾向于利用与分享知识去更好地做事,技能和专业知识的价值将会超过技术价值。
按照上述思路,如果说所谓的人工智能开源是一场人工智能界的“圈地运动”,那么“圈地运动”的本质上是“圈人与知识”。开源的代码库是百度最好的招聘广告,它们不必再费力去寻找人才,人才自会对这些代码感兴趣。而在科技界,谁能赢得技术人才以及知识,谁就能占据话语权。
更多数据与反馈,提升人工智能“智力”
被马克?扎克伯格称为“心智理论”的深度学习技术作为人工智能的核心驱动,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。但问题是,深度学习不是即插即用,它需要做很多测试、调整和适配工作。
百度此番开源自家深度学习平台也将为了回收更多的反馈从而提升人工智能的智力。一切“闭门造车”并不利于人工智能、深度学习的发展,如果没有更多人工智能专业人士进行这一工作,那么无论任何巨头释放出的深度学习算法用途将有限。随着深度学习平台逐个开放,让过去那些有能力却没有机会使用的深度学习的技术人员去研究与探索,集众人之力,优化深度学习算法和模型,加快人工智能领域的发展。
对于人工智能,李彦宏曾在一次活动中提及了其与大数据之间的的关系,他认为,2006年之所以是人工智能的一个拐点,因为数据量越来越大,计算能力越来越强,过去不实用的,到2006年逐步进入了实用阶段。
所以毋庸置疑,大数据是人工智能的重要基石。对于作为世界人口最多国家的第一大搜索引擎的百度而言,这并非难事。搜索引擎每天爬取大量的数据,百度是天然的大数据企业,拥有完整、领先的大数据技术。但大数据倘若不继续无限大,对于辅助人工智能技术的成熟还差那么一点点。所以,通过开源技术以挖掘更海量的数据“金矿”成为明智选择。
一切人工智能系统在进行深度学习某个领域的时候,需要通过大量数据进行“训练”。一个典型的例子是《浪潮之巅》吴军所举例的,在算法基本不变的情形下,如果单纯透过把数据量加大1万倍,那在机器翻译中文的时候准确程度可以增加5%。今年百度世界大会上,李彦宏向外界首次展示百度人工智能的核心——百度大脑之时也用数据介绍了其成绩,语音识别率达97%。在图像能力方面的人脸识别准确率达到99.7%。百度大脑如今智商的超前发展更是基于深度学习算法、数据建模、大规模GPU并行化平台等技术,实现了无时无刻不在学习与成长。几年前,百度教会其系统识别花的图像时,就采用了从视频中截取的大约千万张图像。而后处理这些图像,又动用了大量计算机组成的计算机网络。
有意思的是,科技节从来也尊崇“礼尚往来”的道理。开源的结果也让各企业之间的关系由竞争又变得“我中有你、你中有我”的“如胶似漆”。饱尝开源甜头的成功案例比如,苹果Siri是基于开源的系统,此次做出AlphaGo的公司Deep Mind,也是基于Facebook开源的深度学习系统Torch。
百度释放信号:欲领航中国AI参与国际竞赛
人工智能一直被业内认为是继电力和互联网之后又一次对人类社会将产生颠覆式影响的技术,给全球科技巨头带来的震撼也正在迅速蔓延:谷歌、Facebook、微软、苹果、阿里巴巴、腾讯等国内外各个科技巨头铆足了劲往AI领域里探。但投入力度与表现实力相当的,全球只有三家:百度、谷歌和Facebook。关于人工智能领域,百度的棋局事实上早已越下越大。此前,无论是关于百度研究院的成立、“百度大脑”的培育,还是百度推出的Baidu Inside合作计划、“Google Brain”之父吴恩达的倾力加盟等均代表了李彦宏布局人工智能的每一粒棋子。
此次PaddlePaddle平台的推出又是百度人工智能战略的又一枚重要棋子,百度成为国内首个开源深度学习平台的科技公司。人工智能已进入剧烈竞争阶段,行业抢位正式开始,不难看出巨头们想“玩大的”以及跑马圈地的野望。除却期待提升整个人工智能行业水平的同时,这其中也暗含着百度欲领航中国AI参与国际竞赛的愿景。
过去,企业通向成功的可靠途径是优化自身独有的价值链。而如今,有远见的企业在通过打造自身竞争优势的主要方式更多地是依靠“连接”的力量。这也让笔者想到凯文·凯利在《必然》一书中提及一个重要的概念“重混”。凯文·凯利在书中援引经济学家保罗·罗墨的观点认为,经济的真正可持续性增长并非来自新资源的发现和利用,而是源于将已有资源进行重新安排后,使其产生更大的价值。
百度深度学习开源平台PaddlePaddle的开放也反映了整个科技进化的“重混”趋势,当已构造起世界上最大的深度神经网络的百度在这场开源竞赛中不断引凤来栖之时,各取所需的同时势必将带来全新的增长可能性。
值得一提的是,在开放深度学习开源平台PaddlePaddle之前,百度于9月中旬宣布成立独立风险投资公司为人工智能等下一代科技创新项目提供支持,左手技术右手资本,双管齐下的百度人工智能棋局正越做越大,以此寄希望实现中国AI在国际竞赛的超车。未来暂未可知,但至少从目前仍看出百度以科技反哺人文社会的初心所在,“倘若知识和信息是一个海洋,百度其实是一艘船,而且是一艘大船,应该帮助很多人。从此岸到彼岸,从片面到全面,从一个点到很多点,从成功走向成功”。
——————————————————
王小琉(个人微信wangxiaoliu203406),微信公号“王小琉”。科技专栏作者,前中央媒体人。
智能硬件体验者;IT&科技领域观察者、记录者、评论者。
1.砍柴网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.砍柴网的原创文章,请转载时务必注明文章作者和"来源:砍柴网",不尊重原创的行为砍柴网或将追究责任;3.作者投稿可能会经砍柴网编辑修改或补充。