百度近日举行技术开放日,百度IDL院长林元庆、百度基础技术体系负责人刘炀就百度当前技术发展思路做了分享。
归结起来,不难发现百度整个技术体系目前正在形成以下特点:一个中心,两大方向,四大AI要素,四大云计算应用平台。
一个中心,即以“百度大脑”为中心。
百度IDL院长林元庆表示,百度目前全力押注的人工智能航向,最主要的就是希望打造出“百度大脑”,让机器在多个领域拥有与人脑类似的能力,比如语音、图像、自然语言处理、语义分析等,并且在此基础上拥有大数据之后的用户画像能力。
两大方向:技术开放平台,ABC体系。
首先是开放平台思路,即以开放的思路打造整个技术体系,开放百度技术以让更多外界研发和应用加入其中。目前,百度已经在深度学习、自动驾驶、NLP等领域推出了开放平台。
其次是“ABC体系”,该体系主要是对百度基础技术体系的概括,“ABC”的总结则来自百度总裁张亚勤。在ABC体系中,A是AI(人工智能),B是Big Data(大数据),C是Cloud(云计算)。
其中,B所代表的Big Data(大数据)是百度一直拥有的基础技术优势,而且作为底层基础能力,将依靠“A”AI(人工智能)和“C”Cloud(云计算)平台实现应用,并且值得注意的是,百度之所以加快打造开放平台,目的也是让更多百度搜索之外的数据可以汇集进来,数据越大,可能带来的价值也就越大。
四大云计算平台:天算、天智、天工,天像。
实际上,无论是算法还是大数据,背后都离不开“计算力”方面的保障。对此,百度基础技术负责人、百度云联席总经理刘炀则分享了百度在云计算为核心基础的“计算力”方面的思路:概括而言是“一基四天”。
一基指的是“基础云”,包括计算、存储、网络、安全。这也是传统云服务的基本要素。
更具方向性意义的是开放“四天”:
第一是“天算”,百度云智能大数据平台。
第二是“天智”,人工智能平台。
第三是“天工”,智能物联网平台。
第四是“天像”,智能多媒体平台。
目前,这四大基础平台都已通过开放的方式,赋能更多中小企业,并试图让更多百度之外的研发者参与进来。
四大AI要素:深度学习、大数据、大计算,大应用。
此外,围绕百度整个技术体系的“旗舰核心”,百度IDL院长林元庆归结了四大AI发展要素,也是百度当前最核心的研发集中方向。
这四大要素分别是:深度学习、大数据、大计算和大应用。
具体为何是这四大方向,林元庆认为背后的逻辑可以归结为:有了更好的算法,就有更好的技术,有更好的技术,就能有更好的产品,就会使更多的用户来用,因此这是一个正循环。
此外,这四大要素还会以具体平台实现落地:
第一是深度学习的平台。把百度的深度学习平台PaddlePaddle开源,做成一个非常好的开源系统。
第二是开放百度为代表的大规模的计算资源。不管是CPU还是贵得让你买不起买不到的GPU,百度自己买,开放给你用。“这个计算资源跟PaddlePaddle我们会向社会开放和科研单位开放,他们只需要一个账号,就可以在这个平台上去做各种各样的实验和人工智能的研发。”
第三是大数据。百度会和目前的共建单位,以及未来可能的合作单位一起定义问题——通过数据或Benchmark来定义人工智能。
“我们会去看哪一些人工智能的方向是人工智能领域一些非常核心的,同时也需要技术突破的。这些方向,百度跟合作单位会投入很大的力量,吸引非常多的科研单位到这个平台上我们一起来做研发。我们提供深度学习平台、大计算平台和大数据平台,我们一起研发,希望能够在一些技术上取得非常大的突破。”
第四是大应用。在上述研发进展取得不错技术之后,希望能在百度诸多平台上应用起来,让这些研发出来的技术能够获得非常广泛的应用。
此前,百度牵头成立的“中国深度学习技术及应用国家工程实验室”已经正式揭牌,兼任该实验室主任的林元庆表示,将会以百度为核心,联合合作伙伴一起推出国家级的七大AI应用平台:深度学习平台、生物特征识别平台、听觉感知平台、视觉感知平台、新型人机交互平台、知识产权平台和标准化平台。
其中,深度学习平台是最基础的平台,将由百度来搭建,核心基础是百度的PaddlePaddle深度学习平台。具体方向上,一方面是开放PaddlePaddle深度学习平台,另一方面是开放深度学习的计算模块,不管有GPU,还有大机型的CPU,希望把这个建成中国最大的深度学习平台。
听觉感知平台。包括语音识别、语音合成、语义理解,还有后端的一些资源。将由百度和清华大学一起做,该技术还让百度入选了2016年的MIT全球十大突破技术榜单。
视觉感知平台,包括检索识别、清晰图像识别、医学影像分析等,未来目标是希望拿到一张CT,就能让机器分析出是不是有癌细胞。这个平台由百度和北航共建。
生物特征识别平台。这个技术代表性的是人脸识别等,但未来的目标是生物特征识别、身纹识别、虹膜识别等身份识别。值得一提是,在2017年MIT十大突破技术中,该技术里上榜的所有公司均来自中国,分别是:百度、阿里巴巴和Face++。这平台会由百度和清华大学共建。
新型人机交换平台,值得关注的是其中会融合计算机视觉的AR。未来目标是把各种自然的交互系统放在一起,打造一个基于AI的交互系统,无论是触摸、语音语义识别、自然语言理解,以及计算机视觉等,都融合到一起。这个平台由百度和北航共建。
另外两个平台是知识产权保护和标准化平台。知识产权保护由电信研究院来打造,会包括知识产权分析、趋势研究以及研发建议等。标准化平台,则由电子四院来研究,目标是把实验室研发出来的很多技术都标准化,希望很多研发出来的技术,当它足够成熟的时候,能够应用在各个行业。