百度CTO王海峰在乌镇世界互联网大会AI论坛发表演讲
人工智能正在推动新一轮科技革命和产业变革,与5G等新兴技术结合,必将促进更广泛更深入的技术创新和产业应用,从而改变人类的生产生活、甚至思维方式。10月21日,第六届世界互联网大会进入第二天,百度首席技术官王海峰出席AI论坛及5G论坛。他表示,以深度学习为核心基础的新一代人工智能技术,已经具备很强的通用性,呈现出标准化、自动化和模块化特征,进入工业大生产阶段。百度大脑“软硬一体AI大生产平台”,以飞桨深度学习平台为基础底座,以百度智能云为载体,结合5G等技术,加快各行各业的智能化升级。
王海峰表示,驱动历次工业革命的核心技术都表现出很强的通用性。如今,第四次工业革命正在发生,人工智能技术趋向标准化、自动化和模块化,进入工业大生产的阶段。
百度是国内投入最早、技术最强、布局最完整的AI领军企业。从2010年开始,百度大脑就开始积累和布局AI基础能力,到如今,作为百度AI技术多年积累和产业实践的集大成,百度大脑实现了AI算法、计算架构与应用场景的融合创新,成为“软硬一体的AI大生产平台”。目前,百度大脑已开放216项核心AI能力,日调用量突破1万亿次,开发者超过150万,企业用户发布模型超过16.9万个。
王海峰介绍,百度AI大生产平台在算力和数据的基础上,包括深度学习平台、通用AI能力、定制训练平台、多端部署,以及在此基础上形成的技术解决方案,和为所有环节保驾护航的AI安全体系。
百度飞桨深度学习平台是百度大脑的基础技术底座,荣获2019“世界互联网领先科技成果”。AI论坛上,王海峰全面介绍了飞桨平台的技术优势和平台功能。他表示,在智能时代,深度学习框架和平台向下对接硬件、芯片,芯片需要针对深度学习框架进行定制优化,从而达到软硬一体优化的更优效果;向上承接各种应用,起到承上启下的作用,是“智能时代的操作系统”。
当前,飞桨在深度学习开发、训练、推理及模型库等方面都取得了经过产业实践验证的领先技术成果。作为全面开源开放、功能完备的产业级深度学习平台,飞桨服务150多万开发者,加速各行各业的技术创新和智能化升级。
在飞桨的基础底座上,百度大脑的语音、计算机视觉、语言与知识等核心技术持续不断地创新突破。
在语音识别方面,百度大脑的流式多级截断注意力模型(SMLTA)使识别准确率提升15%-20%,为用户带来更好的体验;风格迁移的语音合成技术,仅需20句话就可以制作一个人的专属声音。
百度大脑视觉理解技术在物体检测、人脸关键点识别、人脸活体等多个领域取得国际评测第一的好成绩。在3D和AR方面,已经实现人脸、手势、环境、肢体多维度的技术突破,可用于一体化人机交互和虚拟形象合成等创新应用。
语言与知识技术中,语义理解是重要的基础。百度大脑知识增强的语义理解框架ERNIE能够持续学习知识,提升效果,快速应用。ERNIE累计学习超过13亿的知识,ERNIE 2.0预训练模型在共计16个中英文任务上超越了BERT和XLNet,取得了SOTA效果。面向任务的理解与交互技术平台已经具备车载交互、地图导航、智能音箱等应用场景的6.8万定制技能,累计交互570亿次。
在机器翻译领域,百度大脑首创了语义单元驱动的上下文感知翻译模型,不仅可以实现端到端实时同声传译,准确率与人类翻译相当,还将时间延迟缩短至三秒。
以百度大脑为核心,以飞桨为基础,以百度智能云为载体,百度AI技术已经在各行各业广泛应用。例如,基于遥感影像数据,研究高精度、高自动化的目标地物检测、土地覆盖和土地利用分类方法,可以辅助国家进行重大工程用地扩张与变化情况的监测工作,并对土地资源的利用进行有效管理与控制;基于视觉技术及深度学习算法构建的智能无土栽培解决方案,将原来农业专家的个人经验数字化、产品化,提升了作物产量,降低了人力成本,使智能无土栽培具备了规模化生产的可能性。
在当天举办的5G论坛中,王海峰谈到5G为AI带来的新机遇:“AI和5G是相互赋能的关系,AI会让5G变得更加智能,更有用武之地,而5G更快速度、更大带宽的特点,也将让人工智能无处不在。”他认为,当前的人工智能技术不是孤立的,需要基于大数据,需要庞大的模型和很大的计算量,5G可以使云到边缘、到端的连接更近、更紧密,AI将更顺畅、更广泛的落地,AI与5G“双剑合璧”可以优化现有应用、催生更多可能性,推进智能化进程,服务于我们的生活。
关键词: 人工智能进入工业化