从半年前飞桨发布11个全新模块,到今天又发布9大新开发产品,百度工程师已经「码力」全开。
今年4月份,百度首次公布了飞桨平台全景图和多个开发模块。在短短半年之后,百度又在深度学习开发者峰会上发布了9大全新开发产品。从4个端到端开发套件、飞桨Master模式,到图学习框架PGL等多种新工具,今年第二次发布会诚意满满。
飞桨是一个源于产业的平台,它以PaddlePaddle框架为核心构建了一系列工具与组件。截止到当前,飞桨服务了超过万开发者,超过6.5万的企业。总体上,基于飞桨的16.9万模型很多都是面向应用的,它们有很大一部分直接用于更复杂的产业环境。
正如百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰所说:「深度学习正在推动人工智能进入工业化大生产阶段,而深度学习技术和平台也在不断发展,在未来的时间里也将继续发挥重要作用。我们秉承开源开放的理念,把飞桨平台开源开放,与所有开发者一起,推动科技发展、产业创新和社会进步。」
百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜介绍到,飞桨是一个源于产业实践的深度学习开源开放平台。它集核心框架、模型库、端到端开发套件、工具组件和服务平台为一体,为深度学习模型的开发、训练和部署等提供标准化、自动化和模块化服务,降低人工智能技术应用门槛,激发技术创新,促进产业升级。
飞桨就像操作系统那样将机器学习的各个方面联系起来,尽可能为开发者,甚至是为非开发者提供足够强大、足够易用的操作体验。在今天的深度学习开发者峰会中,百度深度学习技术平台部总监马艳军发布了飞桨21项新模块与新升级。
从现在的飞桨全景图来看,百度的AI生态已经覆盖了人工智能中几乎所有应用方向。
如果读者看看第一版全景图,就会发现从核心框架到工具组件这半年优化了太多方面。马艳军表示:「虽然优化工作很多,但我们做得很投入,做的东西很有意义。飞桨平台的开发要求很高,但我们有能力做好,并做出特色和优势。」
在发布会上,马艳军花费了一个多小时来介绍飞桨的各种新工具。我们发现从最基础的1.6版本新特性,到图神经网络和多任务学习等全新的工具组件,再到ERNIE和PaddleDetection等端到端开发套件,整个飞桨大家庭有太多的更新,这篇文章也只是介绍最为吸引人的新工具,更多的细节可查阅这几天的系列解读文章。
四大开发套件与飞桨Master模式
百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜表示,为了帮助制造业企业转型,百度为制造业提供了端到端的开发套件,包括PaddleSeg、PaddleDetection等套件。
在开发套件之外,吴甜还介绍了飞桨平台的Master模式,这是一种通过开放平台能力和模型,结合企业特有数据和业务流程,助力企业获得大数据和大模型性能的实现路径。吴甜说:「这种模式就像有一个Master,我们可以跟着Master学习,学到自己场景适用的模型。」
以百度的ERNIE预训练模型为例,百度在这一模型的基础上,通过增加百科知识、篇章知识、语法知识等,形成基础模型。而企业可以使用这一预训练模型进行微调和迁移学习,最终在自身的定制化任务上的将工作量大幅降低。
不论是开发套件还是Master模式,它们都旨在于实践中更高效地构建更好的模型。
升级为套件的ERNIE
因为自然语言的广泛应用,百度现在已将ERNIE从预训练模型升级为端到端开发套件,将模型作为强大的开发工具,为开发者提供模型性能上的支持。
ERNIE是基于持续学习的语义理解预训练框架,使用多任务学习增量式构建预训练任务,最新发布的ERNIE2.0中,新构建的预训练任务类型可以无缝的加入训练框架,持续的进行语义理解学习。
项目