是什么给了150万开发者拥抱深度学习的底气?


在企业数字化转型的浪潮中,对于AI等新技术的应用,先进与落后的企业之间,会有多大的差异?

与南方电网广东能源技术公司过去一年的合作中,百度为其提供全方位的AI支持,更多地解决了堪称“苛刻”的业务场景诉求。

这个案例,仅是百度AI在电力能源行业的一次成功下探,其背后,却离不开作为时下国内广受企业级开发者追捧的开源深度学习平台“飞桨”(PaddlePaddle)的支持。 

究竟什么样的企业需要深度学习平台?或许可以站在两个层面来回答:一是在开发层面,好的深度学习平台大大降低了企业和个人开发者构建AI应用难度;一个是在业务层面,利用AI创新应用的企业,尤其是在传统领域,它们最终的目的是通过新技术颠覆现有的商业模式。

一个大的趋势是,国内企业信息化、数字化、智能化转型正呈现一种“三化融合”的状态。即利用互联网、云技术实现企业业务在线,利用数据处理技术为企业构建数据中台,以及利用机器学习、深度学习等AI手段,深入挖掘数据的价值。

正如百度首席技术官、深度学习技术及应用国家工程实验室主任王海峰所言,“深度学习正在推动人工智能进入工业大生产阶段,具有很强的通用性,同时具备了标准化、自动化和模块化的基本特征,推动人工智能技术从实验室走向产业,并且越来越大规模使用起来。而深度学习技术和平台也在不断发展,在未来的时间里也将继续发挥重要作用。”

那么,为什么飞桨能成为广东电科院能源技术公司智能装备赋能的首选呢?我们先来看看电网公司在电力巡检环节所面临的挑战。

巡检机器人的“火眼金睛”

实际上,飞桨与广东电网合作的契机源自于当前广泛应用于电力行业的巡检机器人。传统的巡检方法主要依靠人工巡视,而电力机器人可以代替人工从事高危险性和高重复性的工作。

其中表计读取是电力机器人巡检的一项重要工作内容,传统图像识别方法由于复杂背景、光线条件等因素,会影响到检测与识读的准确率。 

为此,广东电网利用飞桨平台的技术优势,与百度联合开发了电网特定场景下读取表针的图像的语义分割技术,并应用到智能巡检机器人身上,使其表计的深层次特征提取能力大大提高,方法的准确率和鲁棒性显著提升,在表计目标检测、示数读取等方面的效果尤为显著。 

一组数字是,从6小时的人工巡检变为15分钟的巡检结果复核,实现对输变电设备的实时检测和分析。

实际上,飞桨EasyDL定制化训练和服务平台(经典版)也可以应用于巡视电线是否破损、是否有鸟窝等场景。

“EasyDL这项服务是相对轻量级的,不需要技术的深度对接,但表计识别这个场景,对技术的依赖还是蛮深的。”谈及与广东电网的合作,百度深度学习技术平台部总监马艳军感慨颇多,“关键在于,飞桨是贴近核心业务场景的,像对输变电设备进行巡检,是电力行业共同的痛点。” 

这恰恰说明,针对企业中不同难度的场景诉求,飞桨提供的产品形态也不相同,核心都是为辅助客户真正解决问题。

与此同时,参与合作的广东电网的工程师杨英仪博士还是百度黄埔学院的学员,通过在黄埔学院的学习,从深入学习的入门者成为了飞桨平台的优秀开发工程师,快速成长为广东电网智能巡检机器人重大攻关团队在AI领域的骨干成员。这也是飞桨既能授之于鱼,也能授之以渔的思路。尽管企业具有丰富的 AI 技术应用与落地场景,拥有深度学习所需的数据和技术条件,但他们在理论及技术应用方面都存在不小的挑战。

从技术到业务再到人才的赋能,这很好地形成了一个闭环。

飞桨的持续进化

从目前来看,企业选择飞桨,大多还是为了满足特定的应用场景需求,但飞桨也在根据实际场景中的用户诉求,不断着完成自我进化。不同于单纯面向开发层面的深度学习框架,飞桨早已跃迁到了面向产业级深度学习开源开放平台的定位。

在最新公布的飞桨1.6版本中,9项新品以及12项产品升级,我们洞察到了更面向场景、面向应用的飞桨。 

其中重要的新品发布包括:4项端到端开发套件:NLP领域的ERNIE语义理解,CV方向的PaddleDetection目标检测和PaddleSeg图像分割,推荐方向的ElasticCTR点击率预估;端侧推理引擎Paddle Lite 2.0版本;3项工具组件:联邦学习PaddleFL、图神经网络PGL和多任务学习PALM;以及新推出了EasyDL专业版。

如今飞桨能够提供完备的工具组件、面向应用任务的产业级开发套件,以及支持低门槛应用深度学习技术的多个服务平台。最新数据显示,在飞桨深度学习平台上已经累计服务了150多万开发者,并有超过6.5万企业用户,仅在定制化训练平台上就发布了16.9万个模型。

从2016年开源到如今,飞桨一直在成长,这实际上是源自开发者的诉求。“有平台、被使用,反过来,平台自然而然地就不断得到升级和推动,”百度AI技术平台体系执行总监、深度学习技术及应用国家工程实验室副主任吴甜向雷锋网表示。

目前在工业、物流等场景中涌现出了诸多AI诉求,也是飞桨落地较多也相对成熟的,这是否意味着是飞桨接下来重点深入的领域? 

“深度学习技术本身是很通用的,飞桨本身希望能够成为底座,但在推进行业的过程中,像面向场景的端到端套件,本身就带有行业和场景的特点了。”吴甜回答道。

可以看出这一逻辑,飞桨本身作为深度学习平台所具备的灵活性,决定了面向不同的场景可以提供更多的定制化服务。不同层次的开发者对深度学习平台的应用本身就有不同的诉求,比如,具备一定AI技术背景的开发者,可以选择开发套件进行二次开发;反之,可以选择诸如EasyDL、EasyEdge这样的服务平台直接上手使用。

未来,无论飞桨面向更多企业核心诉求推出的可满足二次开发的套件,还是满足不同终端部署诉求的高性能处理引擎,亦或是服务更多不具备AI技术背景的开发者,其本质问题都是为了降低深度学习的门槛,让飞桨更加贴合到传统企业的业务线中。 

回到上文中飞桨在电力行业的应用,是偶然,也是必然。 

图注:PaddleSeg覆盖了DeepLabv3+, U-Net, ICNet三类主流的分割模型,通过统一的配置,帮助用户更便捷地完成从训练到部署的全流程图像分割应用。

例如,图像分割PaddleSeg开发套件,除了用于智能巡检机器人外,在工业质检中的零件分拣、瑕疵分级、农业中地块分割、自动驾驶中的车道线分割等有着丰富的应用场景;再比如,目标检测PaddleDetection开发套件,可以应用于安防监控中的行人监测、智慧交通中的人流车流统计、商品检索等场景。 

我们还注意到,飞桨在底层芯片、服务器的适配上,除了与华为HiAI建立更全方位的合作外,还将引入寒武纪、比特大陆、FPGA、NPU等更多芯片。

飞桨真正意义上开始走向工业级成熟。

飞桨在成长,企业也必须成长

得益于政策的推动及技术成熟,近两年深度学习正从实验室走向产业大规模通用,无论是部署于质量管控端的良品率提升,还是企业战略决策端的管控和经营决策,已经有了一批先行者。

但是,有个前提需要关注。根据2018年9月埃森哲公布的《中国企业数字转型指数》显示目前只有7%的中国企业转型成效显著,一个关键指标是过去三年企业新业务的营收收入占总营收占比超过50%。

不少企业惶恐,说转型是找死,不转型就是等死,因此如何在转型的同时实现企业自身的平稳运营成为当前企业面临的难题,更何况是从数字化向智能化的跃迁。是信息化、数字化、智能化三化并行,还是智能化先行?

对此,吴甜认为,“不同于美国是从信息化、数字化、智能化一步步推进的,在中国,能看到大量企业正在同步或者很短时间内快速进行三化的转型。不过信息化、数字化、智能化本身相互联系,需要整体性推进,一个企业如果还没有做到信息化、数字化,很难就直接跃升到智能化,或者就只是做一些单点的智能化,形不成系统。”

但这也侧面说明,中国整个市场的想象空间是非常巨大的,关键在于谁把握住了机遇。飞桨可以看做是智能时代的操作系统,上承模型开发和应用、下接基础芯片硬件。这或许才是飞桨的机会。

当然,飞桨也需要等待部分企业的成熟。一方面,企业需要有对AI硬件和底层框架有深入了解的人才,以满足面向业务需求的开发;另一方面,企业应用单点智能技术的前提,也是因为他们不可能一下就将原有设备替换成智能设备。此外,数据、技术基础、业务流程、竞争力、监管等,企业同样存在各方面的担忧,其智能化转型的目标也必须符合当前企业发展的战略规划。

更为广泛的,在制造、能源、金融、教育、医疗等各个领域,越来越多的场景正在涌现、值得挖掘,等待与百度飞桨一同成长。(雷锋网)

分享到