专访百度智能云主任架构师王栋:打造业界领先的机器学习云平台

2023-07-31 16:07:38   来源:新浪VR

  机器学习是人工智能的核心技术,也是大数据时代的必备能力。但是,机器学习的全流程涉及数据处理、算法选择、模型训练、评估、部署等多个环节,对开发者和企业来说,不仅需要专业的知识和技能,还需要高效的工具和平台。百度智能云高级架构师王栋在接受记者采访时分享了他领导的百度机器学习云平台(BML)的发展历程、技术特点和应用案例,以及他对机器学习和人工智能未来发展的看法和建议。

  王栋是百度主任架构师、智能运维专家,他领导了多项人工智能产品的设计和行业落地工作,例如:Noah系统、NetRadar,其中他设立并主导开发的百度机器学习平台(BML)已经是百度智能云在这个方向市场地位的重要依赖,突出王栋在智能云以及AI技术领域的前瞻性以及技术实力。

  “我们希望通过百度机器学习云平台(BML),为用户提供一站式的机器学习解决方案,降低门槛,提升效率,释放创新。”王栋说。

  BML是基于百度公有云和私有云平台,由百度基础架构部自主研发的机器学习产品。面向百度公有云和私有云的机器学习/数据挖掘/数据分析的用户,致力于建设业界领先的机器学习云平台。BML主要应用于大数据统计与分析、数据挖掘、模型训练、商业智能、可视化等领域,包括百度公司内部广告点击预估,搜索排序,推荐等重要应用都运行在BML上。

  王栋介绍了BML的三大特点:

  第一,BML提供了丰富、高效、成熟的机器学习算法。BML支持多种常用的机器学习算法,包括但不限线性回归、逻辑回归、支持向量机、决策树、随机森林、梯度提升树、K均值聚类、主成分分析等,覆盖了分类、回归、聚类、降维等多个场景。用户可以通过简单的配置,快速地使用这些算法进行数据分析和模型训练。BML还支持用户自定义算法,可以使用Python或者C++编写自己的算法逻辑,并在BML上运行。BML还提供了丰富数据预处理功能,包括数据清洗、格式转换、特征工程等,帮助用户提高数据质量和模型效果。

  第二,BML打通了机器学习的全流程,用户可以便捷地完成从原始数据格式化、统计、训练、评估、预测、发布模型服务等应用。BML提供了一个可视化的操作界面,用户可以通过拖拽组件,构建自己的机器学习工作流。每个组件都有详细的参数说明和示例,用户可以根据自己的需求进行调整。BML还提供了一个在线编辑器,用户可以编写Python或者SQL代码,实现更灵活的数据处理和模型训练。此外,BML还提供了一个模型管理中心,用户可以查看自己训练过的所有模型,进行版本控制和比较。用户还可以将自己的模型发布为在线服务或者离线批量预测服务,并通过API或者SDK调用。

  第三,BML利用百度智能云的强大计算能力和优化技术,实现低成本、低延迟地进行基础模型的训练和推理。BML基于百度公有云和私有云平台,利用百度自研分布式计算框架和优化技术,实现了高效机器学习计算。用户可以根据自己的数据规模和模型复杂度,选择合适计算资源,包括CPU、GPU、FPGA等,BML会自动分配和调度,保证计算效率和成本。BML还支持前沿深度学习研发成果,从普通DNN到Word2Vec训练有全面的支持,帮助用户训练自己的神经网络并且对训练结果进行可视化。

  王栋还介绍了BML的一些应用案例和未来发展方向。他说,BML已经在百度内部和外部广泛应用,包括百度公司内部的广告点击预估,搜索排序,推荐等重要应用都运行在BML上。BML还为公有云的企业级用户提供了成套的完善解决方案,快速接入解决企业的实际问题,帮助用户挖掘大数据的价值。例如,BML为某大型电商平台提供了商品推荐和搜索排序的解决方案,通过使用BML训练的模型,提升了用户体验和转化率。BML还为某金融机构提供了风控和信用评估的解决方案,通过使用BML训练的模型,降低了风险和成本。

  “未来,我们将继续完善BML的功能和性能,为用户提供更多、更好、更快的机器学习服务。”王栋说,“我们也将持续关注机器学习和人工智能领域的最新进展和趋势,探索更多可能性和创新点。”

  (作者:王伟)

新浪声明:新浪网登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。

微博

HOT RECOMMEND

关于新浪VR | 论坛社区

Copyright © 1996-2015 SINA Corporation, All Rights Reserved 京ICP证000007  京网文【2017】10231-1157号

北京幻世新科网络科技有限公司 版权所有