Amazon SageMaker 三部曲 (上)

2019-04-16 16:46

在2017年年底的AWS re:invent圆满落幕,在AWS CEO Andy Jassy精彩的Keynote上,没有看到更新更大台的交通工具进场,倒是这几年炒得火热的人工智能话题,在Andy Jassy发表一连串新产品后,观众的连连掌声中,大大地宣告亚马逊在人工智能的领域占有一席之地。

本文将介绍其中一项强大的人工智能开发整合平台Amazon SageMaker!
先来看一下AWS官网SageMaker的描述:

“Amazon SageMaker 是全受管服务,可让开发人员资料科学家建置、训练及部署机器学习模型。”

没错,SageMaker适合使用的对象是开发人员和数据科学家,适合本身具有人工智能相关知识与技术的人员使用。

可以这么比喻,2015年发表的Amazon Machine Learning,就像是傻瓜相机一样,用户只需要把数据喂进去,不停地按下一步、下一步、下一步、最后确认,就可以为自己量身订做一个独一无二的模型。算法的支持也仅限于Binary、Multi-classification与Regression,如果需要使用其他的算法,那就只能寻求其他方法,例如使用EMR开Spark运用Spark的MLlib。

相较之下,做为一个人工智能开发整合平台,SageMaker就像单眼相机一样,功能强大且富有弹性,但无法让用户只按下一步就搞定所有设定。

Amazon SageMaker 包含三个模块:建立、训练及部署。建立模块提供配合您数据使用的托管环境、实验算法,并可将您的输出可视化。训练模块能够以高规模和低成本进行一键式模型训练与调校。部署模块为您提供受管环境,以安全且低延迟的方式轻松托管和测试用于推论的模型。

过去数据科学家在人工智能开发的过程中,花了许多时间在建立、训练和部属机器上,AWS为了简化开发人员与资料科学家的负担,推出了SageMaker简化了这些流程,让数据科学家从此可以多花时间在数据与数据分析上,而非陷入准备工具与流程的泥淖中。

Before
1. 收集与准备(Clean ETL)资料
2. 选择最佳化学习模型
3. 设定与管理训练环境
4. 训练模型、调整模型(trial and error)
5. 布局模型、设定推论for production
6. 管理与监控production环境
7. 除错测试与更新

After
1. 收集与准备(Clean ETL)资料
2. Build:内建预先定义Framework notebook与高效能演算法
3. Train:一键训练与参数最优化
4. Deploy:一键布局与管理Production环境

看了是不是觉得很神奇呢? 走起路来都轻快了不少。
下一篇我们就来看看SageMaker到底是如何帮助数据科学家解决这些问题。



云与应用现代化
——
扫描关注微信公众号
获取更多云端资讯
联系我们
——

模板表单-2(1)

  • 姓名*

  • 电话*

  • 邮箱*

  • 公司*

  • 职称*

  • 地址*

  • 需求*