Amazon SageMaker 三部曲 (下)

发表时间:2019-04-16 16:56

关AWS SageMaker所需要的知识,大家都可以到AWS官网搜寻技术文件,有非常详细的说明与介绍,有很多教学范例在GitHub上,可以下载下来学习使用。

技术文件:
https://docs.aws.amazon.com/sagemaker/latest/dg/whatis.html
GitHub资源:
https://github.com/awsdocs/amazon-sagemaker-developer-guide/tree/master/doc_source

今天要做的这个实作,正式SageMaker技术文件上的入门教学,教学写得很清楚,因此本文就不仔细交代啦:
https://docs.aws.amazon.com/zh_tw/sagemaker/latest/dg/gs.html

这个实作主要是手把手地一步一步教大家怎样从AWS入门设定、在SageMaker上训练模型并且布建。实作使用MNIST数据集中的手写个位数字(0~9),来让大家练习非监督式算法K-means (将数据分成K群),将手写数字分成10群,非常适合作为入门的练习。

直白地说,就是跟机器学习说这些手写数字有10群,看看人工智能有没有这么聪明,把相同数字放在一起,并分好0~9共十个数字群。

经过一连串的设定跟实作,相信大家都跑出结果来了,可以看到字已经被分成10群了,有的手写数字很正确地被分到了一群,例如下方数字0,被分在同一个Cluster,显示K-mean可以很成功地认出数字0与其他数字的不同。数字2跟数字6同样地也是很成功地区分出来。

但其他数字看起来就没这么顺利了,像是数字3跟数字8,不容易辨认,更有一群里面有数字4/5/7/9,看起来不太理想。

面对这样的结果,需要做更多的进一步讨论与其他尝试,例如:

► 变更模型训练参数 – 例如增加 epoch 数量或调整超参数 (如extra_center_factor)。
► 考虑切换算法 – MNIST 数据集中的影像包含可识别数字的信息,称为 label (标签)。同样地,您也可以标记其他有问题的训练数据。接着,您便可以善用卷标信息与受监督的算法 (如 Amazon SageMaker 所提供的线性学习程序算法)。
► 尝试更专业的算法 – 您可以尝试使用如 Amazon SageMaker 提供的影像分类算法等专业算法,藉此取代线性学习程序算法。
► 使用自定义算法 – 考虑使用自定义类神经网络算法,其会建置在 Apache MXNet 或 TensorFlow 上。

更多更进阶的人工智能方法与弹性正式SageMaker强大之所在,等着我们持续地去探索。随着人工智能大众化的趋势,相信明年的AWS会在人工智能的领域上有更多的新产品问世,让人工智能开发人员可以拥有更快速、效能更强的人工智能服务可以使用。

P.S. 做完实作别忘记把开过的资源关掉,以免产生不必要的费用喔。


产品和服务  
解决方案  
客户案例
关注我们
联系我们
- 海外代付
- Amazon Web Services
姓名
*
职称
*
电话
*
邮箱
*
公司
*
地址
*
需求
*
提交
扫描二维码关注我们,获取更多云端资讯。
*您已详阅本公司的 隐私权声明,并同意本公司依法搜集、处理及利用您的个人资料