Amazon Web Services ブログ
【開催報告】第10回Amazon SageMaker 事例祭り
アマゾン ウェブ サービス ジャパン株式会社 パートナーソリューションアーキテクトの小田桐です。
AWS Japan 目黒オフィスでは「Amazon SageMaker 事例祭り」(Twitter: #sagemaker_fes) を定期的に開催しています。2019年11月28日に開催された 第10回 Aazon SageMaker 事例祭り では、AWS Japan のソリューションアーキテクトによるサービスの最新情報や技術情報と、Amazon SageMaker をご利用いただいているお客様をゲストスピーカーにお招きし、実際に導入頂いたお客様による「体験談」をお話し頂きました。
「AWSの機械学習サービス概要とAmazon SageMakerの基礎」[Slides]
アマゾン ウェブ サービス ジャパン株式会社
機械学習ソリューションアーキテクト 宇都宮 聖子
現在、AWS上では非常に多くの機械学習ワークロードを動かしていただいております。本セッションではまず、機械学習における「Undifferentiated Heavy Lifting」(開発環境構築における課題、モデル学習時における課題、運用における課題)を示し、それらを解決するAWSマネージドサービスとしてAmazon SageMaker を紹介いたしました。Amazon SageMaker はラベリング、開発、学習、変換、推論の環境を提供いたします。Amazon SageMaker Ground Truth はアノテーション作業の支援サービスで、アノテーションにおける一般的な画像ワークフローを管理することができます。画像分類、物体検出、セマンティックセグメンテーション、文章分類のタスクを作成することができ、アノテーションツールも提供されます。開発にはノートブックインスタンス、学習には学習用インスタンス、推論には推論用インスタンスと用途に応じてスペックを含め最適な環境をご利用いただくことができます。学習用インスタンスの新機能として Managed Spot Training に対応いたしました。これにより学習コストを最大で90%を削減することが可能となりました。推論では、独自実装では運用を含めて困難な、オートスケーリングや、A/Bテストにも対応しており、簡単にご利用いただけます。開発・学習・推論環境は全て一緒に利用する必要はなく、お客様の環境に合わせ個別にご利用いただくことができます。
セッションの後半には、Amazon SageMaker のアーキテクチャから学習・推論の実行手順、そして効率的に利用するための方法をご説明いたしました。ノートブックインスタンス上で numpy/pandas または Amazon EMR を利用した学習データの前処理、学習データセットのIOボトルネックを解消する、PIPEモード、Amazon EBS/Amazon FSx Lustre の活用、お客様自身でスクリプトを作成される方法に加えて、すでに組み込まれたモデルを活用するビルトインアルゴリズム、AWS MarketPlace Machine Learning も説明いたしました。推論コストの最適化といたしまして、Amazon Elastic Inference の活用を始め、G4/R5インスタンスの活用をご説明し、新機能として登場いたしましたマルチモデルエンドポイントもご紹介いたしました。2019年11月に新機能としてリリースされました、AWS Step Functions Data Science SDK、Amazon Athena との連携、Amazon Aurora との連携についてもご紹介いたしました。
「Amazon SageMaker の Built-in-Algorithm と AWS Marketplace for Machine Learning」[Slides]
アマゾン ウェブ サービス ジャパン株式会社
機械学習ソリューションアーキテクト 大渕 麻莉
このセッションでは、機械学習をこれから初められる方をメインとし、Amazon SageMaker のビルトインアルゴリズムそして、Marketplace のご活用についてご紹介いたしました。
ビルトインアルゴリズムは、データサイエンティストがよく使うアルゴリズムや、画像認識などのアルゴリズムもサポートしており、Amazon SageMaker から簡単にご利用いただけます。ビルトインアルゴリズムの1つである XGBoost の特徴を説明し、実際に Amazon SageMaker の画面をお見せしつつ、ノートブックインスタンスの起動から Amazon SageMaker Examples の利用方法までをご説明しました。顧客の契約解除予測を行うサンプルノートブックを題材とし、Amazon SageMaker でビルトインアルゴリズムを使う際の基本的な流れを具体的に解説いたしました。Random Cut Forest、ディープラーニングベースの Object Detection アルゴリズムの概要とユースケース、そしてディープラーニングフレームワークと同様に Amazon SageMaker 上でご利用いただける Python 用機械学習ライブラリ scikit-learn の概要を説明いたしました。
次に、AWS Marketplace の活用方法に関して説明いたしました。AWS Marketplace では、Amazon SageMaker で学習・推論に利用することのできるモデルを販売・購入することができます。AWS Marketplace で購入いただいたモデルはシームレスに Amazon SageMaker のエンドポイントに展開することが可能となっており、そのモデルの購入方法からデプロイの方法について画面をお見せしつつ、具体的に紹介いたしました。
最後に、2019年11月に発表された AWS Data Exchange というデータセットの販売とサブスクライブが可能なサービスをご紹介いたしました。AWS Data Exchangeで公開されるデータセットそのものを機械学習でご利用できますが、例えば所有しているデータセットに足りない情報を付加(例えば天気データなど)し、モデルの精度を向上させるといった使い方も可能です。
Amazon SageMaker のビルトインアルゴリズムや AWS Marketplace を活用することで、アルゴリズムを独自に開発せずに機械学習を始めることができ、また、AWS Data Exchange を活用することで、データセットという観点においても、機械学習を促進することができます。
「AIベンチャーでのSageMakerを利用したコスト削減実践例」[Slides]
株式会社シナモン
斎藤 哲也 様
株式会社シナモンは「ホワイトカラーをよりクリエイティブに」とかかげ、ホワイトカラーがより生産性の高い仕事に注力する時間を作れるかという課題に対して、Flax Scannerをはじめ、様々なAIソリューションを展開しています。AIのよくある開発現場の現状として、GPUタイプのEC2をオンデマンドで使用している場合が多いことを課題にあげられました。株式会社シナモンでも以前は同様な状況でしたが、GPU使用率を実際に計測し、GPU未使用時間がベンチャーには大きなコストロスになっていたことに気づいたとのことです。しかし、短期間のインスタンスの停止・起動は運用観点から実質的に難しく、またスポットインスタンスは中断まで2分しか猶予がなく、状態保存の仕組みを作り込みするリソースを確保するのも難しいという課題をかかえていました。そこで行き着いたのが Amazon SageMaker であり、Amazon SageMaker の学習インスタンスを利用することで、GPUインスタンスを必要なときに必要なだけ利用することが可能になり、GPUインスタンスの利用が最適化され、コスト削減を実現することができたとのことです。また、Managed Spot Training も活用されておりGPUインスタンスのコストが概ね70%削減することができ、スポットインスタンスの課題であったトレーニングの中断に関しては Checkpoint を利用することで、シームレスに達成できたと仰られておりました。また、学習の効率化として Amazon EFS や Amazon FSx for Lustre も活用されております。これらの取り組みの結果として、株式会社シナモンでは6ヶ月間で、オンデマンドのGPUインスタンスを10%まで下げることができ、コストに換算すると60%のコスト削減に結びつき、さらに40%の学習タスクを増やすことができたのとことです。
そして、Amazon SageMaker に移行する際の社内環境の変化に対応するために、Amazon SageMaker の推進者・リーダーの立ち上げ、現場の問題点を共通のナレッジ化するための AWS Support の活用方法などに関して共有いただきました。
最後に、Amazon SageMaker を運用するTipsとして、Amazon CloudWatch と AWS Lambda、Slackを連携させた継続的モニタリング方法に関してもお話いただきました。
「カスタマーサポートにおけるSageMakerを活用した自然言語処理・MLシステム構築」[Slides]
株式会社ミクシィ
本間 光宣 様
株式会社ミクシィはSNS「mixi」やスマホアプリ「モンスターストライク」を開発・運用されておりますが、本日は、そのカスタマーサポートに機械学習を活用され、その開発・学習・推論環境に Amazon SageMaker を活用されている事例をご紹介いただきました。カスタマーサポートへの問い合わせに対して、同じテンプレートで返信できる問い合わせかどうかを機械学習を利用して判断されているとのことです。確実性のために、実際の返信送信前には人によるチェックを入れていますが、通常であればばらばらな様々な問い合わせを個々に対応していく必要があったところ、似たような問い合わせに対してまとめて対応することができるようになり、業務の効率化につながっているとのことです。使っている機械学習としてはBERTでFine-Tuningを行なったモデルを利用されているようです。このシステムは、開発開始当初はローカルにあるGPUマシン 1台でコンセプト検証を行なっており、タスクの同時実行ができなく、本格的な開発が始まったところで Amazon SageMaker に移行されたと仰られておりました。その経験から、機械学習の開発環境を独自に構築する大変さをお話されました。Amazon SageMaker の移行には既存コードの書き換えがあまりなく、ジョブ実行のためのコードもスムーズに行えたとソースコードを示しつつご説明いただきました。そして Amazon SageMaker によって、学習環境を高速に構築でき、必要な環境を必要なだけ容易できることでの開発サイクルをすばやく回すことができ、本質的な仕事に集中できるといったメリットについても仰られておりました。
最後に、株式会社ミクシィでは、Amazon SageMaker と他のAWSサービスを連携させており、AWS CodeBuild や AWS Step Functions をデータの前処理に、Amazon Athena をデータ分析過程でのS3からのデータ取得に、AWS Systems Manager Parameter Store をエンドポイントの管理に利用し柔軟に変更できる環境の構築に活用した方法をお話いただいました。
まとめ
今回は Amazon SageMaker の全体的な紹介をした上で、Amazon SageMaker を活用されているゲストの方々をお迎えし、ご活用実例についてお話し頂きました。なお、過去の Amazon SageMaker 事例祭りの開催概要と登壇スライドは下記のリンクからご覧いただけます。
- 第1回 Amazon SageMaker 事例祭り 2019年1月15日 [Web]
- 第2回 Amazon SageMaker 事例祭り 2019年2月12日 [Blog]
- 第3回 Amazon SageMaker 事例祭り 2019年3月12日 [Blog]
- 第4回 Amazon SageMaker 事例祭り 2019年4月24日 [Blog]
- 第5回 Amazon SageMaker 事例祭り 2019年5月21日 [Blog]
- 第6回 Amazon SageMaker 事例祭り 2019年7月18日 [Blog]
- 第7回 Amazon SageMaker 事例祭り 2019年8月29日 [Blog]
- 第8回 Amazon SageMaker 事例祭り 2019年9月19日 [Blog]
- 第9回 Amazon SageMaker 事例祭り 2019年10月30日 [Blog]
2019年は10回に渡り Amazon SageMaker 事例祭りを開催し、非常に多くの方にご参加いただきました。ご登壇いただきましたゲストの皆様、ご参加いただきました皆様に感謝申し上げます。今後もセミナーやハンズオンを通じてサービスのご紹介やゲストによる体験談のご紹介をしていく予定です。2020年以降のスケジュールは追って告知させていただきます。
最後に、2019年12月12日に、AI/MLサービスに特化した、re:Invent 2019(12/2-12/6 開催)にて発表される新サービス、新機能を、数時間で集中的にご紹介する re:Cap を実施いたしますので、ぜひご参加いただければと思います。