投稿日: May 5, 2022

Amazon SageMaker Canvas は、ビジュアルなポイントアンドクリック式のインターフェースで、 ビジネスアナリストが機械学習の経験を持たずに、また一行のコードも書き込まなくても、正確なML予測を自分で生成できるようにします。SageMaker Canvasは、様々なソースからデータにアクセスしてそれらを組み合わせ、データを自動的にクリーニングして様々なデータ調整を施し、数クリックで正確な予測を生成するMLモデルを簡単に構築することができる製品です。

本日、Amazon SageMaker Canvas は、MLモデルを構築する前にデータセットを管理、探索、変更することを容易にする新しいデータ準備機能を発表しました。キー機能は次のとおりです:

  • 行のフィルタリングによるデータセットの探索と修正: 値が欠落している行と外れ値をプレビューして削除できるようになりました。また、追加の条件を指定して、データセットから行をプレビューしたり削除したりすることもできます。例えば、数値データ型では、より大きい、より小さい、等しい、中間などの条件を指定できます。サポートされている条件のリストはデータ型によって異なり、こちら に記載されています
  • タイムスタンプのフォーマットと変換を拡張し、日付、時刻を抽出: タイムスタンプ列から日付と時刻の情報を抽出し、新しい列を作成できるようになりました。これにより、時系列データの準備と変換、モデルレシピへの変換の追加が、わずか数クリックで簡単に行えます。さらに、SageMaker Canvas は複数のタイムスタンプ形式をサポートするようになり、問題を予測するために時系列データを簡単に操作できるようになりました。タイムスタンプフォーマットと日付、時刻の抽出機能の一覧は、こちら をご覧ください。

上記のデータ準備および変換機能に加えて、データセットやカラムの名称を変更できるようになり、使い勝手が向上しました。その他、お勧めのアクションを含むユーザー向けメッセージの改善や、MLモデル構築前のデータセットのセル数の可視化など、ユーザビリティの向上を図りました。

本日より、Amazon SageMaker Canvas がサポートされているすべてのリージョンで新しいデータ準備とユーザビリティのアップデートが提供されています。詳細と開始方法については、Amazon SageMaker Canvas のドキュメント製品ページ を参照してください。