Amazon Web Services ブログ
Amazon SageMaker 地理空間機能を使用して農業データプラットフォームを構築
この記事は Build an agronomic data platform with Amazon SageMaker geospatial capabilities を翻訳したものです。
地政学的な紛争、サプライチェーンの混乱、気候変動の結果として、世界的な食糧不足のリスクが高まっています。同時に、人口増加や栄養価が高くタンパク質が豊富な食品に焦点を当てた食生活の変化により、全体的な需要も増加しています。過剰な需要を満たすためには、作物の収穫量を最大化し、大規模化する事業を効果的に管理するために精密農業技術を活用することで、農家は常に先を行く必要があります。
これまで、受け継いだ知識、試行錯誤、規範がない中での農学的アドバイスを頼りに農家は意思決定してきました。重要な決定には、植える作物、肥料の散布量、害虫の駆除方法、収穫時期などがあります。しかし、食料需要が高まり、収穫量を最大化する必要性が高まる中、農家は受け継いだ知識に加えてより多くの情報を必要としています。リモートセンシング、IoT、ロボット工学などの革新的な技術は、農家が従来の意思決定から脱却するのに役立つ可能性を秘めています。ほぼリアルタイムの洞察に基づくデータ主導の意思決定により、農家は増加する食料需要のギャップを埋めることができます。
これまで、設備操業や収穫量を記録したり、野外観察のメモを取ったり、農家は手動でデータを収集してきました。これに対し、AWS で農業データプラットフォームを構築している企業は、信頼できる農学者と農家が協力してそのデータを大規模に使用できるよう支援しています。小規模な畑の操業であれば農家は畑全体を見渡して、作物に影響する問題を探すことができるでしょう。しかし、大規模な農場において各畑を頻繁に調査することは現実的ではありません。リスクを軽減させるためには、大規模な洞察をもたらすことができる統合された農業データプラットフォームが必要です。複数のソースからの情報を統合して視覚化や分析アプリケーションに使用することで、これらのプラットフォームは農家のデータ理解に役立ちます。衛星画像、土壌、天候、地形などの地理空間データは、植える、養分を与える、収穫するといった農作業中に機械によって収集されたデータとともにレイヤー化されます。地理空間データ分析の強化、高度なデータ視覚化、AWS テクノロジーによるワークフローの自動化を通じて洞察を得ることで、農家は畑や作物の問題領域を特定し、作物や操業を保護するための対策を講じることができます。農家が信頼できる農業アドバイザーと協力して、生産量を増やし、農業活動が環境に与える負荷を減らし、収益性を向上させ、何世代にもわたって土地の生産性を維持するのにこうしたタイムリーな知見が役立ちます。
この投稿では、Amazon SageMaker の地理空間機能から生成された予測を農業データプラットフォームのユーザーインターフェイスにどのように使用できるかを見ていきます。さらに、リモートセンシングアルゴリズム、クラウドマスキング (衛星画像内の雲を自動的に検出) 、自動画像処理パイプラインなどの高度な機械学習 (ML) 主導の洞察をソフトウェア開発チームが農業データプラットフォームに追加する方法についても説明します。これらの追加機能により、農学者、ソフトウェア開発者、機械学習エンジニア、データサイエンティスト、リモートセンシングチームは、スケーラブルで価値のある意思決定支援システムを農家に提供できるようになります。この投稿では、ML ベースの農地セグメンテーションや事前にトレーニングされた農業用地理空間モデルなど、SageMaker の地理空間機能を実証するエンドツーエンドのノートブックと GitHub リポジトリの例も紹介します。
地理空間の洞察と予測を農業データプラットフォームに追加
確立された数学モデルと農学モデルを衛星画像と組合せることで、ピクセルごとに作物の健康状態の時間経過を視覚化できます。ただし、これらのモデルは、画像の品質低下の要因となる雲やその他の大気干渉による遮蔽の影響を受けていない衛星画像にアクセスする必要があります。つまり、処理された各画像から雲を識別して取り除かなければ、予測や洞察が著しく不正確になり、農業データプラットフォームは農家の信頼を失ってしまいます。農業データプラットフォームのプロバイダは通常、さまざまな地域の何千もの農地を含む顧客にサービスを提供しています。そのため、顧客に追加の処理や分析を提供する前に、各衛星画像内の雲やその他の大気問題を分析、特定、除外するためのコンピュータービジョンと自動化システムが農業データプラットフォームには必要です。
衛星画像から雲や大気の問題を検出するコンピュータービジョンモデルの開発、テスト、改善は、農業データプラットフォームの構築者にとって課題となります。まず、衛星画像を取り込むためのデータパイプラインを構築するには、時間、ソフトウェア開発リソース、および IT インフラストラクチャが必要です。各衛星画像プロバイダは互いに大きく異なる可能性があります。衛星は多くの場合、さまざまな空間解像度で画像を収集します。ピクセルあたり数メートルから数センチメートルの非常に高解像度の画像までさまざまです。さらに、各衛星は異なるマルチスペクトルバンドの画像を収集する場合があります。
徹底的なテストにより一部のバンドは植物の発育や健康指標と強い相関関係を示していますが、他のバンドは農業には無関係な場合があります。衛星群は、地球上の同じ場所をさまざまな速度で再訪します。衛星群が小さいと毎週またはそれ以上フィールドを再訪する場合があり、衛星群が大きいと1日に複数回同じエリアを再訪する場合があります。このような衛星画像の取得周期の違いは、API 機能の違いにもつながります。これらの違いにより、農業データプラットフォームは複雑な取り込み方式を持つ複数のデータパイプラインを維持しなければならない可能性があります。
リモートセンシングチーム、データサイエンティスト、農学者が利用できるように画像を取り込んだら、次に、これらのチームは各画像内の各領域に曇っているとラベリングします。ラベリングは時間のかかるプロセスです。何千ものフィールドがさまざまな地域に分散しており、フィールドごとに複数の衛星画像があるため、ラベリングプロセスにはかなりの時間がかかる可能性があります。ビジネスの拡大、新しい顧客フィールド、または新しい画像取得元を考慮して継続的にトレーニングする必要があります。
機械学習用の Sentinel 衛星画像とデータへの統合アクセス
リモートセンシング ML モデルの開発に SageMaker の地理空間機能を使用し、Amazon Simple Storage Service (Amazon S3) バケットから便利に使用できる AWS Data Exchange の衛星画像を利用することで、AWS で農業データプラットフォームを構築する開発者は目標をより迅速かつ簡単に達成できます。S3 バケットには、Sentinel-1 と Sentinel-2 からの最新の衛星画像が常に保存されています。これは、Open Data Exchange と Amazon Sustainability Data Initiative により、衛星画像への自動アクセスが組み込まれているためです。
次の図は、このアーキテクチャを示しています。
SageMaker の地理空間機能には、土地利用分類やクラウドマスキングなどの事前トレーニング済みのディープニューラルネットワークモデルと、AWS やサードパーティの衛星画像、地図、位置データなどの地理空間データソースの統合カタログが含まれます。統合された地理空間データカタログにより、SageMaker の地理空間機能のユーザーは衛星画像やその他の地理空間データセットに簡単にアクセスでき、複雑なデータ取り込みパイプラインを開発する負担がなくなります。この統合データカタログを使用すると、時間統計、リサンプリング、モザイク、リバースジオコーディングなどの目的に合わせた操作により、独自のモデル構築と大規模な地理空間データセットの処理と強化を迅速に行うことができます。Amazon S3 から簡単に画像を取り込み、SageMaker 地理空間機能の事前トレーニング済み ML モデルを使用して各 Sentinel-2 衛星画像に雲のスコアを自動的に付与できます。これにより、手動でラベリングせずとも、リモートセンシング、農学、およびデータサイエンスのチームを雇って、雲の多い地域を含め何千もの衛星画像を取り込み、処理できます。
SageMaker の地理空間機能では、対象地域 (AOI) と対象時間 (TOI) を定義すると、Open Data Exchange S3 バケットアーカイブ内で要求を満たす地理空間を検索します。検索に該当する実際のカラー画像、正規化植生指標 (NDVI)、雲の検出とスコア、土地被覆分類を返す機能をサポートしています。NDVIは、新たに処理され色分けされた画像を介してクロロフィルの量と光合成活性の測定値を視覚化することで、作物の健康状態を把握するために衛星画像でよく使われる指標です。
SageMaker 地理空間機能のユーザーは、あらかじめ作成されている NDVI インデックスを使用するか、独自のインデックスを開発できます。SageMakerの地理空間機能により、データサイエンティストや機械学習エンジニアは、地理空間データを使用して、以前よりも少ない労力で、より迅速かつ大規模に ML モデルを簡単に構築、トレーニング、展開できます。
現場や家に居ながら農家や農学者が素早く洞察へアクセス
処理された画像や洞察を農家や利害関係者に迅速に提供することは、農業ビジネスや現場での意思決定にとって重要です。重要な時期に各畑の作物の健康状態が悪い地域を特定することで、農家はリスク軽減のために必要に応じて肥料、除草剤、農薬を散布できます。また、作物保険請求の対象となる可能性のある地域を特定することもできます。農業データプラットフォームは、ウェブアプリケーションやモバイルアプリケーションを含む一連のアプリケーションで構成されるのが一般的です。これらのアプリケーションは直感的なユーザーインターフェイスを備えているため、農家やその信頼できる利害関係者が、自宅、オフィス、または畑に立っているときに、各畑や画像を安全に確認できます。ただし、これらのウェブアプリケーションやモバイルアプリケーションでは、処理された画像や農業に関する洞察をAPI経由で利用し、すばやく表示する必要があります。
Amazon API Gateway を使用すると、開発者は大規模な RESTful API と WebSocket API を簡単に作成、公開、保守、モニタリング、保護できます。Amazon API Gateway では、API のアクセスと承認が AWS Identity Access Management (IAM) と統合され、ネイティブの OIDC と OAuth2 のサポートに加えて Amazon Cognito も提供されます。 Amazon Cognito は、数百万人のユーザーに対応できるフェデレーションオプションを備えた安全なアイデンティティストアをサポートする、費用対効果の高いカスタマー ID およびアクセス管理 (CIAM) サービスです。
未処理の衛星画像は1画像あたり数百メガバイト、場合によってはギガバイトと非常に大きい場合があります。世界の多くの農業地域では、携帯電話の接続が不十分または全く無いため、画像や洞察をより小さな形式で、必要な帯域幅を制限する方法で処理して提供することが重要です。そのため、AWS Lambda を使用してタイルサーバーをデプロイすると、ユーザーに表示されている現在のマップビューに基づいて小さいサイズの GeoTIFF、JPEG、またはその他の画像形式を返すことができます。これに対し、ファイルサイズやタイプがはるかに大きくなると、パフォーマンスが低下します。Lambda Functions を介してデプロイされたタイルサーバーを API Gateway と組み合わせてウェブアプリケーションやモバイルアプリケーションのリクエストを管理できます。これにより、農家とその信頼できる利害関係者は、1 つまたは数百のフィールドの画像と地理空間データをレイテンシーを抑えて一度に使用でき、最適なユーザーエクスペリエンスを実現できます。
SageMaker の地理空間機能には、直感的なユーザーインターフェイスからアクセスできます。これにより、豊富な地理空間データのカタログに簡単にアクセス、データをエンリッチ、専用モデルを構築、予測用モデルを展開、統合された地図や衛星画像でデータを視覚化および探索できます。SageMaker 地理空間のユーザーエクスペリエンスの詳細については、How Xarvio accelerated pipelines of spatial data for digital farming with Amazon SageMaker geospatial capabilities を参照してください。
農業データプラットフォームは複数のレイヤーのデータと洞察を大規模に提供
次のユーザーインターフェイスの例は、農業データプラットフォームの構築者が SageMaker の地理空間機能によって提供される洞察をどのように統合できるかを示しています。
このユーザーインターフェースの例は、農家や農業関係者がよく利用する地理空間データのオーバーレイを示しています。ここでは、消費者は3つの別々のデータオーバーレイを選択しました。まず、2020年10月に撮影された基礎となるSentinel-2ナチュラルカラーの衛星画像で、統合された SageMaker 地理空間データカタログから利用できるようになりました。この画像は、雲量を特定する SageMaker 地理空間の事前トレーニング済みモデルを使用してフィルタリングされています。2 番目のデータオーバーレイは、白い輪郭で描かれた一連のフィールド境界です。畑の境界は、一般的に農地の自然地形を反映した緯度と経度の座標からなる多角形で、作付計画を区別する運用上の境界線です。3 番目のデータオーバーレイは、正規化植生指標 (NDVI) の形式で処理された画像データです。さらに、NDVI 画像がそれぞれのフィールド境界に重ねられ、NDVI 色分類チャートがページの左側に表示されます。
以下の画像は、雲量を特定する SageMaker の事前トレーニング済みモデルを使用した結果を示しています。
この画像では、モデルは衛星画像内の雲を識別し、画像内の各雲に黄色のマスクを適用します。マスクされたピクセル (雲) を今後の画像処理から取り除くことで、下流の分析や製品の精度が向上し、農家や信頼できるアドバイザーに価値を提供できるようになりました。
携帯電話の電波が届かない地域では待ち時間を短縮することでユーザーエクスペリエンスが向上
地理空間データやリモートセンシング画像を評価する際のレイテンシーを低く抑える必要があるため、 Amazon ElastiCache を使用して Lambda 経由のタイルリクエストから取得した処理済み画像をキャッシュできます。リクエストされた画像をキャッシュメモリに保存することで、待ち時間がさらに短縮され、画像リクエストを再処理する必要がなくなります。これにより、アプリケーションのパフォーマンスが向上し、データベースへの負荷が軽減されます。 Amazon ElastiCache は、キャッシュ戦略、クロスリージョンレプリケーション、自動スケーリングのための多くの設定オプションをサポートしているため、農業データプラットフォームプロバイダーはアプリケーションのニーズに基づいて迅速にスケールアップでき、必要な分だけ支払うことでコスト効率を維持できます。
まとめ
この投稿では、地理空間データ処理、ML 対応のリモートセンシングインサイトの実装、および AWS での農業データプラットフォームの開発と強化を合理化および簡素化する方法に焦点を当てました。SageMaker、Lambda、Amazon S3、Open Data Exchange、ElastiCache など、AWS サービス上で農業データプラットフォームを構築する開発者が目標を達成するために使用できるいくつかの方法やサービスについて説明しました。
SageMaker の地理空間機能を実証するエンドツーエンドのサンプルノートブックを参照するには、以下の GitHub リポジトリにあるサンプルノートブックにアクセスしてください。ML セグメンテーションモデルを使用して農地を特定する方法を確認したり、既存の SageMaker 地理空間モデルや土地利用や土地被覆分類などの地理空間タスクに関する Bring Your Own Model (BYOM) 機能を調べたりできます。このエンドツーエンドのノートブックの例については、関連記事 How Xarvio accelerated pipelines of spatial data for digital farming with Amazon SageMaker Geospatial で詳しく説明されています。
農業業界が AWS クラウドを使用して世界の食料供給、トレーサビリティ、持続可能性の取り組みに関連する重要な問題をどのように解決しているかの詳細はお問い合わせください。
記事の翻訳は Solutions Architect 中島 佑樹が担当しました。
About the authors
Will Conrad is the Head of Solutions for the Agriculture Industry at AWS. He is passionate about helping customers use technology to improve the livelihoods of farmers, the environmental impact of agriculture, and the consumer experience for people who eat food. In his spare time, he fixes things, plays golf, and takes orders from his four children.
Bishesh Adhikari is a Machine Learning Prototyping Architect at the AWS Prototyping team. He works with AWS customers to build solutions on various AI & Machine Learning use-cases to accelerate their journey to production. In his free time, he enjoys hiking, travelling, and spending time with family and friends.
Priyanka Mahankali is a Guidance Solutions Architect at AWS for more than 5 years building cross-industry solutions including technology for global agriculture customers. She is passionate about bringing cutting-edge use cases to the forefront and helping customers build strategic solutions on AWS.
Ron Osborne is AWS Global Technology Lead for Agriculture – WWSO and a Senior Solution Architect. Ron is focused on helping AWS agribusiness customers and partners develop and deploy secure, scalable, resilient, elastic, and cost-effective solutions. Ron is a cosmology enthusiast, an established innovator within ag-tech, and is passionate about positioning customers and partners for business transformation and sustainable success.