オンライン分析処理とは何ですか?
オンライン分析処理 (OLAP) は、さまざまな観点からビジネスデータを分析するために使用できるソフトウェアテクノロジです。組織は、ウェブサイト、アプリケーション、スマートメーター、内部システムなど、複数のデータソースからデータを収集して保存します。OLAPは、このデータをカテゴリに結合してグループ化し、戦略的計画のための実用的な洞察を提供します。たとえば、小売業者は、色、サイズ、コスト、場所など、販売するすべての製品に関するデータを保存します。小売業者は、注文された品目の名前や総売上高などの顧客の購入データも別のシステムで収集します。OLAPはデータセットを組み合わせて、どの色の製品がより人気があるか、製品の配置が売上にどのように影響するかなどの質問に答えます。
OLAP が重要なのはなぜですか?
オンライン分析処理 (OLAP) は、組織が増え続けるデジタル情報を処理し、その恩恵を受けるのに役立ちます。OLAP のメリットには次が含まれます。
迅速な意思決定
企業は OLAP を使用して、ペースの速い経済において競争力を維持するために、迅速かつ正確な決定を下します。コンピュータシステムは複数のデータテーブルを検索するため、複数のリレーショナルデータベースで分析クエリを実行すると時間がかかります。一方、OLAP システムはデータを事前に計算して統合するため、ビジネスアナリストは必要なときにより迅速にレポートを生成できます。
技術者以外のユーザーのサポート
OLAP システムにより、技術者以外のビジネスユーザーも複雑なデータ分析を簡単に行うことができます。ビジネスユーザーは、データベースの操作方法を学ぶ代わりに、複雑な分析計算を作成してレポートを生成できます。
統合データビュー
OLAP は、マーケティング、財務、生産、その他のビジネスユニットのために統一されたプラットフォームを提供します。マネージャーと意思決定者は、全体像を把握し、問題を効果的に解決できます。What-If 分析を実行できます。この分析では、ある部門が下した意思決定がビジネスの他の領域に及ぼす影響が示されます。
OLAP アーキテクチャとは何ですか?
オンライン分析処理 (OLAP) システムは、3 つ以上のディメンション (カテゴリ) で情報を表現することにより、多次元データを格納します。2 次元データには列と行が含まれますが、多次元データは複数の特性を備えています。例えば、製品の売上に関する多次元データは、次のディメンションで構成される場合があります。
- 製品タイプ
- ロケーション
- 時間
データエンジニアは、次の要素で構成される多次元 OLAP システムを構築します。
データウェアハウス
データウェアハウスは、アプリケーション、ファイル、データベースなど、さまざまなソースから情報を収集します。さまざまなツールを使用して情報を処理し、データを分析用に準備します。例えば、データウェアハウスは、行と列のテーブルにデータを格納するリレーショナルデータベースから情報を収集する場合があります。
ETL ツール
抽出、変換、ロード (ETL) ツールは、データを自動的に取得し、分析目的に適した形式に変更して準備するデータベースプロセスです。データウェアハウスは、さまざまなソースからの情報を OLAP ツールで利用できるようにする前に、ETL を使用してその情報を変換および標準化します。
OLAP サーバー
OLAP サーバーは、OLAP システムを支える基盤となるマシンです。このサーバーは、ETL ツールを使用してリレーショナルデータベース内の情報を変換し、OLAP オペレーションのために準備します。
OLAP データベース
OLAP データベースは、データウェアハウスに接続する独立したデータベースです。データエンジニアは、OLAP 分析によってデータウェアハウスに負担がかからないようにするために OLAP データベースを使用することがあります。また、OLAP データモデルの作成を容易にするためにも OLAP データベースを使用します。
OLAP キューブ
データキューブは、情報の多次元配列を表すモデルです。3 次元データモデルとして視覚化する方が簡単ですが、ほとんどのデータキューブは 3 次元を超える次元を備えています。OLAP キューブ、またはハイパーキューブは、OLAP システムにおけるデータキューブを表す用語です。OLAP キューブは、いったんモデル化するとディメンションや基盤となるデータを変更できないため、厳格です。例えば、製品、場所、および時間のディメンションを持つキューブにウェアハウスのディメンションを追加する場合、キューブ全体を再モデル化する必要があります。
OLAP 分析ツール
ビジネスアナリストは、OLAP ツールを使用して OLAP キューブを操作します。OLAP キューブ内の特定の情報についてより深いインサイトを得るために、スライス、ダイス、ピボットなどのオペレーションを実行します。
OLAP はどのように機能しますか?
OLAP はどのように機能しますか?
オンライン分析処理 (OLAP) システムは、次のステップを使用してデータを収集、整理、集計、および分析することによって機能します。
- OLAP サーバーは、リレーショナルデータベースやデータウェアハウスを含む複数のデータソースからデータを収集します。
- その後、抽出、変換、ロード (ETL) ツールは、指定されたディメンション数に従って OLAP キューブ内のデータをクリーニング、集計、事前計算、および格納します。
- ビジネスアナリストは、OLAP ツールを使用してクエリを実行し、OLAP キューブ内の多次元データからレポートを生成します。
OLAP は、多次元式 (MDX) を使用して OLAP キューブをクエリします。MDX は、データベースを操作するための一連の指示を提供する SQL のようなクエリです。
OLAP のタイプにはどのようなものがありますか?
オンライン分析処理 (OLAP) システムは、主に 3 つの方法で動作します。
MOLAP
多次元オンライン分析処理 (MOLAP) では、データウェアハウスからの多次元データを表すデータキューブを作成します。MOLAP システムは、事前に計算されたデータをハイパーキューブに保存します。データエンジニアが MOLAP を使用するのは、このタイプの OLAP テクノロジーでは高速な分析が提供されるためです。
ROLAP
データキューブを使用する代わりに、リレーショナルオンライン分析処理 (ROLAP) を使用すると、データエンジニアはリレーショナルデータベースで多次元データ分析を実行できます。つまり、データエンジニアは SQL クエリを使用して、必要なディメンションに基づいて特定の情報を検索および取得します。ROLAP は、広範囲で詳細なデータの分析に適しています。ただし、ROLAP のクエリのパフォーマンスには MOLAP と比較して時間がかかります。
HOLAP
ハイブリッドオンライン分析処理 (HOLAP) は、MOLAP と ROLAP を組み合わせて、両方のアーキテクチャの長所を提供します。HOLAP を使用すると、データエンジニアはデータキューブから分析結果を迅速に取得し、リレーショナルデータベースから詳細情報を抽出できます。
OLAP におけるデータモデリングとはどのようなものですか?
データモデリングは、データウェアハウスまたはオンライン分析処理 (OLAP) データベース内のデータの表現です。データモデリングは、リレーショナルデータベースから直接データを分析するため、リレーショナルオンライン分析処理 (ROLAP) に不可欠です。これは、多次元データをスタースキーマまたはスノーフレークスキーマとして格納します。
スタースキーマ
スタースキーマは、ファクトテーブルと複数のディメンションテーブルで構成されています。ファクトテーブルは、ビジネスプロセスに関連する数値を含むデータテーブルであり、ディメンションテーブルには、ファクトテーブルの各属性を説明する値が含まれています。ファクトテーブルは、外部キー、つまりディメンションテーブルのそれぞれの情報に関係する一意の識別子を持つディメンションテーブルを参照します。
スタースキーマでは、ファクトテーブルが複数のディメンションテーブルに接続されるため、データモデルは星のように見えます。製品の売上に関するファクトテーブルの例を次に示します。
- 製品 ID
- 場所 ID
- Salesperson ID
- 売上金額
製品 ID は、製品ディメンションテーブルから情報を取得するようデータベースシステムに指示します。このテーブルは次のようになる場合があります。
- 製品 ID
- 製品名
- 製品タイプ
- 製品コスト
同様に、場所 ID は場所のディメンションテーブルをポイントします。これは次のもので構成される場合があります。
- 場所 ID
- 国
- 市
営業担当者テーブルは次のようになる場合があります。
- Salesperson ID
- 名
- 姓
- E メール
スノーフレークスキーマ
スノーフレークスキーマは、スタースキーマが拡張されたものです。一部のディメンションテーブルは、1 つまたは複数のセカンダリディメンションテーブルにつながる場合があります。この結果、ディメンションテーブルが一体となると、スノーフレーク (雪片) に似た形状になります。
例えば、製品ディメンションテーブルには、次のフィールドが含まれる場合があります。
- 製品 ID
- 製品名
- 製品タイプ ID
- 製品コスト
製品タイプ ID は、次の例に示すように、別のディメンションテーブルにつながります。
- 製品タイプ ID
- タイプ名
- バージョン
- バリアント
OLAP オペレーションとは何ですか?
ビジネスアナリストは、多次元オンライン分析処理 (MOLAP) キューブを使用して、いくつかの基本的な分析オペレーションを実行します。
ロールアップ
ロールアップでは、オンライン分析処理 (OLAP) システムが特定の属性に関するデータを要約します。つまり、詳細度の低いデータが表示されます。例えば、ニューヨーク、カリフォルニア、ロンドン、東京に従って、製品の売上を表示するとします。ロールアップオペレーションでは、米国、英国、日本などの国に基づいた売上データのビューが提供されます。
ドリルダウン
ドリルダウンは、ロールアップオペレーションに対置されるものです。ビジネスアナリストは、コンセプト階層を下に移動して、必要な詳細を抽出します。例えば、売上データの年別の表示から移動して、月別で視覚化できます。
スライス
データエンジニアは、スライスオペレーションを使用して OLAP キューブから 2 次元ビューを作成します。例えば、MOLAP キューブは、製品、都市、月に従って、データを並べ替えます。キューブをスライスすることで、データエンジニアは、特定の月について、製品と都市で構成されるスプレッドシートのようなテーブルを作成できます。
ダイス
データエンジニアは、ダイスオペレーションを使用して OLAP キューブからより小さなサブキューブを作成します。それらは必要なディメンションを決定し、元のハイパーキューブからより小さなキューブを構築します。
ピボット
ピボットオペレーションでは、OLAP キューブをそのディメンションの 1 つに沿って回転させ、多次元データモデルについて異なる視点を得ることができます。例えば、3 次元 OLAP キューブの各軸には、次のディメンションがあります。
- X 軸–製品
- Y 軸–場所
- Z 軸–時間
ピボットでは、OLAP キューブには次の設定があります。
- X 軸–場所
- Y 軸–時間
- Z 軸–製品
OLAP は他のデータ分析手法と比較してどのように優れていますか?
データマイニング
データマイニングは、大量の履歴データを処理してパターンやインサイトを見つける分析テクノロジーです。ビジネスアナリストは、データマイニングツールを使用してデータ内の関係を発見し、将来の傾向を正確に予測します。
OLAP とデータマイニング
オンライン分析処理 (OLAP) は、概要データのクエリ、抽出、および調査を伴うデータベース分析テクノロジーです。一方、データマイニングでは、未処理の情報を詳しく調べます。例えば、マーケティング担当者はデータマイニングツールを使用して、すべてのウェブサイト訪問の記録からユーザーの行動を分析できます。その後、OLAP ソフトウェアを使用して、期間、デバイス、国、言語、ブラウザの種類など、さまざまな角度からこれらの動作を検査できます。
OLTP
オンライントランザクション処理 (OLTP) は、情報をデータベースに迅速かつ確実に格納するデータテクノロジーです。データエンジニアは OLTP ツールを使用して、財務記録、サービスのサブスクリプション、顧客からのフィードバックなどのトランザクションデータをリレーショナルデータベースに格納します。OLTP システムでは、リレーショナルテーブルのレコードを作成、更新、および削除します。
OLAP と OLTP
OLTP は、データベース内のトランザクションの複数のストリームを処理および格納するのに最適です。ただし、データベースから複雑なクエリを実行することはできません。したがって、ビジネスアナリストは OLAP システムを使用して多次元データを分析します。例えば、データサイエンティストは OLTP データベースをクラウドベースの OLAP キューブに接続して、履歴データに対してコンピューティングを多用するクエリを実行します。
AWS は OLAP をどのようにサポートできますか?
AWS データベースは、組織がオンライン分析処理 (OLAP) オペレーションを格納および実行するのに役立つさまざまなマネージドクラウドデータベースを提供します。データアナリストは AWS データベースを使用して、組織の要件に整合的な安全なデータベースを構築します。組織は、手頃な料金とスケーラビリティを理由として、ビジネスデータを AWS データベースに移行します。
- Amazon Redshift は、オンライン分析処理専用に設計されたクラウドデータウェアハウスです。
- Amazon Relational Database Service (Amazon RDS) は、OLAP 機能を備えたリレーショナルデータベースです。データエンジニアは、Amazon RDS と Oracle OLAP を使用して、ディメンションキューブに対して複雑なクエリを実行します。
- Amazon Aurora は MySQL および PostgreSQL と互換性のあるクラウドリレーショナルデータベースです。複雑な OLAP ワークロードの実行用に最適化されています。
今すぐ AWS アカウントを作成して、AWS で OLAP の使用を開始しましょう。