Azure でデータ基盤を構築・可視化

  • URLをコピーしました!
目次

はじめに

この記事では、Azure を利用してデータ基盤を構築し、可視化する手順について紹介します。具体的には、Azure Blob Storage に CSV データを格納し、Data Factory を用いて Azure SQL Database に取り込み、Power BI でレポートを作成する流れを解説します。

全体アーキテクチャ

今回の構成は以下のとおりです。

  • Blob Storage: データレイクの入り口(CSV 置き場)
  • Data Factory: データのコピーを担う ETL パイプライン
  • Azure SQL Database: データの格納先(DWH)
  • Power BI: データの可視化ツール

AWS に例えると「S3 → Glue → Redshift → QuickSight」に近いイメージです。

導入手順

STEP

Azure Blob Storage に CSV を格納

まずはストレージアカウントを作成し、raw コンテナにサンプルデータをアップロードします。

  • リソースグループ: Test-RG
  • ストレージアカウント: blobdemodata01
  • ファイル: demodata.csv

アップロード後、ポータルでファイルを開くとサイズや最終更新日時が確認できます。

STEP

SQL Database の準備

格納先となるデータベース(例:sqldemo)を用意し、テーブルを作成しておきます。

以下のクエリを実行してテーブルを作成しました。

CREATE TABLE TableTennisDemo (
    Rally INT,
    Server NVARCHAR(50),
    Winner NVARCHAR(50),
    ServeType NVARCHAR(100),
    Outcome NVARCHAR(100),
    Axis NVARCHAR(50),
    SpinClass NVARCHAR(50),
    Length NVARCHAR(50),
    Course NVARCHAR(50),
    Contact NVARCHAR(50) NULL,
    SetNumber INT,
    match_id NVARCHAR(50),
    created_at DATETIME2,
    player NVARCHAR(50),
    opponent NVARCHAR(50)
);
STEP

Data Factory でパイプライン構築

Azure Data Factory (ADF) を使い、Blob から SQL Database へデータをコピーします。

Azure Data Factory Studio を開きます。

  • Linked Service の作成: 以下の2つを作成します。
  1. Copy Data アクティビティの設定: ソースに demodata.csv、シンクに先ほど作成したテーブル TableTennisDemo を指定します。
STEP
STEP
STEP
STEP
  1. マッピングの調整: 列名のマッピングを行います(例: SetSetNumber
  1. デバッグ実行: パイプラインを実行し、SQL Database にデータが格納されたことを確認します。
STEP

Power BI Desktop で可視化

最後に Power BI Desktop から SQL Database に接続します。

  • データの取得: 「Azure SQL Database」を選択
  • サーバー名: sqlsrvdemodata01.database.windows.net
  • データベース: sqldemo
  • 認証: SQL Server 認証(ユーザー名: sqladmin
STEP
「データの取得」→「Azure SQL Database」
STEP
サーバー名:sqlsrvdemodata01.database.windows.net
DB 名: sqldemo
STEP
認証:SQL Server 認証(ユーザー名:sqladmin
STEP
テーブル TableTennisDemo を読み込み
STEP
可視化の例

感想

GUI 操作で直観的

初めてでも GUI 操作中心で直感的に構築できました。Power BI 発行など、M365 との親和性が高く連携がスムーズです。

AWS Glue との違い

アーキテクチャの考え方は非常に似ており、AWS 経験者なら移行は容易です。個人的には、Data Factory のパイプライン構築画面は AWS Glue Studio よりも視覚的で理解しやすいと感じました。

以上、最後までお読みいただきありがとうございました。

よかったらシェアしてね!
  • URLをコピーしました!

この記事を書いた人

クラウド・ネットワーク・セキュリティ・仮想化・プログラミング・オープンソース・Web 開発をテーマにしたブログを運営👨‍💻 コンシューマー向けエンタメ事業の新規開発・運営経験 / VCAP-DCA・CCIE Lifetime Emeritus 認定 / 技術とビジネス書愛好家📚

目次