Azure でデータ基盤を構築・可視化

2025年9月19日
2025年10月16日
技術ブログ
Azure, Cloud, Microsoft
58view

1 はじめに
2 全体アーキテクチャ
3 STEP1：Azure Blob Storage に CSV を格納
4 STEP2：Azure Data Factory で Blob → SQL Database コピー
5 STEP3：Power BI Desktop で可視化
- 5.1 接続手順
- 5.2 可視化例
6 感想

はじめに

この記事では、Azure を利用してデータ基盤を構築し、可視化する手順について紹介します。具体的には、Azure Blob Storage に CSV データを格納し、Data Factory を用いて Azure SQL Database に取り込み、Power BI でレポートを作成する流れを解説します。

全体アーキテクチャ

構成概要は以下の通りです。

Blob Storage：データレイクの入り口
Data Factory：ETL パイプライン
Azure SQL Database：格納先
Power BI：可視化

AWS に例えると「S3 → Glue → Redshift → QuickSight」に近いイメージです。

STEP1：Azure Blob Storage に CSV を格納

まずはストレージアカウントを作成し、raw コンテナにサンプルデータをアップロードしました。

リソースグループ：Test-RG
ストレージアカウント：blobdemodata01
ファイル：demodata.csv

アップロード後、ポータルでファイルを開くとサイズや最終更新日時が確認できます。

STEP2：Azure Data Factory で Blob → SQL Database コピー

次に、Azure Data Factory を使って Blob の CSV を SQL Database にコピーします。

SQL Database の準備

SQL サーバーを作成し、例として sqldemo データベース内に以下のテーブルを作成しました。

CREATE TABLE TableTennisDemo (
    Rally INT,
    Server NVARCHAR(50),
    Winner NVARCHAR(50),
    ServeType NVARCHAR(100),
    Outcome NVARCHAR(100),
    Axis NVARCHAR(50),
    SpinClass NVARCHAR(50),
    Length NVARCHAR(50),
    Course NVARCHAR(50),
    Contact NVARCHAR(50) NULL,
    SetNumber INT,
    match_id NVARCHAR(50),
    created_at DATETIME2,
    player NVARCHAR(50),
    opponent NVARCHAR(50)
);

Data Factory の構築

Data Factory を作成し、スタジオを開く
Linked Service を2つ準備
- ls_blobdemodata（Blob Storage）
- ls_sqldemodata（SQL Database）
Copy Data アクティビティを配置し、ソース＝demodata.csv、シンク＝TableTennisDemo を設定
列名 Set → SetNumber のマッピングを調整