Phase 0: 準備と基礎固め (Week 0-1) - 因果推論×LLMプロジェクト

Phase 0: 準備と基礎固め 🛠️

期間: Week 0-1（書籍到着待ち） | 目的: 18週間の学習準備と「雰囲気」の理解

1. プロジェクト全体像：18週間のロードマップ

このプロジェクトは、WEBマーケターであるあなたが、**「因果推論×LLM×ベイズ統計×機械学習」**を統合したトップクラスのマーケティングサイエンティストとなるための18週間集中プログラムです。

Phase 0は、書籍の到着を待つ間の**完璧な準備期間**と位置づけ、無料リソースのみで因果推論の直感的な理解を目指します。この期間は、Udemyなどの有料教材の視聴は禁止です。

🎯 スキルマップと最新カリキュラム

Phase 0 (Week 0-1): 準備、因果推論の「雰囲気」理解、環境構築
Phase 1 (Week 2-5): 統計的因果推論の理論とPython実装（因果推論入門）
Phase 2 (Week 6-9): ベイズ統計学による因果推論（ベイズ統計応用）
Phase 3 (Week 10-12): 機械学習を活用した因果推論（CausalML, EconML）
Phase 4 (Week 13-14): 実データを用いた総合分析（WEBマーケティング応用）
Phase 5 (Week 15-16): **LLM×因果推論**による自動分析パイプライン構築（最新追加）
Phase 6 (Week 17-18): 実務への応用とポートフォリオ作成

習得スキル: 統計検定準1級の知識をベースに、因果推論の専門知識と最先端のLLM応用力を統合します。

💰 プログラム投資計算（2025年10月最新版）

【金銭コスト】

カテゴリ	項目	金額	必須度	使用Phase
📖 書籍	金本『因果推論』	¥0（図書館）	★★★ 必須	Phase 1
	『Pythonライブラリによる因果推論』	¥0（図書館）	★★★ 必須	Phase 1
	史上最強図解ベイズ統計学	¥0（図書館）	★★★ 必須	Phase 2
💻 オンライン講座	Udemy「因果推論入門」	¥1,500	★★★ 必須	Phase 1〜
💻 オンライン講座	Udemy「PyMCベイズ統計」	¥2,000	★★★ 必須	Phase 2〜
🤖 API	OpenAI API	¥3,000	★★☆ 推奨	Phase 5
💻 環境	Google Colab / Python環境	無料	★★★ 必須	Phase 0〜

📊 投資総額

Phase 0-2: ¥3,500（Udemy 2講座のみ）
Phase 5追加: ¥3,000（OpenAI API）
総額: ¥6,500
🎉 図書館活用で約¥10,000節約！

【時間投資】

週18時間 × 18週間 = 324時間
旧カリキュラムより4週間短縮（効率化）

【期待リターン】

💎 投資対効果（ROI）

金銭的ROI: 投資¥6,500で年収+¥500,000〜¥1,500,000
ROI比率: 約77〜230倍のリターン！
希少スキル: 「因果推論×LLM」の統合人材は日本でトップクラス

2. 📚 使用参考書・教材リスト（Phase 0）

Phase 0では、書籍到着を待つ間に、**全て無料**のWEBリソースとPython環境の準備に集中します。

Phase 0で使用（全て無料）

WEB記事: 「データ分析の力」伊藤公一朗関連記事、Google検索: 「因果推論とはわかりやすく」
- 到達レベル: 因果推論の「雰囲気」を掴み、相関と因果の違いを説明できるようになる
YouTube動画検索: 「因果推論入門」
- 10-20分動画を3本視聴。A/BテストやRCTの基本概念を理解する
Google Colab（無料）: Python実行環境として使用
Python公式ドキュメント: ライブラリの基本操作を確認

⚠️ **重要:** Udemy講座（「因果推論入門」「PyMCベイズ統計」）は購入済みですが、Phase 0では視聴しないでください。インプット過多を防ぎ、Phase 1から最高のスタートを切るための準備期間です。

Phase 1以降で使用（準備のみ）

金本『因果推論』: 図書館で借用（¥0）。Phase 1 Week 1-4で使用
『Pythonライブラリによる因果推論』: 図書館で借用（¥0）。Phase 1で実装時に参照
史上最強図解ベイズ統計学: 図書館で借用（¥0）。Phase 2 Week 1で精読
Udemy「因果推論入門」: ¥1,500（購入済み）。Phase 1から視聴開始
Udemy「PyMCベイズ統計」: ¥2,000（購入済み）。Phase 2から視聴開始

3. 🛠️ Phase 0で使用するツールと環境構築

Phase 0の最重要ミッションの一つは、18週間の学習を支える**開発環境の完璧な構築**です。

開発環境

Google Colab（推奨、無料）: ノートブック形式で手軽にPythonを実行可能。
または Anaconda: ローカル環境で実行したい場合。

必須ライブラリ（Phase 0でインストール）

# Phase 0で準備
pip install pandas numpy matplotlib seaborn scipy

# Phase 1に向けて準備
pip install dowhy causalml econml statsmodels

これらのインストールと動作確認をPhase 0の最終目標とします。

4. Week 0-1の完全スケジュール

書籍到着までの2週間を無駄にせず、因果推論の「導入」と「環境構築」を完了させます。

Week 0-1: 因果推論の直感的理解（書籍到着待ち）

Day 1-2: WEB記事で概念理解
- Google検索: 「因果推論とはわかりやすく」
- 伊藤公一朗「データ分析の力」関連記事を熟読
- 相関≠因果の具体例を3つ見つけ、自分の言葉でまとめる
Day 3-4: YouTube動画視聴
- 「因果推論入門」で10-20分動画を3本視聴
- A/Bテストの基本、RCT（ランダム化比較試験）の概念を理解
- ノートにまとめ、Phase 1に繋げるキーワードを抽出
Day 5-7: Python環境構築
- Google Colabアカウント作成（またはAnacondaインストール）
- 基本ライブラリ（pandas, numpy, matplotlib）の動作確認
- 因果推論ライブラリのインストール（dowhy, causalmlなど）
- 後述の環境確認スクリプトを実行し、準備を完了させる

Week 0-2: Pythonデータ分析の復習と準備

Day 1-3: Pandas復習
- DataFrameの基本操作、groupby、merge、pivot_table
- **不動産仲介データ想定**のサンプルデータ（後述）で練習し、実務との接続を意識
Day 4-5: 因果推論ライブラリの準備
- dowhy, causalml, econmlのimport確認
- 公式ドキュメントの「Getting Started」部分を確認（コード実行はPhase 1から）
Day 6-7: 図書館の書籍受取準備
- 図書館予約状況の最終確認（金本、Python因果推論、ベイズ）
- Phase 1の学習スケジュール（Week 2-5）を作成し、学習時間の確保を確定
- Udemy講座の確認（**繰り返し: 視聴はまだしない**）

5. 実装コード例（Phase 0で実行/確認）

Phase 0では、環境の動作確認と、概念理解を深めるための簡単なシミュレーションコードを実行します。

1. 環境確認スクリプト

# Phase 0 環境確認
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
print("✅ 基本ライブラリ OK")

# 因果推論ライブラリ
try:
    import dowhy
    import causalml
    print("✅ 因果推論ライブラリ OK")
except:
    print("⚠️ pip install dowhy causalml を実行してください")

2. 相関≠因果のシミュレーション

# アイスクリーム売上と溺死者数の相関（交絡因子: 気温）
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

np.random.seed(42)
n = 100
# 気温（交絡因子）
temperature = np.random.uniform(15, 35, n)
# 気温が高いとアイスが売れる
ice_cream_sales = 10 + 2 * temperature + np.random.normal(0, 5, n)
# 気温が高いと水遊びが増え溺死も増える
drownings = 0.1 * temperature + np.random.normal(0, 0.5, n)

df = pd.DataFrame({
    'temperature': temperature,
    'ice_cream': ice_cream_sales,
    'drownings': drownings})

# 相関を確認
print(f"アイスと溺死の相関: {df['ice_cream'].corr(df['drownings']):.3f}")
print("→ 相関があるが、因果ではない！（交絡因子: 気温）")

# 可視化
plt.scatter(df['ice_cream'], df['drownings'], alpha=0.6)
plt.xlabel('アイスクリーム売上')
plt.ylabel('溺死者数')
plt.title('相関≠因果の例')
plt.show()

3. 不動産仲介データシミュレーション

# WEBマーケティング実務用サンプルデータ生成
np.random.seed(42)
n = 200
areas = np.random.choice(['渋谷', '新宿', '品川'], n)
property_type = np.random.choice(['オフィス', 'コワーキング'], n)
size = np.random.uniform(20, 200, n)
rent = 50 + 0.5 * size + np.random.normal(0, 10, n)
inquiries = np.random.poisson(10, n)

office_data = pd.DataFrame({
    'area': areas,
    'property_type': property_type,
    'size_m2': size,
    'rent_10k_yen': rent,
    'inquiries': inquiries})

print(office_data.head())
print(f"\nデータ形状: {office_data.shape}")

4. A/Bテストの概念確認

# 単純なA/Bテストシミュレーション
import scipy.stats as stats
np.random.seed(42)

# コントロール群（現在のLP）
control = np.random.binomial(1, 0.10, 1000)  # CVR 10%
# 処置群（新しいLP）
treatment = np.random.binomial(1, 0.12, 1000)  # CVR 12%

print(f"コントロール群 CVR: {control.mean():.2%}")
print(f"処置群 CVR: {treatment.mean():.2%}")
print(f"差分: {(treatment.mean() - control.mean()):.2%}")
# 統計的有意差はPhase 1で確認

5. Pandas操作の復習

# 不動産仲介データ分析の基礎
grouped = office_data.groupby('area').agg({
    'rent_10k_yen': ['mean', 'std'],
    'inquiries': 'sum'})
print("エリア別集計:")
print(grouped)

# ピボットテーブル
pivot = office_data.pivot_table(
    values='inquiries',
    index='area',
    columns='property_type',
    aggfunc='sum')
print("\nピボットテーブル:")
print(pivot)

✅ Phase 0完了チェックリスト

書籍・教材準備

□ 図書館で3冊予約済み（金本、Python因果推論、ベイズ）
□ Udemy 2講座購入済み（因果推論、PyMC）
□ Udemy講座はPhase 1まで視聴しないと理解

環境構築

□ Google Colabアカウント作成
□ 基本ライブラリ動作確認
□ 因果推論ライブラリインストール完了

概念理解

□ 因果推論の必要性を理解
□ 相関≠因果を体感（コード実行済み）
□ A/Bテストの基本を理解

Phase 1準備

□ 図書館の書籍受取予定確認
□ Phase 1のスケジュール作成
□ 学習時間の確保（週18時間）

因果推論学習：Phase0