Phase 0: 準備と基礎固め 🛠️
期間: Week 0-1(書籍到着待ち) | 目的: 18週間の学習準備と「雰囲気」の理解
1. プロジェクト全体像:18週間のロードマップ
このプロジェクトは、WEBマーケターであるあなたが、**「因果推論×LLM×ベイズ統計×機械学習」**を統合したトップクラスのマーケティングサイエンティストとなるための18週間集中プログラムです。
Phase 0は、書籍の到着を待つ間の**完璧な準備期間**と位置づけ、無料リソースのみで因果推論の直感的な理解を目指します。この期間は、Udemyなどの有料教材の視聴は禁止です。
🎯 スキルマップと最新カリキュラム
- Phase 0 (Week 0-1): 準備、因果推論の「雰囲気」理解、環境構築
- Phase 1 (Week 2-5): 統計的因果推論の理論とPython実装(因果推論入門)
- Phase 2 (Week 6-9): ベイズ統計学による因果推論(ベイズ統計応用)
- Phase 3 (Week 10-12): 機械学習を活用した因果推論(CausalML, EconML)
- Phase 4 (Week 13-14): 実データを用いた総合分析(WEBマーケティング応用)
- Phase 5 (Week 15-16): **LLM×因果推論**による自動分析パイプライン構築(最新追加)
- Phase 6 (Week 17-18): 実務への応用とポートフォリオ作成
習得スキル: 統計検定準1級の知識をベースに、因果推論の専門知識と最先端のLLM応用力を統合します。
💰 プログラム投資計算(2025年10月最新版)
【金銭コスト】
| カテゴリ | 項目 | 金額 | 必須度 | 使用Phase |
|---|---|---|---|---|
| 📖 書籍 | 金本『因果推論』 | ¥0(図書館) | ★★★ 必須 | Phase 1 |
| 『Pythonライブラリによる因果推論』 | ¥0(図書館) | ★★★ 必須 | Phase 1 | |
| 史上最強図解 ベイズ統計学 | ¥0(図書館) | ★★★ 必須 | Phase 2 | |
| 💻 オンライン講座 | Udemy「因果推論入門」 | ¥1,500 | ★★★ 必須 | Phase 1〜 |
| Udemy「PyMCベイズ統計」 | ¥2,000 | ★★★ 必須 | Phase 2〜 | |
| 🤖 API | OpenAI API | ¥3,000 | ★★☆ 推奨 | Phase 5 |
| 💻 環境 | Google Colab / Python環境 | 無料 | ★★★ 必須 | Phase 0〜 |
📊 投資総額
- Phase 0-2: ¥3,500(Udemy 2講座のみ)
- Phase 5追加: ¥3,000(OpenAI API)
- 総額: ¥6,500
- 🎉 図書館活用で約¥10,000節約!
【時間投資】
- 週18時間 × 18週間 = 324時間
- 旧カリキュラムより4週間短縮(効率化)
【期待リターン】
- 金銭的ROI: 投資¥6,500で年収+¥500,000〜¥1,500,000
- ROI比率: 約77〜230倍のリターン!
- 希少スキル: 「因果推論×LLM」の統合人材は日本でトップクラス
2. 📚 使用参考書・教材リスト(Phase 0)
Phase 0では、書籍到着を待つ間に、**全て無料**のWEBリソースとPython環境の準備に集中します。
Phase 0で使用(全て無料)
- WEB記事: 「データ分析の力」伊藤公一朗 関連記事、Google検索: 「因果推論とは わかりやすく」
- 到達レベル: 因果推論の「雰囲気」を掴み、相関と因果の違いを説明できるようになる
- YouTube動画検索: 「因果推論 入門」
- 10-20分動画を3本視聴。A/BテストやRCTの基本概念を理解する
- Google Colab(無料): Python実行環境として使用
- Python公式ドキュメント: ライブラリの基本操作を確認
Phase 1以降で使用(準備のみ)
- 金本『因果推論』: 図書館で借用(¥0)。Phase 1 Week 1-4で使用
- 『Pythonライブラリによる因果推論』: 図書館で借用(¥0)。Phase 1で実装時に参照
- 史上最強図解 ベイズ統計学: 図書館で借用(¥0)。Phase 2 Week 1で精読
- Udemy「因果推論入門」: ¥1,500(購入済み)。Phase 1から視聴開始
- Udemy「PyMCベイズ統計」: ¥2,000(購入済み)。Phase 2から視聴開始
3. 🛠️ Phase 0で使用するツールと環境構築
Phase 0の最重要ミッションの一つは、18週間の学習を支える**開発環境の完璧な構築**です。
開発環境
- Google Colab(推奨、無料): ノートブック形式で手軽にPythonを実行可能。
- または Anaconda: ローカル環境で実行したい場合。
必須ライブラリ(Phase 0でインストール)
# Phase 0で準備 pip install pandas numpy matplotlib seaborn scipy # Phase 1に向けて準備 pip install dowhy causalml econml statsmodels
これらのインストールと動作確認をPhase 0の最終目標とします。
4. Week 0-1の完全スケジュール
書籍到着までの2週間を無駄にせず、因果推論の「導入」と「環境構築」を完了させます。
Week 0-1: 因果推論の直感的理解(書籍到着待ち)
- Day 1-2: WEB記事で概念理解
- Google検索: 「因果推論とは わかりやすく」
- 伊藤公一朗「データ分析の力」関連記事を熟読
- 相関≠因果の具体例を3つ見つけ、自分の言葉でまとめる
- Day 3-4: YouTube動画視聴
- 「因果推論 入門」で10-20分動画を3本視聴
- A/Bテストの基本、RCT(ランダム化比較試験)の概念を理解
- ノートにまとめ、Phase 1に繋げるキーワードを抽出
- Day 5-7: Python環境構築
- Google Colabアカウント作成(またはAnacondaインストール)
- 基本ライブラリ(pandas, numpy, matplotlib)の動作確認
- 因果推論ライブラリのインストール(dowhy, causalmlなど)
- 後述の環境確認スクリプトを実行し、準備を完了させる
Week 0-2: Pythonデータ分析の復習と準備
- Day 1-3: Pandas復習
- DataFrameの基本操作、groupby、merge、pivot_table
- **不動産仲介データ想定**のサンプルデータ(後述)で練習し、実務との接続を意識
- Day 4-5: 因果推論ライブラリの準備
- dowhy, causalml, econmlのimport確認
- 公式ドキュメントの「Getting Started」部分を確認(コード実行はPhase 1から)
- Day 6-7: 図書館の書籍受取準備
- 図書館予約状況の最終確認(金本、Python因果推論、ベイズ)
- Phase 1の学習スケジュール(Week 2-5)を作成し、学習時間の確保を確定
- Udemy講座の確認(**繰り返し: 視聴はまだしない**)
5. 実装コード例(Phase 0で実行/確認)
Phase 0では、環境の動作確認と、概念理解を深めるための簡単なシミュレーションコードを実行します。
1. 環境確認スクリプト
# Phase 0 環境確認 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns print("✅ 基本ライブラリ OK") # 因果推論ライブラリ try: import dowhy import causalml print("✅ 因果推論ライブラリ OK") except: print("⚠️ pip install dowhy causalml を実行してください")
2. 相関≠因果のシミュレーション
# アイスクリーム売上と溺死者数の相関(交絡因子: 気温) import numpy as np import pandas as pd import matplotlib.pyplot as plt np.random.seed(42) n = 100 # 気温(交絡因子) temperature = np.random.uniform(15, 35, n) # 気温が高いとアイスが売れる ice_cream_sales = 10 + 2 * temperature + np.random.normal(0, 5, n) # 気温が高いと水遊びが増え溺死も増える drownings = 0.1 * temperature + np.random.normal(0, 0.5, n) df = pd.DataFrame({ 'temperature': temperature, 'ice_cream': ice_cream_sales, 'drownings': drownings}) # 相関を確認 print(f"アイスと溺死の相関: {df['ice_cream'].corr(df['drownings']):.3f}") print("→ 相関があるが、因果ではない!(交絡因子: 気温)") # 可視化 plt.scatter(df['ice_cream'], df['drownings'], alpha=0.6) plt.xlabel('アイスクリーム売上') plt.ylabel('溺死者数') plt.title('相関≠因果の例') plt.show()
3. 不動産仲介データシミュレーション
# WEBマーケティング実務用サンプルデータ生成 np.random.seed(42) n = 200 areas = np.random.choice(['渋谷', '新宿', '品川'], n) property_type = np.random.choice(['オフィス', 'コワーキング'], n) size = np.random.uniform(20, 200, n) rent = 50 + 0.5 * size + np.random.normal(0, 10, n) inquiries = np.random.poisson(10, n) office_data = pd.DataFrame({ 'area': areas, 'property_type': property_type, 'size_m2': size, 'rent_10k_yen': rent, 'inquiries': inquiries}) print(office_data.head()) print(f"\nデータ形状: {office_data.shape}")
4. A/Bテストの概念確認
# 単純なA/Bテストシミュレーション import scipy.stats as stats np.random.seed(42) # コントロール群(現在のLP) control = np.random.binomial(1, 0.10, 1000) # CVR 10% # 処置群(新しいLP) treatment = np.random.binomial(1, 0.12, 1000) # CVR 12% print(f"コントロール群 CVR: {control.mean():.2%}") print(f"処置群 CVR: {treatment.mean():.2%}") print(f"差分: {(treatment.mean() - control.mean()):.2%}") # 統計的有意差はPhase 1で確認
5. Pandas操作の復習
# 不動産仲介データ分析の基礎 grouped = office_data.groupby('area').agg({ 'rent_10k_yen': ['mean', 'std'], 'inquiries': 'sum'}) print("エリア別集計:") print(grouped) # ピボットテーブル pivot = office_data.pivot_table( values='inquiries', index='area', columns='property_type', aggfunc='sum') print("\nピボットテーブル:") print(pivot)
✅ Phase 0完了チェックリスト
書籍・教材準備
- □ 図書館で3冊予約済み(金本、Python因果推論、ベイズ)
- □ Udemy 2講座購入済み(因果推論、PyMC)
- □ Udemy講座はPhase 1まで視聴しないと理解
環境構築
- □ Google Colabアカウント作成
- □ 基本ライブラリ動作確認
- □ 因果推論ライブラリインストール完了
概念理解
- □ 因果推論の必要性を理解
- □ 相関≠因果を体感(コード実行済み)
- □ A/Bテストの基本を理解
Phase 1準備
- □ 図書館の書籍受取予定確認
- □ Phase 1のスケジュール作成
- □ 学習時間の確保(週18時間)