第1章 経済・経営分析のためのデータサイエンス
1.1 データサイエンスと社会科学で出来ること
1.2 理論と実践をつなげるには
1.3 本書のねらいと構成
1.4 Pythonとは?
1.5 統計ソフトの比較
1.6 本書で扱う事例について
1.7 本書の読み進め方
1.8 さらなる学習のために
第2章 はじめの一歩, Pythonを使ってみよう
2.1 Jupyter Notebook, Jupyter LabおよびSpyderのインストール
2.1.1 Jupyter Labの起動
2.1.2 Jupyter Notebookの起動
2.1.3 Spyderの起動方法
2.2 Google Colaboratoryへのアクセスと、画面の見方
2.3 サンプルデータを読み込む-はじめの一歩
第3章 Pythonを使ってデータを集めよう
3.1 データを「つくる」-Webスクレイピング
3.1.1 緊急事態宣言下のパチンコホールの営業状況を調べる
3.1.2 COVID-19に関連する支援状況を把握する
3.2 データで「まなぶ」-Kaggleとデータセット
3.3 データを「つかう」(1) -政府統計データ
Column 法人番号で宮城県の企業の数をカウントしてみる
3.4 データを「つかう」(2) -Linked Open Data
Column EDINETからデータを取得する
3.5 データを保存して、Excelなどで使えるようにする
Column データの可用性とプライバシー
練習問題
第4章Pythonによる基礎的な統計分析
4.1 Pythonによる基礎的な統計分析
4.2 データを把握する(1) -型や特性を把握する
4.3 データを把握する(2) -平均、分散、標準偏差を求める
4.4 データを把握する(3) -ヒストグラムを書く
4.5 データを把握する(4) -変数間の関係性
4.6 作業結果を保存する
4.7 データを把握する(5) -データの可視化手法; ploty, D3.js
練習問題
第5章 Pythonによる多変量解析-クロスセクション・パネルデータ
5.1 回帰分析の考え方-最小二乗法
5.2 データの種類-クロスセクション・時系列データ・パネルデータ
5.2.1 クロスセクションデータ
5.2.2 時系列データ
5.2.3 パネルデータ
5.3 回帰分析(1)単回帰分析
5.4 回帰分析(2)ダミー変数と重回帰分析
5.5 回帰分析(3)分析結果の解釈の方法
Column Airbnbの価格分析-空間情報の活用
5.5.1 geocodingに必要なパッケージをインストールする
5.5.2 ランドマークの位置情報を取得する
5.5.3 ランドマークと、Airbnbホストとの距離を測る
5.5.4 散布図やヒストグラムを求める
5.5.5 地図上にプロットする
5.5.6 回帰分析を行う
5.6 回帰分析(4)操作変数法
5.7 パネルデータ分析(1)データ構築
5.8 パネルデータ分析(2) Pooled OLS
5.9 パネルデータ分析(3)固定効果モデル
5.10 パネルデータ分析(4)変動効果モデル
5.11 パネルデータ分析(5)モデルの比較
練習問題
第6章 応用編;機械学習と因果推論とテキスト分析
6.1 応用編;機械学習と因果推論とテキスト分析
6.2 機械学習(1)決定木分析
6.3 機械学習(2) SVM
6.4 機械学習(3) SGDRegressor
6.5 機械学習(4)スパース推定(Lasso)
6.6 リッジ推定(Ridge)
6.7 モデルの比較
6.8 因果推論(1)傾向スコアマッチング(PSM)
6.9 因果推論(2)回帰非連続デザイン
6.10 テキスト分析(1) Twitterからデータを取得し、Mecabで分かち書きをする
6.11 テキスト分析(2) Wordcloud
Column 社会科学の違いを「測る」 -Linked Open Dataを使ったテキスト分析
6.12 テキスト分析(3) word2vecモデル
6.13 テキスト分析(4)トピックモデル
6.14 さいごに
困ったときの逆引き事典
@ Pythonで基本的なプログラミング構文を学ぶ
1 標準出力
2 数値演算
3 データ型の変換
4 for文
5 enumerate文
6 zip文
7 enumerateとzip文を一緒に使う
8 for文を用いた多重ループ
9 itertoolsを使った多重ループ
10 if文
11 論理演算子
12 while文
13 無限ループと例外処理276
A Pythonでの基本的な数理計算
1 四則演算
2 三角関数とMathパッケージ
3 ベクトルの計算
4 行列の計算2845Pandasを使った処理
B pipでパッケージを導入する
C パッケージのバージョンを確認する
D エラーコードの対処方法
1 Name is Not Definedな場合
2 数字を文字列で割っている場合
3 砂山からダイヤモンドを探す方法(エラーの倒し方)
索 引