先週と今週、2回かけて第1章をさらいました(「さらう」は復習なので誤用です)。
文中で「急増→微増→急増→微増」のグラフを四次関数によって表しているのですが、四次関数がW形(X^4がマイナスのときM形)になることを忘れていて詰まりました。そういえば荻野先生が接点tの解説で言っていた。
質を量に転換する
筆者(西郷浩)は、質を量的な尺度で置き換えること、または質をある性質をもつかもたないかに類型化することの重要さを説きます。測定という試みを通して事実を捉える世界観でもあると思いました。その過程で主観や単純化が入り込むことは免れないけれど、実証分析による客観的な裏づけを与えるうえでも欠かせません。
自然科学は観測できないものを切り捨てることで客観性な分析に踏み込みますが、社会科学も同じように「みえないもの」に触れないストイックさに支えられているのですね。しかし質的な差異を客観的な指標に置き換える(特定化する)ことが本当に科学的といえるのか。さて特定化の過程そのものを疑うするとき、それは何に対する批判なのか、なんて、ね。
視覚と認知
筆者はデータのグラフからいくつかの特徴を読み取ることで推定モデルを定式化している。つまりデータを視覚的に解釈している。僕たちには職人芸にみえて困りました。もしかすると、何か数値化したものを用いているのでしょうか。グラフから交互作用を読み取ることが肝のようです。しかし高次元のものとなると、やはり統計モデルによる支援が必要です。
視覚的な解釈によって性質を読み取るということにおもしろさと危うさを感じました。それにも限界があることに、現実味を覚えました。それから、数値に頼るのでしょう。統計モデルによって視覚的な認知モデルの限界を克服しているといえるのかな。けっこう直観的なところと、直観を越えているものが入り交じる感じで妙です。
感情を数値で表す
感情を数値で表すのは原理的に可能か、という問い。筆者の論調から、ひとの振る舞いから感情を観測することはできるか、という言い換えもできそうだ。観測できないことは「こころのなか」でも起こっていない、という仮定は科学的だけれど、ぜんぜん素朴じゃない。いや、難しいので、ふん、知らない。
- 作者: 清水和巳,河野勝
- 出版社/メーカー: 東洋経済新報社
- 発売日: 2008/03
- メディア: 単行本
- 購入: 1人 クリック: 52回
- この商品を含むブログ (16件) を見る
■わたあめ会(2008-09-01、kiwofusi) 『入門政治経済学方法論』第1章 統計:質を量る ●1 はじめに:質 vs 量? 質は観察可能な現象に対応づけられる→測定できる 「観察できない質」は現実に認識できない。 行動主義? ●2 質を量的な尺度に還元する ▼定義 推定:正規分布を利用して標本調査から母集団を推測すること http://www.kiui.ac.jp/~katayaa/toukei4.html これは文中の「推定」と同じだろうか? むしろ「予測」では。 http://www.yahoo-vi.co.jp/method/d01.html 変数の特定化:ある抽象的な概念を観察可能な指標で置き換えること(p.49) 散布図:関係を見たい2つの変数(X, Y)について、 座標平面に観察点を打点して表示したグラフ(p.49) 正の相関がある:観察点が右上がりの傾向を示す(Xが増えればYも増える) 相関係数:2つの確率変数の間の相関(類似性の度合い)を示す指標 http://ja.wikipedia.org/wiki/%E7%9B%B8%E9%96%A2%E4%BF%82%E6%95%B0 回帰分析(この節でやっているのはコレ?) http://ja.wikipedia.org/wiki/%E5%9B%9E%E5%B8%B0%E3%83%A2%E3%83%87%E3%83%AB 回帰式 Y = μ(X) + u においてYは目的変数、Xは説明(するための)変数 ▼ex.「社会的に安定した地位にいる人ほど、政治的に保守的になる」 1.「社会的に安定」「政治的に保守的」を特定化する 2.都道府県を個体とみなし、質を量的な変数に置き換える 3.散布図をかき、変数の関係を調べる 4.けっこうバラバラだけど「全体的に正の相関」と解釈する →中心的な傾向と副次的な部分を分けて定式化する(統計モデル) ▼シンプルな統計モデルからデータを推定(予測?)するための式をつくる 1.主要な部分(安定的)と副次的な部分がもつべき性質を考える 2.副次的な部分を「でたらめだが平均的には0くらい」にする(事後的に検証) 3.推定モデル(p.52(2)式)の完成。ね、簡単でしょ? あるX(持家率)におけるY(保守っぽさ)を予測したい! 「Xのまわりがどんな感じか」を求めればだいたいの予測になるはず。 ただし「Xのまわり」をどういう範囲でとるかはてきとう。 データの全体的な傾向とも似たような感じになる。 ▼ポイント ・実証的に調べる(反証可能)ために仮説を変数で具体化するよ ・主観や単純化が混入するから現実の近似でしかないよ ・だからデータの特徴に合わせて統計モデルを考えよう ●3 質を量に反映する ▼定義 類型化:質的な差異によってグループを分けること 質的変数、カテゴリカル変数:集団の構成員がどの類型に属しているかを表す 検定:グループ間の違い(有意差)をデータから検証する http://www.kiui.ac.jp/~katayaa/toukei4.html 対数:変化率に安定的な関係があるときに使われる変数変換(p.56) 交互作用:2つの要因が組合わさることによって発現する効果(p.57) 最小二乗法:予測と実際の値とのずれが最小になるように係数を求める方法 ▼ex.「製造業において、性別・職種が 所定内給与額と勤続年数との関係に影響するかどうか」 グラフからいろいろ読み取ってますねえ(p.56-57) こういった性質を見極めて、どんな式をつくるか考えるのだろうか? 「観察された事実を反映させることに力点を置く」(p.57) ▼統計モデル 主に「勤続年数、性別、職種」によって所定内給与(の対数)が決まると仮定。 (1)グラフがうにょうにょしとるから勤続年数は4次式やな! (2)グラフが俺に「勤続年数と性別が交互作用をもつ」と囁いている! (3)グラフが俺に「性別と職種が交互作用をもつ」と(ry μ(T, S, B) = μ(T, S) + μ(S, B) (3)右辺第2項 μ(S, B) = αSB αSBは、性別Sと職種Bの組み合わせによって決まる定数(4パターン) (1)(2)右辺第1項 μ(T, S) = αS + (ry αSやTの係数は、性別Sによって決まる定数 母数の「むだ」に配慮して2つのαSを0とする(謎) →p.58(4)式を特定化できる ▼推定モデル p.58(4)式を推定する。 1.平均0などの仮定を追加し、副次部uの性質を特定化する 2.最小二乗法によって定数αSBとTの係数βiSを推定する 3.残差を求めて副次部μと類似した性質をもつことを確認する 残差:μの推定値=実際の所定内給与から(4)式の推定値を引いたもの 交互作用を無視したら変な結果になるよ。 ●4 質と質を関係させる ▼ex.「人生経験が社会的活動の参加にどのような影響を及ぼしているか」 1.「社会的な活動」「参加(の形態)」「人生経験」を特定化する 2.回答者を類型化してグループごとの行動者率を求める 3.交互作用を視覚的にみつける〔μ(S, A, E), μ(S, W)〕 4.高次の交互作用をみつけるために統計モデルを利用する 「集計表の分析と個票の分析とは本質的に同じでなければならない」(p.63) 個票レベルで質的変数を説明する→妥当な推定が難しい ある個人が活動に参加する確率pを推定するモデルを考える。 確率がわかればあるグループにおける行動者数を二項分布とかで表現できる。 以上は一般化線形モデルらしいよ。