NAISTサマーブートキャンプ1日目:社会ネットワーク分析の基礎

NAISTサマーブートキャンプ

ソフトウェア工学講座「社会ネットワーク分析」の実習(2009年8月10-12日)に参加しました。
一日目午前:NAISTソフトウェア設計学講座をちょっと見学してきた



一日目午後。まず全体で説明を受けてソフトウェア工学講座で集まりました。いい先生がた、いい先輩がたです。言い方が不適当かもしれませんが、あまり理系理系していない感じでした。

社会ネットワーク分析は構造からアクターの性質や現象のプロセスを理解する

社会ネットワーク分析の基礎について講義を受けました。社会ネットワーク分析は、個人や集団などのアクターをノードと捉え、それらの関係(エッジ)を構造(グラフ)として分析することによってアクターの性質や現象のプロセスを理解する手法です。
先生が、このキャンプに参加したきっかけを尋ね、社会ネットワークが行動に大きく影響することを気づかせてくれました。曰く「そうやってみんな騙され(ry

アクターの行動は構造によって決定されると仮定する

ここで、アクターの行動はそれを取り巻く関係の構造によって決定されると仮定します。つまり、それぞれのノードが「どんなアクターか」という点は無視して、逆に、構造だけから「どんなアクターか」をみちびきます。この仮定から、ネットワーク図をえがくことによる可視化、さまざまな尺度を用いた定量化によって、わかりやすい結果を得ることができます。
これはアクターの性質から現象の原因を分析する統計的・心理学的なアプローチと対比されます。たとえば選挙の投票について、アクターを年齢という属性によって分類し、ある年齢層が投票率が低いなどとみちびきます。逆に、社会ネットワーク分析ではそういう「原因」をおいておき、投票にまつわるアクター同士の関係にのみ注目します*1。現象が「なぜ起きたのか」と「どのように起きているのか」という違いだと理解しました。
いさぎよい仮定だ、と感じます。しかし何を構造として解釈するかにも幅がある気がします。たくさんのデータがあったら、グラフの構築方法にもいくつかパターンがあるでしょう。でも、コンピュータがあるのだからいろいろ試してみればよいのですね。

スモールワールドは短い距離を辿ると巨大なネットワークになることを示した

どんなひとでも6人くらい知り合いを辿っていくと辿り着けるよ、ということを示す実験が1967年に実施されました。時を経て、1998年にワッツとストロガッツによるモデルがその現象を理論づけました。これをさらに現実世界に近づけたモデルが翌年に出てきました。環状につながったノードを基本にしたモデルのようですが、現実にどう対応しているのかがピンときませんでした。
印象深い実験結果ですし、数学的な証明が出たことでこの時期に社会ネットワークの研究が盛り上がったらしいです。

スケールフリーはごく少数なのに強大な影響力をもつノードがあることを示した

インターネットはもともと拠点を分散して守りの堅いネットワークを構築するのが目的でした。しかし多くのサーバと関係をもつ強力なノード(ハブ)が出てくることもあります。そういうノードがネットワークを支えることになる一方で、ネットワークを破壊する弱点になることもあります。*2
このように、少ないつながりしかもたないノードが膨大にある一方で、ごく少数なのに強大な影響力をもつノードがあることスケールフリーといいます。これがいろんなネットワークに見出せるそうです。*3

世の中のネットワークは思いもしない構造をもっていることがある

細かいところまで追っていくと難しそうです(複雑ネットワーク - Wikipediaが参考になります)。ひとまず、世の中のネットワークは思いもしない構造をもっていることがある、という教訓を得ました。
スケールフリーは少数で強力なノードに注目することから、微弱だが膨大なノードに注目するロングテールとは対照的だと感じました。長いしっぽに対して、スケールフリーは天井を突き破るイメージでしょうか。グラフ理論とは異なるかもしれませんが、ロングテールもまた「思いもしない構造」のひとつだと思います。ある現象を分析するためには、どんな構造をもっているかを理解することが重要なのでしょう。



二日目:ネットワークの特徴量、Pajekの使い方
三日目:バグトラッキング分析、コミュニティ抽出

*1:この例は自分で考えたので、適切である自信はありません。たとえば血縁関係とか、政治関係のウェブサービスの利用履歴とか、さいきんおしゃべりしたひとの記録などによって、投票プロセスの社会ネットワーク分析ができるのかな、と考えています。

*2:スケールフリーネットワークとインターネット・Web・生命」(杉原俊雄の研究報告)が参考になっておもしろいです。

*3:たとえばTopHatenarの分布はスケールフリーでしょうか。お近くのふぁぼり数について調べてみた - とて日記はスケールフリーっぽいですね。