WiNF2008の発表をちょっとだけ見てきた

25,26日に情報学ワークショップ WiNF2008がありまして、26日の午後だけ発表を見にいきました。知り合いの先輩の発表を見て、そのあと豊橋技大の学生さんの発表「日本語語彙大系と日本語Wikipedia からの汎用オントロジーの自動構築手法」と名古屋大の学生さんの発表「学術論文の効率的利用のための意味的構造化」を見ました。

発表するときに気をつけたいこと

時間か大学かの関係で、なんか資料をタダでもらえた。資料をもたずにメモしているかたもいた。僕も論文を下読みする時間がなかったし、聞き手の理解がばらばらな状態で発表するには気を遣うかも、と思った。技術的な内容に関しては予習しておかないと難しくて理解できなかった。しゃべっていることが論文のどの部分に当たるか、また論文にない補足の解説をしているか、というのを聞き分けられず、混乱することがあった。
こういう場で発表するとき、聞き手にどんな前提を求めるかに気を遣うようにしたい。ひとつは、論文にはあくまで必要十分な研究成果を書き、プレゼンではプレゼン資料のみで理解できる大枠を話す、という方法。あるいは、論文を参照できるものとして、いま論文のどの部分を述べているか伝えながらプレゼン資料で補足していく、という方法がある。また論文の締め切りとプレゼンの準備期間は異なるので、どうしても付け加えたいところは論文に書かれていないことを断ってから説明するように心掛けたい。
どの部分を詳細に解説するか、どうやってしゃべるかという戦術も大事だけれど、だれに向けて、何を理解してもらうために発表するのか、という戦略も意識したい。よい研究をできるのが第一だけれど。

「日本語語彙大系と日本語Wikipedia からの汎用オントロジーの自動構築手法」

難しかった。そもそもクラスとインタンスの関係すらろくに理解できない。オブジェクト指向に近いからなんとなくはわかる。いざ機械的インスタンスのなかで不適切なものを除去したりクラスの多重継承を解消したりするとなると、結果として「できる」ということが不思議で仕方ない。頭が悪い><
日本語語彙体系とうまく折衷することもそうですが、不適切なインスタンスを除去して精度を高めることが特徴的でした。その手順を理解しきれなかった。プレゼンの資料をもう一回見たいです。
関連:
第18回セマンティックウェブとオントロジー研究会(汎用オントロジー構築における日本語Wikipediaの適用可能性)
jsai2008: Wikipediaマイニングによる大規模Webオントロジの実現
JSAI2007: 日本語WikipediaマイニングとFolksonomyタグに基づく領域オントロジー構築支援

「学術論文の効率的利用のための意味的構造化」

機械学習だしメタデータだしでわかりやすくておもしろかった。SVMがもともと一値分類器というので線形分離を思い出したのだけれどそういうことですよね。この研究では多値分類しているわけで、なんだかよくわからないけれど何かしている。質疑でN-gramについて議論になったがなんのことかわからなかった。
学習データを増やし、また単語のほかに位置や引用データも利用して精度が上がっていくのがわくわくした。機械学習とか、コンピュータのなかで何が起きているか想像はつかないけれど、やっぱり「できる」のでなんかすごい。もうちょっとちゃんと勉強したい。

研究の難しさとわかりやすさ

難しい発表とわかりやすい発表があった。
たぶん、論理的であればあるほど難しくなる。理解すべき前提が増えるから。研究者のツールやコンピュータのツールとしては適切だ。しかし思考や分析のフレームワークを提案するなら直感のしやすさも大事だ。いや、けっこうごちゃごちゃした話だと思うのだけれど、なんか。
とりあえず、難しいのもおもしろいし、わかりやすいのもおもしろい。