人工知能なんちゃら研究会 2日目

人工知能なんちゃら研究会 1日目 - 反言子の続き。
まとめ:大規模データからの機械学習と自然言語処理への応用 - 人工知能学会基本問題研究会 - 生駒日記

おまけ

昼食:FPAIから早めに退去して八重洲新宿ねぎしで食べた。牛グリル焼定食が見当たらなかったのでねぎし定食1200円。値段相応な感じ。ここも店員が元気でよかった。牛タンおいしいです^q^
そのあとJAISTの説明会に行った。この話は今度。
説明会を終えて東京駅のねんりん家に並んでバームクーヘンを買った。
夕食:八重洲からなべ屋でメンチカツカレー550円。メンチカツが揚げたてでおいしい。正直カレーは(ry

推論とか信頼度とかウェブとか

発表は3つほどしか聞けなかった。ナースの勤務表を自動生成する研究がおもしろかった。
発表を聞けなかったところで、仮説に基づいた推論モデルを検討する研究や、設計における意思決定をモデル化する研究がおもしろそうなので、論文をしっかり読みたい。
推論システムでは信頼度を設けることで柔軟な推論を目指すようだけれど、具体的にどんな値を定めるかはよくわからない。個人的な印象だと、数値の決め方は些末なものとして議論されないことが多い。確率では表せない命題に確率のような値を与えるのは不思議だ(主観確率?)。
NLP2009で、ウェブの検索を利用して外国人名をカタカナに翻訳する研究があった(佐藤理史「外国人名対訳辞書の自動編纂:現状と展望」)。これは翻訳者にとって「よく使われる翻訳が正解に近い」という価値観に基づくらしい。そういうものかあ、とも思ったが、大規模データを用いて「常識らしさ」を定量的に求めるという点は興味深い。
安直な思いつきだが、ウェブのデータが推論可能なかたちで整理されれば、意見の数を比較して信頼度を計ることもできそうだ。意見のポジショニング(対立意見の抽出とか)の研究でも推論可能な大規模データはすごく便利そうだ。
逆にいえば、べたな文章からもそういった構造を組み立てる言語処理の技術ってすごい。不勉強につき言語処理と知識工学の関わりは知らないが、言語や知識の本質を追求するうえで参考にし合える知見も多そうだ。
RDFがデータ構造であるということの意味をいままで理解できなかったが、ものごとを表現する共通の枠組み(AはBをCする)を定め、推論できるデータをどんどん積み上げられる仕組みと捉えると、意義がすこしわかる。