未来への投資なら。

犯罪予告検知のソフト開発へ=来年度予算で要求−通り魔事件受け増田総務相(時事通信) - Yahoo!ニュース
かなり非難囂々のこの件。今すぐ実用システムを作るって話ならそりゃあ無駄になりそうな気配がするけど、そうじゃないならどうなるか、想像してみる。
問題を簡単にするため*1に、ちゃんとした文章で書かれた犯罪予告を見つけることを考えてみよう。必要になりそうなのは、次のような技術要素。

この中で、前者のクローラは既にサーチエンジン各社*2が既に構築、運用してることから分かるように、そんな超絶に困難な課題ではない*3でしょう。
それに比べて、後者は非常に困難な課題。この中で、前段の形態素解析構文解析まではある程度は確立した技術はある。有名な実装としてはJumanやChaSen/MeCabRosettaのような形態素解析器、KNPやCaboChaなどの構文解析器がある。もちろん精度は100%ではないけど、かなりいい線まで行ってはいる。
問題は後段。自然言語の意味解析なんて、あちこちで研究は続けられているけどどこも発展途上で、汎用的に実用可能な意味解析器ってのは前人未踏。計算機科学をやってるヒトなら、見果てぬ夢のひとつだろうね。
ここで冒頭の話に戻る。もちろん、今更数億円投入したくらいでそんな意味解析器ができるはずはないけど、ちゃんとした研究機関に予算を付けて基礎研究を推進する、って話なら決して悪い話ではないように思う。予算に犯罪予防って名目が付いてたとしても、それでこの分野の研究が進めば、犯罪予防のみならず様々な分野に波及効果がある。先の見えない基礎研究はどうしても民間じゃやりづらいし、国費投入の意味はある。


秋葉原殺傷:書き込み検知技術開発へ 総務省が予算要求 - 毎日jp(毎日新聞)
といっても、どうも早期実用化目指すって話になってるみたいだから、上で述べたような方向には進んではいないみたい。残念。

*1:隠語とかスラングを考えないってこと。実はあまり難易度下がってはいない。

*2:と言ってもGoogleYahoo!くらいか

*3:同じ物を構築するのには資金力も技術力も相当要るには違いないけど、既に実現している人たちが居るってことは不可能ではない、と言うこと