Google Japanが大規模日本語 n-gram データを公開
http://googlejapan.blogspot.com/2007/11/n-gram.html
これは、Googleじゃなければできない仕事。すばらしいです。
ちなみに、もろもろお金がかかって無料じゃなくて有償配布。
最低でも25000円はかかるみたいですね。
研究室が購入したらデータを見てみよう。
- 配布先
GSK2007-C Web日本語Nグラム第1版
http://www.gsk.or.jp/catalog/GSK2007-C/catalog.html