入門 自然言語処理

入門 自然言語処理

O'REILYから出された、実践的な自然言語処理の解説書。
一般的な学術書と異なり、PythonとNLTK(Natural Language Toolkit)を用いた例題、演習問題が豊富な点が特徴となっている。
自然言語処理については、完全に門外漢なのだけど、NLTKという、これほどまでに便利なツールキットが整備されていることに驚かされた。
NLTKには、各種コーパスや、語彙リスト、語義・同義語辞書などのデータセットと、それらを使いこなすための各種ツールなど、いたせりつくせりと言えるほど様々な情報と機能が備わっている。
このツールを十分に使いこなすための、初歩からの解説が丁寧にまとめられている。
原著が英語であるため、演習や解説も基本的には英語を対象としたものとなっているが、日本語処理についても1章分が割かれている。
自然言語処理と言うと、なかなか自分で最初から学習し、実際にプログラム開発に応用するにはハードルが高そうな印象があるが、NLTKという優れたツールを使えるということに勇気づけられる。
さっそく何か作ってみたくなった。