MacOSXにMecabインストール
fasttextを試すため、Mac OS X(Sierra)にMecabをインストールした。
pythonのバージョンは3.5.2
$ python --version Python 3.5.2 :: Anaconda 4.1.1 (x86_64)
手順
mecab-python3をインストール
pip install mecab-python3
mecab+ipadicをインストール
brew install mecab-ipadic
辞書(mecab-ipadic-NEologd)もインストールした。
多数のWeb上の言語資源から得た新語を追加することでカスタマイズした MeCab 用のシステム辞書
ネット上で流行した単語や慣用句やハッシュタグをエントリ化したデータ
実行
$ mecab -d /usr/local/lib/mecab/dic/mecab-ipadic-neologd ピコ太郎 ピコ太郎 名詞,固有名詞,人名,一般,*,*,ピコ太郎,ピコタロウ,ピコタロー
$ python Python 3.5.2 |Anaconda 4.1.1 (x86_64)| (default, Jul 2 2016, 17:52:12) [GCC 4.2.1 Compatible Apple LLVM 4.2 (clang-425.0.28)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> import MeCab >>> mecab = MeCab.Tagger() >>> print(mecab.parse("ピコ太郎")) ピコ太郎 名詞,固有名詞,人名,一般,*,*,ピコ太郎,ピコタロウ,ピコタロー EOS