ページへ戻る
− Links
印刷
自然言語解析/MeCabをpythonで使う
の編集 ::
NJF Wiki
xpwiki
:
自然言語解析
/
MeCabをpythonで使う
の編集
# ned074dc の編集
ページ内容:
*MeCabのインストール [#ned074dc] MeCabは日本語の文章を単語に分解してそれぞれの品詞や活用形を表示してくれる形態素解析のソフト。 [[MeCabについて詳しくはこちらを参考のこと。:http://taku910.github.io/mecab/]] 自然言語解析をするならとりあえず入れておいた方が良い。 インストルールは上記サイトにもあるが、最新ソースをダウンロードしてきて、本体は tar zxfv mecab-X.X.tar.gz cd mecab-X.X ./configure --enable-utf8-only make make check sudo make install 辞書は tar zxfv mecab-ipadic-2.7.0-xxxx cd mecab-ipadic-2.7.0-xxxx ./configure --with-charset=utf8 make make check sudo make install とする。ここで文字コードをutf8に固定している。しなくても良いのだが、utf8が最近はいろいろなテキストのデファクトスタンダードなコードになりつつあるので、固定しておいて入力データを変換した方がMeCabで見分けて解析するより何かと楽なのでそうしている。 インストールがうまくいっていれば、 mecab -v でバージョンが表示される。 実際にテストで解析したければ、標準入力などでテキストを与える。 $ echo "庭には二羽鶏がいる" | mecab 庭 名詞,一般,*,*,*,*,庭,ニワ,ニワ に 助詞,格助詞,一般,*,*,*,に,ニ,ニ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 二 名詞,数,*,*,*,*,二,ニ,ニ 羽 名詞,接尾,助数詞,*,*,*,羽,ワ,ワ 鶏 名詞,一般,*,*,*,*,鶏,ニワトリ,ニワトリ が 助詞,格助詞,一般,*,*,*,が,ガ,ガ いる 動詞,自立,*,*,一段,基本形,いる,イル,イル EOS
編集の要約:
Q & A 認証:
ページ更新時は次の質問にお答えください。(プレビュー時は必要ありません)
Q:
「名古屋」の読みがな?(ひらがなで)
A:
お名前:
タイムスタンプを変更しない
テキスト整形のルールを表示する
[1]
Links list
(This host) = https://njf.jp
(This host)
/cms/modules/xpwiki/?cmd=edit&help=true&page=%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E8%A7%A3%E6%9E%90%2FMeCab%E3%82%92python%E3%81%A7%E4%BD%BF%E3%81%86