ページへ戻る
− Links
印刷
自然言語解析/CaboChaをpythonで使う
の編集 ::
NJF Wiki
xpwiki
:
自然言語解析
/
CaboChaをpythonで使う
の編集
# he8d5f70 の編集
ページ内容:
*実際の利用例 [#he8d5f70] 実際には例えば飲食店の口コミの解析で使ってみました。 まず形態素の頻度解析を行い、その上位の名詞について係り受け解析を行い、かかっている語の中から形容詞を抜き出してみました。 あるラーメン店でそれを行ってみた結果が以下の通りです。 ラーメン :やさしい :良い :なく :分厚い :無かっ :嬉しい :安い :硬い :おいしい :優しい :うまい :潔い :旨い スープ :熱い :おいしい :いい :茶色い :こい :薄い :高い :良い :うまい :柔かい :甘い 麺 :柔い :固い :面白い :淡い :おいしい :硬い :柔かい :堅い 卵 :無し :硬い :潔い :なく :良い テーブル :多い 豚骨 :薄い :おいしい :いい 上の結果から、とんこつで茶色いスープ、固めの麺でトッピングは玉子、値段は安めで優しい味、テーブル席が多めの店かなと予想できます。 実際の口コミを読むと、麺は「固くなく」という表現が多く、実は柔らかいことがわかりました。上の結果でも「柔らかい」もあり微妙なところです。他の部分はあっていました。 否定語などの扱いをどうするかをちゃんとすれば、ある程度印象のようなものが解析できそうです。 また料理は形容詞以外、例えば名詞(例:ボリュームがある)や副詞(例:こってり)、比喩表現などで説明することも多く、そういったものも解析できれば精度が上げられるかもしれません。 他の問題点として同じラーメンでも複数の主力メニューがあるとその印象が混じってしまう可能性があります。 対象となるのが何かを判断するには、各々の文がどういう構造かではなく、全体の文脈が必要となるので、この方法ではこの問題を解決するのは難しそうです。 係り受けや頻度解析からさらに精度を上げるには、プログラムに何らかの形で「意味」を理解させたりすることが必要かも知れません。
編集の要約:
Q & A 認証:
ページ更新時は次の質問にお答えください。(プレビュー時は必要ありません)
Q:
「大阪」の読みがな?(ひらがなで)
A:
お名前:
タイムスタンプを変更しない
テキスト整形のルールを表示する
[1]
Links list
(This host) = https://njf.jp
(This host)
/cms/modules/xpwiki/?cmd=edit&help=true&page=%E8%87%AA%E7%84%B6%E8%A8%80%E8%AA%9E%E8%A7%A3%E6%9E%90%2FCaboCha%E3%82%92python%E3%81%A7%E4%BD%BF%E3%81%86