1: 2016-05-27 (金) 11:24:05 njf[6] [7] [8] | 2: 2016-05-27 (金) 11:57:19 njf[6] [9] [10] | ||
---|---|---|---|
Line 88: | Line 88: | ||
つまり、「surface」にもとの単語が入り、「feature」に品詞や活用などがコンマ区切りのCSVのテキストで入っている。 | つまり、「surface」にもとの単語が入り、「feature」に品詞や活用などがコンマ区切りのCSVのテキストで入っている。 | ||
- | featureにどういう物が入ってくるかは、[[形態素解析ツールの品詞体系:http://www.unixuser.org/~euske/doc/postag/]]を参照のこと。 | + | featureは、「品詞,品詞細分類1,品詞細分類2,品詞細分類3,活用型,活用形,原形,読み,発音」と入っている。 |
+ | 品詞細分類については[[形態素解析ツールの品詞体系:http://www.unixuser.org/~euske/doc/postag/]]を参照のこと。 | ||
+ | |||
+ | |||
+ | |||
+ | ここでMeCabへの入力はstr型で無くてはならない。 | ||
+ | |||
+ | >>> res = meCabTagger.parseToNode(u"庭には二羽鶏がいる") | ||
+ | Traceback (most recent call last): | ||
+ | File "<stdin>", line 1, in <module> | ||
+ | File "/Library/Python/2.7/site-packages/MeCab.py", line 282, in parseToNode | ||
+ | def parseToNode(self, *args): return _MeCab.Tagger_parseToNode(self, *args) | ||
+ | TypeError: in method 'Tagger_parseToNode', argument 2 of type 'char const *' |
(This host) = https://njf.jp