読者です 読者をやめる 読者になる 読者になる

morris555's diary

高校生のブログです。

pythonで日本語形態素解析

python

はじめに

日本語形態素解析ってタイトルかっこいいww

今回はMeCabを使ってみました。

本題

まずは例を、、

>>> import MeCab
>>> m = MeCab.Tagger('-Ochasen')
>>> print m.parse("焼き芋落とすと思いきや!")
焼き芋	ヤキイモ	焼き芋	名詞-一般		
落とす	オトス	落とす	動詞-自立	五段・サ行	基本形
と	ト	と	助詞-格助詞-引用		
思い	オモイ	思う	動詞-自立	五段・ワ行促音便	連用形
き	キ	き	助動詞	文語・キ	基本形
や	ヤ	や	助詞-終助詞
!	!	!	記号-一般		
EOS

簡単に出来ました。。

簡単すぎてびっくりです。

(「焼き芋落とすと思いきや」に、特に意味はありませんww)

おわりに

キーワード抽出したり、いろいろやってみたいですね。

今日は、これだけです。

追記

>>> m = MeCab.Tagger('-Ochasen')

ここを、

>>> m = MeCab.Tagger('-Owakati')

にすると、

焼き芋 落とす と 思い き や ! 

こんな感じに読み易い(笑)

>>> m = MeCab.Tagger('-Oyomi')

これだと、、、

ヤキイモオトストオモイキヤ!

外国人風??

ってなります。