河原電子ビジネス専門学校は修学支援制度の認定校です。
文字サイズ
  • 標準
  • 拡大
背景色
音声読み上げについて

学科ブログ

SCHOOL BLOG
2021.01.22 ITイノベーション科・ITエンジニア科3年制 ブログ

【ITイノベーション科】Pythonで形態素解析

最近は、AIやプログラムを利用してネット上の書き込みを分析する仕組みがたくさん登場しています。
たとえば、その人の投稿を分析して、その人が今どのような心理状態であるかを分析したりするそうです。

では、ちょっとその世界を覗いてみましょう。


いきなりですが問題です。

以下の文はいくつの単語から成り立っていますか?

Plums and peaches are part of peaches.

はい、答えは7つです。英語が読めなくても単語数はわかりますよね。

では第2問。
次の文はいくつの単語から成り立っていますか?

すももももももももものうち

さあ、どうでしょうか?ちょっと難しいですね。
日本語って特に難しいんです。日本語の知識がない外国人には超難問だと思います。
ちなみに、この問題を正しく解決するためには全ての日本語が登録された辞書が必要です。

ではこれを解決するPythonのプログラムを紹介しましょう。

たったの4行です。
これで、こんなふうに表示されます。

このように、文章を分析して単語に区切って調べることを形態素解析といいます。
この分析結果から、単語のイメージだったり感情だったりを抽出していくことで様々なものづくりが可能になるのですね。

Pythonすごいね。