機械学習ライブラリ scikit-learn の馬鹿丁寧なe-learning


2016年 08月 18日

人工知能ブームで、機械学習やら深層学習の説明がネット上にはゴロゴロしている。
しかし、丁寧に、大学生はもちろん、高校生くらいなら十分に分かるように説明しているものは少ない。

data-school.pngそれで、日本語だけで探すのはあきらめて、英語で探すと色々見つかったが、その中で一番丁寧な説明をしていると思われるものを今回は紹介する。

data school というサイトには、データサイエンス関連の色々な情報が用意されている。

実際に見てみたのは、scikit-learn だけなのだが、たぶん他も丁寧hqdefault.jpgなのではないかと予想している。
scikit-learn は、pythonで機械学習をするとき非常に良く使う便利なライブラリなのだが、このビデオでは、機械学習のことも説明しながら、ライブラリの説明もしてくれるというものでるので、事前の準備は何もいらない。

scikit-learn ビデオは9本で、合計4時間もある。さらに、textからの機械学習の2時間40分の長い長いビデオが付録でついている。

それぞれのビデオには、対応した notebook がGitHub上に用意されている。
noteは、単なるメモではなく、ビデオで実演してくれる内容、プログラムが全て載っており、自分の
IPython上にnotebookのプログラムをコピペしながら実行することで簡単に確認(体感)できる。
説明は、これ以上ないほど細かいステップで行われるので、理解はとても容易だった。

説明がていねい過ぎて、考えを飛躍しないといけない箇所がないのが不満になるかも知れない。
これだけていねいに、ビデオおよび資料を用意するのは恐ろしく大変だと思う。LearningPython.gif

日本でも、色々な分野のビデオや解説書がこのくらいのていねいさで作られれば、誰でも容易に人工知能、機械学習を習得できると思うが、残念ながら日本では短いビデオ、薄い本であることが重視され、困った状態だ。
専門書は、1000ページあるのが普通という世界にならないものだろうか。
たとえば、右の“Learning Python”というPythonの入門書は、1600ページもある。
日本語版は版が古く、800ページしかない。もう英語版で読むしかないだろう。

なお、このビデオ教材の付録のtext処理のビデオは2時間40分ととても長いので、まだ見ていない。