JAWSDAYS 2014 で EMR について話してきました。

2014年3月15日にベルサール新宿グランドで開催された JAWSDAYS 2014 で EMR について話してきました。
立ち見がでるほどたくさんの方に聞いて頂きうれしい限りです。

EMR とは AWS が提供するサービスの 1 つで、ビッグデータのバッチ処理によく使われる Hadoop を非常に数クリックで使えるようにしたものです。
EMR や Hadoop や Mahout(Hadoop 上に実装された機械学習ライブラリ)を試そうとしたけど、とっかかりがなくて困ったという方にはよいかもしれません。
画像を扱っているので視覚的にも面白いかもしれません。

Mahout の K-Means を使ってパッチ画像をクラスタリングするために「どのようなプログラムを作り」「どのように EMR を操作すればよいか」が分かるようになっています。
画像認識の前処理としてクラスタリングを行い、特徴の表現を扱いやすいものへ変換することはよくありますので、画像処理をやってみようかなという方にもよいかもしれません。

スライドの中で使っているプログラムは「こちら」です。プログラムが使っている元データは、著作権的に問題がなく、容量が小さなものに置き換えました。

JAWSDAYS 2014 ACEに聞け! EMR編 from Youhei Yamaguchi

コメントをどうぞ