強化学習研究会&自然言語データ分析ハッカソン 開催レポート

機械学習勉強法

こんにちは!Team AIです。先週の勉強会&ハッカソンの中から厳選して、当日のアジェンダを共有させていただきます。

強化学習研究会ー10/11(水)

インド人、大手ポータルサイト、大手IT企業の方々交え、
初心者にとってどうやって強化学習の実装を学んでいけば良いのか議論しました。小川さんから、非常にわかりやすいQ-Learningの解説もありました。
エージェントが、状態(S)から行動(A)を起こし、報酬(R)や罰則(P)を受けて学習を進めていく基本コンセプトをわかっている人は比較的多いとは思うのですが、
いざそれを実装するとなると思考停止になってしまいますよね?
結論は、まずは下記の小川さんのチュートリアルでOpen AI GymのCartPole(棒立て)にチャレンジし、徐々に複雑なものに適用すれば良いのではないかという結論になりました。ゲームAIは相当ハードルが高いです。
また、下記UCバークレーの強化学習シリーズでも語られている様に、まだビジネス上の問題解決に使われている技術ではないので、非常にエキサイティングで進化の速い領域であると同時に、初学者にとっての学習ロードマップが存在しないことも課題だと思いました。深層学習のCNNの様にビジネスアプリケーションが多数存在する技術ならそこから逆算して学べばいいのですが、強化学習は学習そのものが目的になりやすいので、Team AIとしても何とかしたいと思いました。
トピック:
コミュニティメンバー小川さんの強化学習実装チュートリアル(棒立て)
https://qiita.com/sugulu/items/bc7c70e6658f204f85f9
UCバークレーの強化学習ブートキャンプ ビデオコース(Aug 2017 ver.)
https://sites.google.com/view/deep-rl-bootcamp/lectures
強化学習実装チュートリアルシリーズ
https://medium.com/…/simple-reinforcement-learning-with-ten…
Open AI Gymの使い方チュートリアル
https://www.oreilly.com/…/introduction-to-reinforcement-lea…
PFNの強化学習ライブラリChainerRL
https://research.preferred.jp/2017/02/chainerrl/
Andrej Karpathy Blog (TeslaのAIディレクター)
http://karpathy.github.io/2016/05/31/rl/
Sutton教授の強化学習本(定番)
https://www.amazon.co.jp/%E5%BC%B7%E5%8C%96%E5%AD%A6%E7%BF%92-Richard-S-Sutton/dp/4627826613/ref=la_B004LSYBGG_1_1?s=books&ie=UTF8&qid=1507720936&sr=1-1
Chess AIの作り方チュートリアル
https://medium.freecodecamp.org/simple-chess-ai-step-by-ste…
強化学習の応用成功事例集
http://umichrl.pbworks.com/…/Successes%20of%20Reinforcement…
東大 高橋先生の本がすごい
メカ屋のための脳科学入門
https://goo.gl/S23Jyf

 

 

自然言語データ分析ハッカソンー10/14(土)

ロシア人、トルコ人、Finance勤務、開発会社、建築家、外資系、大学生の方々含め、グループワークでテキストデータの解析に挑戦しました。

トピック:

Kaggle Kernelの写経は初心者に良い!
CounterVectorizer => Naive Bayesで迷惑メール分類
分かち書き
頻出度分析
Word2Vec
FastText
線形回帰
XGBoost
特徴エンジニアリング

挑戦したデータ:

World News on Reddit
掲示板上のニュースデータ解析
https://www.kaggle.com/rootuser/worldnews-on-reddit

South Park Dialogue
アニメ作品台本のセリフデータから話者を特定
https://www.kaggle.com/tovarischsukhov/southparklines

Deep NLP
Chatbotと履歴書データの解析
https://www.kaggle.com/samdeeplearning/deepnlp

Python Questions from StackOverFlow
プログラミングQ&AサイトのPythonに関する質問分析
https://www.kaggle.com/stackoverflow/pythonquestions

Japanese English Bilingual Corpus(日本語と英語のWikipediaコーパス)
https://www.kaggle.com/tea…/japaneseenglish-bilingual-corpus