Team AGI kick off しました!(汎用人工知能勉強会)

BLOG
(English Follows)

壮大なチャレンジ

人類未踏の分野、汎用人工知能(A.G.I.)を本気で世に出そうという隔週の勉強会を8/22にキックオフしました。
東京五輪までにAGI搭載のヒューマノイドを市場に出す目標を持つ、Team AIメンバー、ロボットエンジニア伊藤と、Team AI代表石井がお届けします。
年内のシーズン1では、従来のアカデミックなアプローチではなく、あくまでビジネスの実用からスタートしたリーンスタートアップ的な発想で、”本物のAGIではないが、擬似AGI的なアウトプットができるプロダクト”の構築を目指します。
AGIプロトタイプVer.1の技術仕様と開発ロードマップを定義し、
参加者と議論を重ねながら大企業・スタートアップ・個人のチームメンバーを募り、Googleですらなし得てないAGI開発を東京のコミュニティの力で達成しようというチャレンジングなプロジェクトをキックオフします。
当日はAGIプレゼンテーションを行い、起業家、フリーランスエンジニア、国の研究機関、大学生、IT企業勤務、など幅広い方々と議論を重ねました。

 

 

 

トピック

Passion : 渋谷発世界に発信するAGIを創る!
人間を機能別に分解しそれぞれのモジュールを組み合わせる
他のAGIプロジェクトとの違い => ビジネスプロダクトを創る
スケジュール: 隔週イベントで12月まで
短期ゴール;AGI技術仕様/ロードマップ 定義
協業者募集;研究者、哲学者、開発者、デザイナー、クリエイター、ライター、プロモーター
メディアへの情報発信
大企業からのスポンサー募集
各技術要素を精査
既存の技術要素を最大限活用
世界でもAGIに挑戦する企業は数少ない => DeepMind/OpenAI/GoodAI
香港や欧州のAGI企業とは提携できそう
主体性・好奇心・動機を実装する必要あり
赤ちゃんレベルのAGIをまず作り、たまごっちの様に擬似的に成長させる

 

会場から質問

Narrow AI vs AGIの違い
そもそもなぜAGI創るの?=>東京五輪に活用したいという伊藤さんの情熱
機能別Narrow AIをコントロールする統合AIが必要では?
AGIに愛情を実装することは可能か?
メタ認知の実装は可能か?
そもそも生命体の定義は?行動に落とし込むとどういう意味?
自我の定義とは?
潜在意識の実装は可能か?
シンボルグラウンディング問題は解決されつつある
クオリア(内面的な現象理解)は実装可能か?

 

次のステップ

具体的な仕様定義
具体的なロードマップ定義
足りないリソース定義 & 対応策協議

 

参考:A.G.I.のサブカテゴリ

<科学系>
・脳神経科学(システム神経科学)
・認知科学
・ゲーム理論(RPG対戦ゲーム、囲碁・将棋・チェス)
・統計学(一般的な統計分析手法、ベイズ推定など)
・機械学習、深層学習、強化学習、統計数学(現在TeamAIで開催)
<技術系>
画像認識(Open CV)
自然言語認識、DNN
音声認識(特にドコモAPIを使いたい)
音声合成(ボカロだけでなく人間の声優も必要)
3D空間認識(LIDAR)
ゲーム/アニメーション開発(RPG開発)
SNSアプリ開発(LINE,Facebook,iOS,Android)
IoT(組み込み基盤、通信、クラウド)
AR/VR/モーションキャプチャー
HPC(ハイパフォーマンスコンピューター)
エッジコンピューティング(クラウドの前のFPGA基板で高速処理を行う)
GPU(NVIDIA)プログラミング※各大手の協力打診中
Block Chain(Ethereum基盤)
<言語>
Ruby ,PHP,HTML,JSON
C#,Java,Python
Caffe,Chainer,TensorFlow,DQN,CUDA,OpenCV,Unity,Ubatus
Google API(AWS),Microsoft Azure(ML),Ethereum
<OS>
Linux(Ubuntu,Rapsbian),Windows10,Android,iOS
<ハードウェア>
WEBカメラ、OculusLift/Vive、MS HOLOLENS、マイク、スピーカー、モーションセンサー、Arduino/Raspberry Pi、GPU専用サーバー、AndroidスマホはAGIのデバイスとして必要。人間の視覚、聴覚、触覚にあたる部分。
さらにHPCが必要。深層学習の大きなプログラムを作り出すと、普通のPCでは動かなりので最低50万円くらいの専用サーバーが必要です。

 

>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>

 

Mission impossible

We kicked off artificial general intelligence study group on 22nd Aug.
As you know this is super challenging goal. But we are pretty serious.
Hosts are Hiroyuki Ito & Daisuke Ishii. Hiro has a passion to ship AGI humanoid for 2020 Tokyo Olympics. Dai is a founder of Team AI.
Team AI has 1900 community members in machine learning field.
In season one which continues to Dec, we focus on lean startup methodology and define AGI as MVP(minimum viable product)
With defining our AGI ver 1.0 specs and roadmap, we call collaborator’s help from academia and industry. We challenge mission impossible which even Google can not achieve. We use the power of our community.
On kick-off day, we invite startups CEO, freelance developer, researcher from governmental institute , university student, developer at IT companies.

 

Topic

Passion : We build AGI from Tokyo to the world
We separate each function of human brain. We use technical module for each function.
We are business people. We focus on product. Different from academia approach.
This is bi-weekly events until Dec 2017.
Short term goal; Define AGI spec and roadmap.
Calling collaborators ; researcher, philosopher, developer, designer, creator, writer, promotor
Media strategy
Calling sponsors (maybe NVIDIA and Microsoft)
Double check each technical element
We use existing technology(e.g. API)  as much as possible.  We do not re-invent wheel.
Even in global market, those who challenge AGI are few. =>DeepMind/OpenAI/GoodAI
We have to install curiosity and motivation.
We should create baby level AGI first. And bring it up.

 

Questions from audience

What is the difference between Narrow AI and AGI.
Why we create AGI? => To attend guests at Tokyo Olympics.
We need “control (or boss) AI” to manage many narrow AIs in each function.
Can we install love in AGI?
Can we install meta-recognition in AGI?
What is the definition of creature? Which kinds of action should AGI take?
What is the definition of self-awareness?
Can we install subconcious in AGI?
Do we still have symbol grounding problem?

 

Next steps

Define technical specs
Define development roadmap
Define missing resources and come up with countermeasure

 

Appendix; Implemented function

 

The functions that the brain (and related organs) can do are the following items.

① Human senses

Visual, auditory and tactile are first implemented (taste and smell are not subject to this time)

Example) An object answered on the web camera answers something

Read emotions of human facial expressions

Read and understand sentences (Read text data, not paper for the moment)

Understand the human language received by the microphone.

In response to the touch sensor, output is output.

 

② Dialogue with humans

Spoken dialogue in Japanese & English

Example) Daily conversation (chat mode), customer service (business mode)

 

③ general knowledge, search, guess

Dictionary · Knowledge base, guess by machine learning

Example) An inquiry search, registration / search into a specialized dictionary, answer of statistical guess

 

④ History memory · Self learning

Past dialogue memory and learning from action

Example) Remember conversation name and conversation. Learning of the other ‘s taste.

 

➄ Emotions · Personality

Inborn personality, personality formation by learning and experience, inflection of emotion

Example) Personalities and emotional habits can be registered for each AGI.

 

⑥ Ethics view

Judgment of right and wrong, social rule

Example) Understanding and responding to NG words, topics. Prohibition of religious / racial discrimination.

 

※ It is not AI which is specialized for specific purpose · business use.

Aiming image is the brain of a human child. Learn more and more basic knowledge and function,

We will create the base of general purpose artificial intelligence AGI that may grow infinitely.

 

Required Knowledge / Element Technology

 

<Scientific system>

  • Neuroscience of the Neuroscience (System Neuroscience)
  • Cognitive science
  • Game theory (RPG battle game, Go · Shogi · Chess)
  • Statistics (general statistical analysis method, Bayes estimation, etc.)
  • Machine learning, depth learning, reinforcement learning, statistical mathematics (currently held at TeamAI)

 

<Technology system>

Image recognition (Open CV)

  • Natural language recognition, DNN
  • Speech recognition (especially using docomo API)
  • Speech synthesis (not only Vocalo but also human voice actor is necessary)

3D space recognition (LIDAR)

  • Game / animation development (RPG development)
  • SNS application development (LINE, Facebook, iOS, Android)
  • IoT (embedded base, communication, cloud)
  • AR / VR / motion capture
  • HPC (high performance computer)
  • Edge computing (Perform high-speed processing on the FPGA board before the cloud)
  • GPU (NVIDIA CUDA) programming ※ Each cooperative consultation in progress
  • Block Chain (Ethereum basis)

 

<Language>

Ruby, PHP, HTML, JSON

C #, Java, Python

Caffe, Chainer, TensorFlow, DQN, CUDA, OpenCV, Unity, Ubatus

Google API (AWS), Microsoft Azure (ML), Ethereum

 

<OS>

Linux (Ubuntu, Rapsbian), Windows 10, Android, iOS

 

<Hardware>

WEB camera, Oculus Lift / Vive, MS HOLOLENS, microphone, speaker, motion sensor, Arduino / Raspberry Pi, GPU dedicated server, Android smartphone