Deep “Reinforcement” Learning for Games 講座 中間報告

現在,松尾研究室が主催している深層強化学習の夏期講習を受講しています.

Reinforcement Cource

 

松尾研究室が主催している夏期講習は,

・Deep Learning自然言語処理講座

・Deep Reinforcement Learning講座

の2つがあったのですが,私自身,言語処理の研究室に所属しているため,

・自然言語処理の内容は(おそらく)知っている内容が多いであろうこと

・強化学習は今まであまり触れる機会がなかったこと

の2点を加味し,Deep Reinforcement Learning講座を受講することにしました.

 

正直,夏休み,東京大学には片道1時間近くかかることから,ちょっと腰が重かったのですが,本講義を受けてみて大正解.

本当に,もう,素晴らしい講義ですね.(まだ中間ですが)

 

今まで,強化学習は,ゲームAI等ではよく聞くが,身近に利用できる例は多くないと考えていたのですが,大きく間違っておりました.

日常のあらゆるところに強化学習的な考えが必要とされる部分が溢れており,人生ですら強化学習的な考え方が必要とされるということを本講義を通じて痛感いたしました.

 

講師の大澤先生が「みなさんには,強化学習的な考え方を身に着けてもらいたい」と,初回,おっしゃっていたのですが,はじめは意味がよくわからずポカーンとなっておりました.

ですが,例えば,人生は,未知へのチャレンジという名の探索であり,努力して一定時間立って初めて,報酬(努力が報われたか否か)が獲得できる.

その過程を繰り返し,人間(エージェント)が行動決定するための最適な方策を見つけ出す.

どうです?なんだか,強化学習と人生がリンクした気がしませんか?

 

講義では,強化学習の基本的な話(マルコフ決定過程やベルマン方程式など)はもちろんですが,講義を受ける過程で得られる強化学習の本質的な部分を学ぶ上で非常に最適な講義だと思います.

 

残り3回の講義を受けて,またレビューさせてもらいますが,もし悩んでる方がいましたら,次回以降ぜひ受けてみることをおすすめします.