
ITエンジニアのための強化学習理論入門
ここ数年、さまざまな機械学習のツールやライブラリが提供されるようになり、データさえ用意すれば誰でも機械学習を行うことができるようになりました。しかし、意味もわからずにプログラムを実行しても、その結果を正しく使うことはできません。その結果がどのようにして導かれたのかというアルゴリズムや理論的基礎を理解していることが必要です。
この研究会では、「ITエンジニアのための強化学習理論入門」という書籍を輪講し、ポリシー反復法、価値反復法、モンテカルロ法、DQNなどの理論的基礎を勉強します。