
大規模言語モデル入門
ここ数年、さまざまな機械学習のツールやライブラリが提供されるようになり、データさえ用意すれば誰でも機械学習を行うことができるようになりました。しかし、意味もわからずにプログラムを実行しても、その結果を正しく使うことはできません。その結果がどのようにして導かれたのかというアルゴリズムや理論的基礎を理解していることが必要です。
この研究会では、「大規模言語モデル入門」という書籍を輪講し、Transformerの理論的基礎と、質問応答、要約生成などの自然言語処理への応用を勉強します。