本講義の目的は、データサイエンティストに必要なスキルの1つである大規模解析のためのITスキルを身につけることである。少量のデータであれば、Excelなどの表計算ソフトでもある程度の解析は可能である。しかし、数GB、数億レコードというデータは表計算ソフトで扱うことはできない。本講義では、大規模データを扱うための処理フレームワークについて学習する。