シラバス

科目名バイオインフォマティクスのデータサイエンス [DS2]

授業概要

学部・研究科
総合政策・環境情報学部
登録番号
44486
科目ソート
B3217
科目名
バイオインフォマティクスのデータサイエンス
分野
基盤科目-データサイエンス科目-データサイエンス2
単位
2単位
開講年度・学期
2022 秋学期
K-Number
FPE-CO-03022-221-88
開講年度・学期
2022 秋学期
曜日・時限
火 3限
授業教員名
鈴木 治夫
実施形態
オンライン(ライブ)
授業で使う言語
日本語
開講場所
その他
授業形態
※「授業形態」と「能動的学修形式」の対応についてはこちらをご覧ください。
講義, 演習, 実験・実習・実技, 遠隔あり
GIGAサティフィケート対象
非対象

詳細

講義概要

この授業では、複雑で大規模なデータセットから情報を探索・抽出するためにバイオインフォマティクス研究者が使用するスキルに焦点を当てる。こうしたデータスキルを学ぶことで、どんなバイオインフォマティクス・データでも(どんなフォーマットの、どんなサイズのファイルでも)扱うことができるようになり、生物学的意味を引き出すためにデータの探究を始めることができる。

授業全体を通して、ロバストで再現性のある手法で研究することの重要性を強調する。再現性とは、自分の研究が他の研究者によって追試されて同じ結果が得られることを意味する。そのためには、作業手順を十分に文書化し、コードとデータを全て公開しなければならない。解析ワークフローを別のマシンで実行して異なる結果が得られた場合、それはロバストでも再現可能でもない。このテーマは、講義の中で繰り返し出てくる。

この授業では、表形式のプレーンテキストデータ形式を主に扱う。表(テーブル)データは、データスキルを磨くのに最適である。将来、他のデータを解析することが目標であっても、表形式のデータは学習に役立つ優れたサンプルデータとなる。表形式データを扱うために必要なテキスト処理のスキルを身につけることは、他のデータ型を扱う際にも応用できる。このように、多様な分野の研究に役立つ計算ツールとデータスキルを学ぶことができる。

あらゆる分野の研究者が、バイオインフォマティクス・データスキルを応用して、独自の分野(生物学、言語、音楽、新型コロナウイルス感染症のパンデミックに寄与した社会的経済的要因など)の問題解決に取り組む。