
14717件見つかりました。
本講義ではコンピュータサイエンスやデータサイエンスの根幹をなすアルゴリ ズムについて、様々な側面からご紹介をします。プログラミングは行いません。
本講義ではコンピュータサイエンスやデータサイエンスの根幹をなすアルゴリ ズムについて、様々な側面からご紹介をします。プログラミングは行いません。
本講義ではコンピュータサイエンスやデータサイエンスの根幹をなすアルゴリ ズムについて、様々な側面からご紹介をします。プログラミングは行いません。
This class discusses how several phenomena could be formulated in mathematical modeling. Each lecture introduces one phenomenon and a mathematical model that describes the phenomenon. This series of lectures firstly addresses modeling with differential equations, and in the later part, mathematical analysis of perceptual phenomena in human psychology are also discussed.
This class discusses how several phenomena could be formulated in mathematical modeling. Each lecture introduces one phenomenon and a mathematical model that describes the phenomenon. This series of lectures firstly addresses modeling with differential equations, and in the later part, mathematical analysis of perceptual phenomena in human psychology are also discussed.
総合政策学・環境情報学を含む全分野の研究者が、バイオインフォマティクス・データスキル (V Buffalo, 2015) を応用して、多様な分野(生命科学、言語、音楽、デザインなど)の問題解決に取り組む。
この授業では、複雑で大規模なデータセットから情報を探索・抽出するためにバイオインフォマティクス研究者が使用するスキルに焦点を当てる。こうしたデータスキルを学ぶことで、どんなデータでも(どんなフォーマットの、どんなサイズのファイルでも)扱うことができるようになり、意味を引き出すためにデータの探究を始めることができる。
授業全体を通して、ロバストで再現性のある方法で研究することの重要性を強調する。再現性とは、自分の研究が他の研究者によって追試されて同じ結果が得られることを意味する。そのためには、作業手順を十分に文書化し、コードとデータを全て公開しなければならない。解析ワークフローを別のマシンで実行して異なる結果が得られた場合、それはロバストでも再現可能でもない。このテーマは、講義の中で繰り返し出てくる。
この授業では、表形式のプレーンテキストデータ形式を主に扱う。表(テーブル)データは、データスキルを磨くのに最適である。将来、他のデータを解析することが目標であっても、表形式のデータは学習に役立つ優れたサンプルデータとなる。表形式データを扱うために必要なテキスト処理のスキルを身につけることは、他のデータ型を扱う際にも応用できる。このように、多様な分野の研究に役立つ計算ツールとデータスキルを学ぶことができる。
The aim of this course is to introduce the basics of medical and health data science, data collection, data management, data analysis and biostatistics to better comprehend medical literature and publications. By the end of the course, skills and methodology for basic statistical analysis needed for medical publication will be acquired.
The aim of this course is to introduce the basics of medical and health data science, data collection, data management, data analysis and biostatistics to better comprehend medical literature and publications. By the end of the course, skills and methodology for basic statistical analysis needed for medical publication will be acquired.
総合政策学・環境情報学を含む全分野の研究者が、配列解析の方法を応用して、独自の分野(生物学、言語、写本、音楽など)の問題解決に取り組む。
配列解析は、ゲノム(DNA)やタンパク質(アミノ酸)などを表す様々なテキスト配列を分析する幅広い分野である。生物配列解析には、遺伝子機能の予測、系統関係の推定、祖先配列の再構築などが含まれる (Coghlan, 2017; Hall, 2017)。例えば、ウイルス配列データから推定された系統樹は、ウイルスの発生、地理的な拡散、適応的変異を推定するために利用できる(Martin et al., 2021)。配列解析の方法は、生物学の分野のみにとどまらず、写本の系譜(Barbrook et al, 1998)や音楽の類似性評価 (Savage et al., 2018) などにも使用されている。このように、配列データ解析に必要なテキスト処理スキルは、他の分野のデータ解析にも適用できる。
この科目では、配列データの解析に使用される主要なツールとデータベースを紹介し、それらを組み合わせて生物学的な問いに取り組む方法を説明する。
配列解析は、ゲノム(DNA)やタンパク質(アミノ酸)などを表す様々なテキスト配列を分析する幅広い分野である。生物配列解析には、ゲノム構造の決定、タンパク質コード領域(遺伝子)の同定、遺伝子機能の予測、系統関係の推定、祖先配列の再構築などが含まれる (Coghlan, 2011; Hall, 2017)。最近の研究は、ゲノム解析と系統解析により新型コロナウイルスの拡散と進化を追跡できる可能性を示した ([https://nextstrain.org/])。配列解析の手法は、生物学の分野のみにとどまらず、写本の系譜(Barbrook et al, 1998)や音楽の類似性評価 (Savage et al., 2018) などにも使用されてきた。このように、配列データ解析に必要なテキスト処理スキルは、他の分野のデータ解析にも適用できる。
この科目では、配列データの解析に使用される主要なツールとデータベースを紹介し、それらを組み合わせて生物学的な問いに取り組む方法を説明する。解析の例として、公共データベースからのタンパク質やDNA配列の取得、DNA配列の統計解析(長さ、GC含量、連続塩基組成、塩基組成の局所変動)、ペアワイズ配列アラインメント(ドット・プロット、グローバル配列アラインメント、ローカル配列アラインメント)、多重配列アライメント、系統推定などが含まれる。
あらゆる分野の学生が、配列解析手法を応用して、独自の分野(生物学、言語、写本、音楽など)の問題解決に取り組む。
Sequence analysis is a broad field, covering any kinds of analyses of textual sequences; e.g. those representing genomes (DNA) and proteins (amino acids). The biological sequence analyses include determining genome structures, identifying protein-coding regions (genes), predicting gene function, inferring phylogenetic relationships, and ancestral reconstruction (Coghlan, 2011; Hall, 2017). Recent studies showed that genomics and phylogenetics can track spread and evolution of novel coronavirus ([https://nextstrain.org/]). The sequence analysis methods have been used not only in the field of biology, but also in genealogy of manuscripts (Barbrook et al., 1998) and quantitative evaluation of melodic similarity (Savage et al., 2018). Thus, text-processing skills necessary to analyze sequence data can be applied to the analysis of data in other fields.
This course will provide the introduction to the main tools and databases used in the analysis of sequence data and explains how these can be used together to answer biological questions. Examples of analysis include retrieving DNA and protein sequences from public databases, DNA sequence statistics (length, GC content, DNA words, and local variation in base composition), pairwise sequence alignment (dotplot, global sequence alignment, and local sequence alignment), multiple sequence alignment, and phylogenetic inference, etc.
Students from all disciplines will use the sequence analysis methods to tackle problems in their fields (biology, language, manuscript, music, etc.).
The aim of this course is to introduce the basics of medical and health data science, data collection, data management, data analysis and biostatistics to better comprehend medical literature and publications. By the end of the course, skills and methodology for basic statistical analysis needed for medical publication will be acquired.
近年,バイオ統計や空間統計などの自然科学分野のみならず,マーケティングや政策分析,計量経済学などの社会科学分野でもベイズ・アプローチが着目されている. この授業では,古典統計学の基礎的な知識を前提に,ベイズ統計学の基礎と応用について扱う.R言語などによる演習も行う予定である.マルコフ連鎖モンテカルロ法,経験ベイズと階層ベイズ,回帰と相関に関するベイズ推測,ベイズ計量経済学などを扱いたいと考えている
この授業では、統計モデリングの基礎と応用を扱う。具体的には、線形回帰モデル、一般化線形回帰モデル、一般化線形混合モデルなどについての理解を深めることを目的とする。
統計モデリングを本格的に習得し、データサイエンティストとして活躍するために必要なスキルを習得する。演習では、フリーソフトのRを主に用いる。
近年、経済学・ファイナンス・医学・心理学・マーケティングなどの様々な分野においてベイズ統計学が着目されている。本講義では古典統計学の基本から始め、ベイズ統計学の基礎であるベイズの定理、ベイズ推論、数値解析法であるマルコフ連鎖モンテカルロ法、ベイズ統計学におけるモデル選択などについて説明する。講義中ではPythonを用いた演習を取り入れる予定である。
この授業では、統計モデリングの基礎と応用を扱う。具体的には、線形回帰モデル、一般化線形回帰モデル、一般化線形混合モデルなどについての理解を深めることを目的とする。
統計モデリングを本格的に習得し、データサイエンティストとして活躍するために必要なスキルを習得する。演習では、フリーソフトのRを主に用いる。
近年,バイオ統計や空間統計などの自然科学分野のみならず,マーケティングや政策分析,計量経済学などの社会科学分野でもベイズ・アプローチが着目されている. この授業では,古典統計学の基礎的な知識を前提に,ベイズ統計学の基礎と応用について扱う.R言語などによる演習も行う予定である.マルコフ連鎖モンテカルロ法,経験ベイズと階層ベイズ,回帰と相関に関するベイズ推測,ベイズ計量経済学などを扱いたいと考えている
地球惑星科学における諸現象を題材として、それに必要な数学を演習形式で講義する。地球惑星科学は宇宙惑星、大気海洋、地震火山、岩石鉱物、地質地球史の大きく5分野から構成されている。どの分野も地球に暮らす我々に身近な学問であり、その内容は初等・中等教育でも扱われている。これらの内容の多くは物理や化学で定式化された方程式に従っているため、この方程式を解くための数学を修得すれば、より深く内容を理解することができる。そこで、本講義では下記に計画する題材を基に、地球惑星科学の具体例に提示とその具体例に必要な数学演習をセットとした構成とした。
シャノンの情報理論と関連する話題について講義する. 具体的には「情報の量」,「情報の符号化」などに関して数学モデルを考え, その基礎理論を解説する. 伝送や記録においては, データ量をできるだけ減らしたい. 一方で, 通信においては, 伝送エラーの可能性があり, 伝送誤りをできるだけ小さくするための符号化が必要となる. これらの課題に対する基本的な考え方と方法を考察する.
情報理論は情報の表現と伝達に関する基礎理論である. 代表的な応用例としては, データ圧縮, ビット誤り検出・訂正, 暗号などがある. また機械学習アルゴリズムなどにおいても, 情報理論は重要な役割を果たす.
計算機には「ハード」と「ソフト」の側面があるが, この講義ではその前提となる「理論」を扱う. つまり実装上の制約を考慮せず, 理論上の最適化問題を考察する.
普段何気なく使っている「情報」の定量的な扱いを学び, 情報理論を基盤とする技術の理解を深めることも講義の目標である.
配列解析は、ゲノム(DNA)やタンパク質(アミノ酸)などを表す様々なテキスト配列を分析する幅広い分野である。生物配列解析には、ゲノム構造の決定、タンパク質コード領域(遺伝子)の同定、遺伝子機能の予測、系統関係の推定、祖先配列の再構築などが含まれる (Coghlan, 2011; Hall, 2017)。最近の研究は、ゲノム解析と系統解析により新型コロナウイルスの拡散と進化を追跡できる可能性を示した ([https://nextstrain.org/])。配列解析の手法は、生物学の分野のみにとどまらず、写本の系譜(Barbrook et al, 1998)や音楽の類似性評価 (Savage et al., 2018) などにも使用されてきた。このように、配列データ解析に必要なテキスト処理スキルは、他の分野のデータ解析にも適用できる。
この科目では、配列データの解析に使用される主要なツールとデータベースを紹介し、それらを組み合わせて生物学的な問いに取り組む方法を説明する。解析の例として、公共データベースからのタンパク質やDNA配列の取得、DNA配列の統計解析(長さ、GC含量、連続塩基組成、塩基組成の局所変動)、ペアワイズ配列アラインメント(ドット・プロット、グローバル配列アラインメント、ローカル配列アラインメント)、多重配列アライメント、系統推定などが含まれる。
あらゆる分野の学生が、配列解析手法を応用して、独自の分野(生物学、言語、写本、音楽など)の問題解決に取り組む。
この授業では、複雑で大規模なデータセットから情報を探索・抽出するためにバイオインフォマティクス研究者が使用するスキルに焦点を当てる。こうしたデータスキルを学ぶことで、どんなバイオインフォマティクス・データでも(どんなフォーマットの、どんなサイズのファイルでも)扱うことができるようになり、生物学的意味を引き出すためにデータの探究を始めることができる。
授業全体を通して、ロバストで再現性のある手法で研究することの重要性を強調する。再現性とは、自分の研究が他の研究者によって追試されて同じ結果が得られることを意味する。そのためには、作業手順を十分に文書化し、コードとデータを全て公開しなければならない。解析ワークフローを別のマシンで実行して異なる結果が得られた場合、それはロバストでも再現可能でもない。このテーマは、講義の中で繰り返し出てくる。
この授業では、表形式のプレーンテキストデータ形式を主に扱う。表(テーブル)データは、データスキルを磨くのに最適である。将来、他のデータを解析することが目標であっても、表形式のデータは学習に役立つ優れたサンプルデータとなる。表形式データを扱うために必要なテキスト処理のスキルを身につけることは、他のデータ型を扱う際にも応用できる。このように、多様な分野の研究に役立つ計算ツールとデータスキルを学ぶことができる。
あらゆる分野の研究者が、バイオインフォマティクス・データスキルを応用して、独自の分野(生物学、言語、音楽、新型コロナウイルス感染症のパンデミックに寄与した社会的経済的要因など)の問題解決に取り組む。
総合政策学・環境情報学を含む全分野の研究者が、バイオインフォマティクス・データスキル (V Buffalo, 2015) を応用して、多様な分野(生命科学、言語、音楽、デザインなど)の問題解決に取り組む。
この授業では、複雑で大規模なデータセットから情報を探索・抽出するためにバイオインフォマティクス研究者が使用するスキルに焦点を当てる。こうしたデータスキルを学ぶことで、どんなデータでも(どんなフォーマットの、どんなサイズのファイルでも)扱うことができるようになり、意味を引き出すためにデータの探究を始めることができる。
授業全体を通して、ロバストで再現性のある方法で研究することの重要性を強調する。再現性とは、自分の研究が他の研究者によって追試されて同じ結果が得られることを意味する。そのためには、作業手順を十分に文書化し、コードとデータを全て公開しなければならない。解析ワークフローを別のマシンで実行して異なる結果が得られた場合、それはロバストでも再現可能でもない。このテーマは、講義の中で繰り返し出てくる。
この授業では、表形式のプレーンテキストデータ形式を主に扱う。表(テーブル)データは、データスキルを磨くのに最適である。将来、他のデータを解析することが目標であっても、表形式のデータは学習に役立つ優れたサンプルデータとなる。表形式データを扱うために必要なテキスト処理のスキルを身につけることは、他のデータ型を扱う際にも応用できる。このように、多様な分野の研究に役立つ計算ツールとデータスキルを学ぶことができる。
配列解析は、ゲノム(DNA)やタンパク質(アミノ酸)などを表す様々なテキスト配列を分析する幅広い分野である。生物配列解析には、ゲノム構造の決定、タンパク質コード領域(遺伝子)の同定、遺伝子機能の予測、系統関係の推定、祖先配列の再構築などが含まれる (Coghlan, 2011; Hall, 2017)。最近の研究は、ゲノム解析と系統解析により新型コロナウイルスの拡散と進化を追跡できる可能性を示した ([https://nextstrain.org/])。配列解析の手法は、生物学の分野のみにとどまらず、写本の系譜(Barbrook et al, 1998)や音楽の類似性評価 (Savage et al., 2018) などにも使用されてきた。このように、配列データ解析に必要なテキスト処理スキルは、他の分野のデータ解析にも適用できる。
この科目では、配列データの解析に使用される主要なツールとデータベースを紹介し、それらを組み合わせて生物学的な問いに取り組む方法を説明する。解析の例として、公共データベースからのタンパク質やDNA配列の取得、DNA配列の統計解析(長さ、GC含量、連続塩基組成、塩基組成の局所変動)、ペアワイズ配列アラインメント(ドット・プロット、グローバル配列アラインメント、ローカル配列アラインメント)、多重配列アライメント、系統推定などが含まれる。
あらゆる分野の学生が、配列解析手法を応用して、独自の分野(生物学、言語、写本、音楽など)の問題解決に取り組む。
Sequence analysis is a broad field, covering any kinds of analyses of textual sequences; e.g. those representing genomes (DNA) and proteins (amino acids). The biological sequence analyses include determining genome structures, identifying protein-coding regions (genes), predicting gene function, inferring phylogenetic relationships, and ancestral reconstruction (Coghlan, 2011; Hall, 2017). Recent studies showed that genomics and phylogenetics can track spread and evolution of novel coronavirus ([https://nextstrain.org/]). The sequence analysis methods have been used not only in the field of biology, but also in genealogy of manuscripts (Barbrook et al., 1998) and quantitative evaluation of melodic similarity (Savage et al., 2018). Thus, text-processing skills necessary to analyze sequence data can be applied to the analysis of data in other fields.
This course will provide the introduction to the main tools and databases used in the analysis of sequence data and explains how these can be used together to answer biological questions. Examples of analysis include retrieving DNA and protein sequences from public databases, DNA sequence statistics (length, GC content, DNA words, and local variation in base composition), pairwise sequence alignment (dotplot, global sequence alignment, and local sequence alignment), multiple sequence alignment, and phylogenetic inference, etc.
Students from all disciplines will use the sequence analysis methods to tackle problems in their fields (biology, language, manuscript, music, etc.).
この授業では、複雑で大規模なデータセットから情報を探索・抽出するためにバイオインフォマティクス研究者が使用するスキルに焦点を当てる。こうしたデータスキルを学ぶことで、どんなバイオインフォマティクス・データでも(どんなフォーマットの、どんなサイズのファイルでも)扱うことができるようになり、生物学的意味を引き出すためにデータの探究を始めることができる。
授業全体を通して、ロバストで再現性のある手法で研究することの重要性を強調する。再現性とは、自分の研究が他の研究者によって追試されて同じ結果が得られることを意味する。そのためには、作業手順を十分に文書化し、コードとデータを全て公開しなければならない。解析ワークフローを別のマシンで実行して異なる結果が得られた場合、それはロバストでも再現可能でもない。このテーマは、講義の中で繰り返し出てくる。
この授業では、表形式のプレーンテキストデータ形式を主に扱う。表(テーブル)データは、データスキルを磨くのに最適である。将来、他のデータを解析することが目標であっても、表形式のデータは学習に役立つ優れたサンプルデータとなる。表形式データを扱うために必要なテキスト処理のスキルを身につけることは、他のデータ型を扱う際にも応用できる。このように、多様な分野の研究に役立つ計算ツールとデータスキルを学ぶことができる。
あらゆる分野の研究者が、バイオインフォマティクス・データスキルを応用して、独自の分野(生物学、言語、音楽、新型コロナウイルス感染症のパンデミックに寄与した社会的経済的要因など)の問題解決に取り組む。
情報社会になり,多様で大量のデータを蓄積・分析することが可能となった。本授業ではmicrosoftのexcel及び統計ソフトのRを利用してデータの分析を行い,最終的には決裁者に決済を仰ぐための資料作成までを行う。本授業を通じて,データ分析のテクニカル的なスキルのみならず,データ分析を行う上で重要な目的設定や説明変数の重要性などを身に着ける。