25件見つかりました。
情報社会になり,多様で大量のデータを蓄積・分析することが可能となった。本授業ではmicrosoftのexcel及び統計ソフトのRを利用してデータの分析を行い,最終的には決裁者に決済を仰ぐための資料作成までを行う。本授業を通じて,データ分析のテクニカル的なスキルのみならず,データ分析を行う上で重要な目的設定や説明変数の重要性などを身に着ける。
高度情報技術の発達により,時空間スケールが詳細で高精度な空間情報が活用できるようになった.都市計画,環境科学やエリアマーケティング分野では,これらのデータを活用し,空間現象のモデル化と現象解明を行うことにより,個別主体へのきめ細かい計画立案・実施が要請されている.特に近年では,地球統計学や空間計量経済学と呼ばれる新しい学問分野が形成されつつあり,その環境科学や人文・社会科学への適用に関心が払われている.
本科目では,講義・演習を通じて,より高度な空間モデリング技法を習得してもらう.履修者は,各自の関心に応じて,社会経済データ(人口,地価など)または環境関連データ(大気汚染観測値など)を選んで演習を行う予定である.
配列解析は、ゲノム(DNA)やタンパク質(アミノ酸)などを表す様々なテキスト配列を分析する幅広い分野である。生物配列解析には、ゲノム構造の決定、タンパク質コード領域(遺伝子)の同定、遺伝子機能の予測、系統関係の推定、祖先配列の再構築などが含まれる (Coghlan, 2011; Hall, 2017)。最近の研究は、ゲノム解析と系統解析により新型コロナウイルスの拡散と進化を追跡できる可能性を示した ([https://nextstrain.org/])。配列解析の手法は、生物学の分野のみにとどまらず、写本の系譜(Barbrook et al, 1998)や音楽の類似性評価 (Savage et al., 2018) などにも使用されてきた。このように、配列データ解析に必要なテキスト処理スキルは、他の分野のデータ解析にも適用できる。
この科目では、配列データの解析に使用される主要なツールとデータベースを紹介し、それらを組み合わせて生物学的な問いに取り組む方法を説明する。解析の例として、公共データベースからのタンパク質やDNA配列の取得、DNA配列の統計解析(長さ、GC含量、連続塩基組成、塩基組成の局所変動)、ペアワイズ配列アラインメント(ドット・プロット、グローバル配列アラインメント、ローカル配列アラインメント)、多重配列アラインメント、系統推定などが含まれる。
あらゆる分野の学生が、配列解析手法を応用して、独自の分野(生物学、言語、写本、音楽など)の問題解決に取り組む。
国際社会のデータサイエンスでは、応用ミクロ計量経済学の基礎知識を学び、社会問題を分析する実証的な研究を行うための基礎的な知識を習得することを目的とします。
数理科学がいかに現実の問題の解決に役立つかを学びます。大切なのは公式や結果を覚えるのではなく、現実の問題を数学の問題に置き換える過程を理解することです。この科目設置の趣旨は、DS1,2の履修で苦しんでいる人を対象としています。例えば、DSの科目を落としている、今期、DS科目を取らないと、卒業や進級に支障が生じることが確定している、すでに原級者している、などです。
This course will examine quantitative research methods and statistical analysis of data with a particular focus on analyzing, understanding, and interpreting statistical results in research. The course will utilize the basic foundations of quantitative methods (e.g., correlation, regression, means comparisons, and chi-square tests) and examine how these are used in designing and reporting research.
This course is for people who have some prior experience with statistics, but you do not need a high level of ability (or confidence) in math to succeed in this course. We will look at what is required to analyze a variety of statistical tests, and while this means that students will need to run sample data and report results, the focus will be on what the results mean rather than the specific calculations that lead us to those results. To that end, this course looks at the concepts, interpretations, and applications of statistics rather than the math itself. This course will be discussion-based and NOT lecture based, so students should also come prepared and ready to participate each class.
NOTE: This class will be held both online and via weekly Zoom discussions. Lectures, readings, & assignments will be delivered in an on-demand format (due every Tuesday, 9:00 A.M.), and will be supplemented with regular Q&A/Discussion sessions over Zoom each week at 14:45.
本コースは、データを理解し評価した上で、データに基づいた合理的な意思決定行うための導入となるように設計されています。 今年度は、多変量解析技術を中心に扱います。学習する内容は、定量的および定性的データの表現と要約統計量、相関と主成分、因子分析、および、共分散構造解析。
細かな計算技術ではなく、概念の習得と、データおよび統計解析結果の解釈に焦点を置きます。
近年,バイオ統計や空間統計などの自然科学分野のみならず,マーケティングや政策分析,計量経済学などの社会科学分野でもベイズ・アプローチが着目されている. この授業では,古典統計学の基礎的な知識を前提に,ベイズ統計学の基礎と応用について扱う.R言語などによる演習も行う予定である.マルコフ連鎖モンテカルロ法,経験ベイズと階層ベイズ,回帰と相関に関するベイズ推測,ベイズ計量経済学などを扱いたいと考えている
本授業は自然の現象を数式の言葉で表現し、理解する手法である数理モデルについて解説する。各回の授業では、一つの現象を紹介し、その現象を数理モデルを立てて理解する過程を見せる。微分方程式を利用した数理モデルについて主に解説するが、後半では、知覚心理学の現象を理解するための道具立てについても解説する。
情報化の進む現代社会においてコンピュータはあらゆる場面で使われている。コンピュータが使われるとき、必ず何かのアルゴリズムが使われている。本講義の目的は、様々な状況で使われるアルゴリズムを紹介し、その面白さを理解してもらうことにある。
生命科学の研究を行うために必要とされる、実験の基本操作と基礎知識を習得する。具体的には、微生物(大腸菌)の培養、DNAの抽出と定量、タンパク質の電気泳動と定量を実習し、遺伝子工学とタンパク質実験においてコアとなる基礎技術を習得する。
データマイニングは、ビジネスのためのデータサイエンスの中核をなす技術であり、さまさまな分野における実務家の関心を集めています。今日、ほぼすべての組織がデータを収集し、意思決定や政策策定に役立てていると言っても過言ではありません。インターネット、電子商取引、販売時点機器の副産物として得られることから、電子的なデータ収集は、コストがかからず広く普及しています。データマイニングは、そうしたデータを生かすビジネス・インテリジェンスのための技術として急速に発展しています。主として、統計学と人工知能の分野から生まれたものです。本コースでは、データマイニングの技術を検討するとともに、R言語を用いた演習を行うことによって、実践的な分析力を身につけることを目的としています。
The aim of this course is to introduce the basics of medical and health data science, data collection, data management, data analysis and biostatistics to better comprehend medical literature and publications. By the end of the course, skills and methodology for basic statistical analysis needed for medical publication will be acquired.
配列解析は、ゲノム(DNA)やタンパク質(アミノ酸)などを表す様々なテキスト配列を分析する幅広い分野である。生物配列解析には、ゲノム構造の決定、タンパク質コード領域(遺伝子)の同定、遺伝子機能の予測、系統関係の推定、祖先配列の再構築などが含まれる (Coghlan, 2011; Hall, 2017)。最近の研究は、ゲノム解析と系統解析により新型コロナウイルスの拡散と進化を追跡できる可能性を示した ([https://nextstrain.org/])。配列解析の手法は、生物学の分野のみにとどまらず、写本の系譜(Barbrook et al, 1998)や音楽の類似性評価 (Savage et al., 2018) などにも使用されてきた。このように、配列データ解析に必要なテキスト処理スキルは、他の分野のデータ解析にも適用できる。
この科目では、配列データの解析に使用される主要なツールとデータベースを紹介し、それらを組み合わせて生物学的な問いに取り組む方法を説明する。解析の例として、公共データベースからのタンパク質やDNA配列の取得、DNA配列の統計解析(長さ、GC含量、連続塩基組成、塩基組成の局所変動)、ペアワイズ配列アラインメント(ドット・プロット、グローバル配列アラインメント、ローカル配列アラインメント)、多重配列アライメント、系統推定などが含まれる。
あらゆる分野の学生が、配列解析手法を応用して、独自の分野(生物学、言語、写本、音楽など)の問題解決に取り組む。
Sequence analysis is a broad field, covering any kinds of analyses of textual sequences; e.g. those representing genomes (DNA) and proteins (amino acids). The biological sequence analyses include determining genome structures, identifying protein-coding regions (genes), predicting gene function, inferring phylogenetic relationships, and ancestral reconstruction (Coghlan, 2011; Hall, 2017). Recent studies showed that genomics and phylogenetics can track spread and evolution of novel coronavirus ([https://nextstrain.org/]). The sequence analysis methods have been used not only in the field of biology, but also in genealogy of manuscripts (Barbrook et al., 1998) and quantitative evaluation of melodic similarity (Savage et al., 2018). Thus, text-processing skills necessary to analyze sequence data can be applied to the analysis of data in other fields.
This course will provide the introduction to the main tools and databases used in the analysis of sequence data and explains how these can be used together to answer biological questions. Examples of analysis include retrieving DNA and protein sequences from public databases, DNA sequence statistics (length, GC content, DNA words, and local variation in base composition), pairwise sequence alignment (dotplot, global sequence alignment, and local sequence alignment), multiple sequence alignment, and phylogenetic inference, etc.
Students from all disciplines will use the sequence analysis methods to tackle problems in their fields (biology, language, manuscript, music, etc.).
東京五輪でも多くのテクノロジーがスポーツで活用され、スポーツアナリティクスが注目を集めている。2018サッカーW杯ロシア大会では、リアルタイムでのデータ活用が解禁されたことから、スポーツアナリティクスがますます注目を集めている。また、MLB(野球)では、フィールド上のあらゆるデータがオープンにシェアされることで、直接的なパフォーマンスだけではなく、データを使った議論が活発に行われている。野球・サッカー・ラグビー・アメフトなどのメジャースポーツだけでなく、個人競技やマイナー競技、アマチュアスポーツなど、スポーツの様々な場面でデータ分析とその可視化が行われており、持続可能なビジネスモデルにも期待が集まっている。この授業では、スポーツをする・みる・支える・伝えるという観点から、スポーツアナリティクスを体系的に学ぶ。
第四次産業革命やSociety 5.0などにより、先端的な技術イノベーションが社会イノベーションをもたらすことが予見されています。その背景には、様々な数理科学・統計科学の発展と応用があることは、言うまでもありません。
この授業では、数学・統計学がどのように社会や科学技術の発展に寄与してきたか、そして将来どのように社会変革をもたらしうるのかについて、理解を深めることを目的とします。
この授業では「統計基礎」の内容を踏まえ、データサイエンスの理論と実践の定着と応用的理解を目的とする。現状について問題を発見し、その解決のために収集したデータを元に仮説やモデルを構築し、それに対する検証を行って問題を解決する能力を養う。
具体的には、線型モデルの応用的な話題(変数選択、ロジスティック回帰、一般化線形モデルなど)、様々な多変量解析の手法(主成分分析、判別分析、分散分析、因子分析、クラスター分析、樹形モデルなど)を扱う。
この授業では、統計モデリングの基礎と応用を扱う。具体的には、線形回帰モデル、一般化線形回帰モデル、一般化線形混合モデルなどについての理解を深めることを目的とする。
統計モデリングを本格的に習得し、データサイエンティストとして活躍するために必要なスキルを習得する。演習では、フリーソフトのRを主に用いる。
近年では経済学やファイナンスはもちろん、経営学、医学、心理学、マーケティングなど様々な分野でベイズ統計学が着目されている。
この講義ではベイズ統計学と非ベイズ統計学の相違点から、ベイズ統計学の基礎であるベイズの定理,事前確率から事後確率へのベイズ更新、数値解析法であるマルコフ連鎖モンテカルロ法、ベイズ統計学におけるモデル選択,ベイズ推定の正規分布モデルや回帰分析モデルへの応用、個体差を扱う階層ベイズモデルについて説明する。
講義中では実際にPythonを用いた演習を多く取り入れる予定である。
This class discusses how several phenomena could be formulated in mathematical modeling. Each lecture introduces one phenomenon and a mathematical model that describes the phenomenon. This series of lectures firstly addresses modeling with differential equations, and in the later part, mathematical analysis of perceptual phenomena in human psychology are also discussed.
Computers are used everywhere in modern information society. Whenever a computer is used, some algorithm is used. The purpose of this lecture is to introduce algorithms used in various situations and to make them more interesting.
シャノンの情報理論について講義する. 具体的には「情報の量」,「情報の符号化」などに関して数学モデルを考え, その基礎理論を解説する. 伝送や記録においては, データ量をできるだけ減らしたい. 一方で, 通信においては, 伝送エラーの可能性があり, 伝送誤りをできるだけ小さくするための符号化が必要となる. これらの課題に対する基本的な考え方と方法を考察する.
情報理論は情報の表現と伝達に関する基礎理論である. 代表的な応用例としては, データ圧縮, ビット誤り検出・訂正, 暗号などがある. また機械学習アルゴリズムなどにおいても, 情報理論は重要な役割を果たす(例えば, 交差エントロピーは機械学習での目的関数として採用される).
計算機には「ハード」と「ソフト」の側面があるが, この講義ではその前提となる「理論」を扱う. つまり実装上の制約を考慮せず, 理論上の最適化問題を考察する.
普段何気なく使っている「情報」の定量的な扱いを学び, 情報理論を基盤とする技術の理解を深めることも講義の目標である.
複素関数論を学ぶ。複素関数の不思議な世界に触れる。Cauchyの積分定理、積分公式、留数の計算など実関数では見られなかった新しい世界を紹介する。証明には深入りしないが、諸定理の理解と諸計算ができるようにする。
生命科学の研究に必要となる実験の基礎を習得する。具体的には、微生物(大腸菌)の培養、DNAの抽出と定量、タンパク質の電気泳動と定量を実習し、遺伝子工学とタンパク質実験においてコアとなる基礎技術を習得する。
この授業では、複雑で大規模なデータセットから情報を探索・抽出するためにバイオインフォマティクス研究者が使用するスキルに焦点を当てる。こうしたデータスキルを学ぶことで、どんなバイオインフォマティクス・データでも(どんなフォーマットの、どんなサイズのファイルでも)扱うことができるようになり、生物学的意味を引き出すためにデータの探究を始めることができる。
授業全体を通して、ロバストで再現性のある手法で研究することの重要性を強調する。再現性とは、自分の研究が他の研究者によって追試されて同じ結果が得られることを意味する。そのためには、作業手順を十分に文書化し、コードとデータを全て公開しなければならない。解析ワークフローを別のマシンで実行して異なる結果が得られた場合、それはロバストでも再現可能でもない。このテーマは、講義の中で繰り返し出てくる。
この授業では、表形式のプレーンテキストデータ形式を主に扱う。表(テーブル)データは、データスキルを磨くのに最適である。将来、他のデータを解析することが目標であっても、表形式のデータは学習に役立つ優れたサンプルデータとなる。表形式データを扱うために必要なテキスト処理のスキルを身につけることは、他のデータ型を扱う際にも応用できる。このように、多様な分野の研究に役立つ計算ツールとデータスキルを学ぶことができる。
あらゆる分野の研究者が、バイオインフォマティクス・データスキルを応用して、独自の分野(生物学、言語、音楽、新型コロナウイルス感染症のパンデミックに寄与した社会的経済的要因など)の問題解決に取り組む。