シラバス参照

公式版のシラバスを表示  
最終更新日:2020/09/09  
筑波大学 教育課程編成支援システム

01CF115 データ解析特論

2.0 単位, 1・2 年次, 秋AB 月5,6
馬場 雪乃, 津川 翔, 秋本 洋平

授業概要

研究成果の評価を行う上で重要となるデータ解析について,基礎から最新の手法に至る重要なトピックについて論じ,Rをはじめとするツールを用いた演習を行う.

備考

01CH738と同一。
オンライン(オンデマンド型)

授業形態

講義

学位プログラム・コンピテンスとの関係

知の活用力,マネジメント能力,研究力,知識力 に関連する

授業の到達目標(学修成果)

多様なデータに対して,それらを解析,解釈するための基礎から発展に至る手法を理解する. 修士論文研究を行う上で研究成果をデータに基づき客観的に評価し,プレゼンテーションできるようになる.

キーワード

データ解析, 統計学

授業計画

コンピュータサイエンス研究の様々な場面で遭遇する多様なデータを用いた分析,解釈,予測に関して,基礎的な知識の確認から開始し,従来より用いられてきた解析手法,近年開発されてきている手法に至るまで,それぞれの考え方と特徴について講述し,R言語を用いた演習を行う.

第1週導入
- 基本的な確率論のおさらい:確率,確率事象と確率変数,確率分布,確率密度関数
- Rイントロ:インストール,言語仕様,計算方法,主要なデータ構造,入出力,パッケージ
  
第2週推定
- 密度関数の推定(最尤推定,ベイズ推定,混合分布の最尤推定(EMアルゴリズム),ノンパラメトリック推定)
- 区間推定と信頼係数
  
第3週主成分分析
- 共分散(相関)行列と主成分,非線形(カーネル)主成分分析とその意味
  
第4週相関解析と回帰
- 相関係数
- 単回帰,重回帰と誤差
  
第5週ベイズ統計モデリング
- ベイズ推定とMCMC
- 確率的プログラミング言語Stan
  
第6週様々な確率分布
- 離散型分布とその事前分布
- 連続型分布
  
第7週実用的なモデル
- 階層モデル
- 離散値をとるモデル
  
第8週ネットワーク分析
- ネットワークとして表現可能なデータ
- ネットワークの可視化
- ネットワーク分析で用いられる指標
  
第9週クラスタリングとその評価
- データ間の距離に基づくクラスタリング
- データ間の関係 (ネットワーク) に基づくクラスタリング
- クラスタリングの評価
  
第10週データのランキングとその評価
- ネットワークにおけるノードランキング
- 情報検索の分野におけるランキングの評価指標
  

履修条件

学部(学類)レベルの確率論,統計学の知識を有することが望ましい.

成績評価方法

3名の担当教員の課するレポートを総合して評価する.
A+~D の評点は期末試験の点数に基づいて行う.

学修時間の割り当て及び授業外における学修方法

毎週2時限の授業のうち,前半を講義,後半をR言語を用いた演習にあてる.R言語の処理系を実行することができるノートパソコンを持参すること.
授業内で示す課題についてレポートを作成すること.

教材・参考文献・配付資料等

manabaで配布する資料を用いる.

1. Rで学ぶデータサイエンスシリーズ(共立出版)
2. Max Kuhn & Kjell Johnson,Applied Predictive Modeling, Springer,2013
3. 松浦 健太郎,StanとRでベイズ統計モデリング(共立出版)
4. 馬場 真哉,RとStanではじめる ベイズ統計モデリングによるデータ分析入門(講談社)

オフィスアワー等(連絡先含む)

各担当教員に事前に連絡のこと.

馬場 雪乃 100002372
津川 翔 23051794 http://www.mibel.cs.tsukuba.ac.jp/~s-tugawa/
秋本 洋平 100002461

その他(受講生にのぞむことや受講上の注意点等)

他の授業科目との関連

ティーチングフェロー(TF)・ティーチングアシスタント(TA)

TA配置あり (1人)