機械学習実践
応用データサイエンス学位プログラム
MADS7420
コース情報
担当教員: 倉島 健
単位数: 2
年度: 2024
学期: 秋学期集中
曜限: その他
形式: 対面授業
レベル: 500
アクティブラーニング: あり
他学部履修: 不可
評価方法
出席状況
リアクションペーパー
レポート
詳細情報
概要
・本授業では,機械学習技術に関する基本的事項を理解するだけでなく,それを実課題に活用する能力の向上を目指す。具体的には,機械学習技術の基本的な事項を学ぶと同時に,機械学習コンテストであるKaggleに存在するデータと課題に取り組む演習を通じ,機械学習技術を活用して課題解決を行う感覚を養う。また,Kaggleのようなクリーンなデータではなく,実世界で現実的に得られるデータを対象とした処理も経験する。さらに,Kaggleのように課題(やデータ)がトップダウンに与えられるような状況だけではなく,オリジナルな着眼に基づく実課題をスタート地点として,一連のプロセス(ユースケースの選定,データ収集方法,機械学習タスク・手法・評価指標の選定など)を一人称で設計することにもチャレンジする。 ・1〜2回目(1日目)の機械学習の基礎講義を除き,3回目の授業以降(2日目以降)はアクティブ・ラーニング(プログラミング演習,プレゼンとディスカッションなど)を積極的に実施する予定である。
目標
・機械学習技術の基本的な知識を習得する。 ・データ分析から機械学習による予測までの一連のプロセスをPythonプログラミングで実現できる。 ・より実践的な(現実的に利用可能な)データに対しても上記の分析や予測を実行できる。 ・実課題解決に向け,一連のプロセス(ユースケースの選定,データ収集方法,機械学習タスク・手法・評価指標の選定など)を一人称で設計することができる。
授業外の学習
・予習:次回以降の講義資料を用いた予習 ・復習:演習回答作成,リアクションペーパー作成
所要時間: 200分
スケジュール
- イントロダクション:機械学習実践 ※以下は予定であり,授業の進捗状況により各テーマの回数は変更することがありうる
- 機械学習基礎:確率関数・ニューラルネットワーク
- PythonプログラミングとKaggle ① データの可視化と分析
- PythonプログラミングとKaggle ② 特徴量・交差検証・評価指標
- PythonプログラミングとKaggle ③ 交差検証を通じたモデル選択
- ライフログデータの分析と予測 ① データの前処理
- ライフログデータの分析と予測 ② NeuralNetの実装
- ライフログデータの分析と予測 ③ LSTMを用いたモデルの実装
- ライフログデータの分析と予測 ④ 精度向上のためのモデルチューニング
- 課題解決型の演習 ① 演習のイントロダクション
- 課題解決型の演習 ② 演習
- 演習結果のプレゼンテーションとディスカッション ① グループワーク
- 演習結果のプレゼンテーションとディスカッション ② 全体
- 演習結果のプレゼンテーションとディスカッション ③ まとめ
教科書
テキストは指定せず講義資料を配布します。
参考書
続・わかりやすいパターン認識―教師なし学習入門―
著者: 石井健一郎・上田修功
出版社: オーム社・2014年
最短コースでわかる PyTorch & 深層学習プログラミング
著者: 赤石雅典
出版社: 日経BP・2021年
Pythonによる時系列分析: 予測モデル構築と企業事例
著者: 髙橋威知郎
出版社: オーム社・2023年