機械学習実践

応用データサイエンス学位プログラム

MADS7420

コース情報

担当教員: 倉島 健

単位数: 2

年度: 2024

学期: 秋学期集中

曜限: その他

形式: 対面授業

レベル: 500

アクティブラーニング: あり

他学部履修: 不可

評価方法

出席状況

25%

リアクションペーパー

25%

レポート

50%

詳細情報

概要

・本授業では,機械学習技術に関する基本的事項を理解するだけでなく,それを実課題に活用する能力の向上を目指す。具体的には,機械学習技術の基本的な事項を学ぶと同時に,機械学習コンテストであるKaggleに存在するデータと課題に取り組む演習を通じ,機械学習技術を活用して課題解決を行う感覚を養う。また,Kaggleのようなクリーンなデータではなく,実世界で現実的に得られるデータを対象とした処理も経験する。さらに,Kaggleのように課題(やデータ)がトップダウンに与えられるような状況だけではなく,オリジナルな着眼に基づく実課題をスタート地点として,一連のプロセス(ユースケースの選定,データ収集方法,機械学習タスク・手法・評価指標の選定など)を一人称で設計することにもチャレンジする。 ・1〜2回目(1日目)の機械学習の基礎講義を除き,3回目の授業以降(2日目以降)はアクティブ・ラーニング(プログラミング演習,プレゼンとディスカッションなど)を積極的に実施する予定である。

目標

・機械学習技術の基本的な知識を習得する。 ・データ分析から機械学習による予測までの一連のプロセスをPythonプログラミングで実現できる。 ・より実践的な(現実的に利用可能な)データに対しても上記の分析や予測を実行できる。 ・実課題解決に向け,一連のプロセス(ユースケースの選定,データ収集方法,機械学習タスク・手法・評価指標の選定など)を一人称で設計することができる。

授業外の学習

・予習:次回以降の講義資料を用いた予習 ・復習:演習回答作成,リアクションペーパー作成

所要時間: 200分

スケジュール

  1. イントロダクション:機械学習実践 ※以下は予定であり,授業の進捗状況により各テーマの回数は変更することがありうる
  2. 機械学習基礎:確率関数・ニューラルネットワーク
  3. PythonプログラミングとKaggle ① データの可視化と分析
  4. PythonプログラミングとKaggle ② 特徴量・交差検証・評価指標
  5. PythonプログラミングとKaggle ③ 交差検証を通じたモデル選択
  6. ライフログデータの分析と予測 ① データの前処理
  7. ライフログデータの分析と予測 ② NeuralNetの実装
  8. ライフログデータの分析と予測 ③ LSTMを用いたモデルの実装
  9. ライフログデータの分析と予測 ④ 精度向上のためのモデルチューニング
  10. 課題解決型の演習 ① 演習のイントロダクション
  11. 課題解決型の演習 ② 演習
  12. 演習結果のプレゼンテーションとディスカッション ① グループワーク
  13. 演習結果のプレゼンテーションとディスカッション ② 全体
  14. 演習結果のプレゼンテーションとディスカッション ③ まとめ

教科書

テキストは指定せず講義資料を配布します。

    参考書

    • 続・わかりやすいパターン認識―教師なし学習入門―

      著者: 石井健一郎・上田修功

      出版社: オーム社・2014年

    • 最短コースでわかる PyTorch & 深層学習プログラミング

      著者: 赤石雅典

      出版社: 日経BP・2021年

    • Pythonによる時系列分析: 予測モデル構築と企業事例

      著者: 髙橋威知郎

      出版社: オーム社・2023年

    © 2025 上智非公式シラバス. All rights reserved.