データサイエンスと人工知能の実践
共通 - 全学共通
GSD20210
コース情報
担当教員: 山中 高夫
単位数: 2
年度: 2024
学期: 秋学期
曜限: 月3
形式: 対面授業
レベル: 200
アクティブラーニング: あり
他学部履修: 可
評価方法
その他
出席点と課題の評価から,客観的な総合評価基準にしたがって評価する。この総合評価基準は,出席点と課題評価の加重平均ではなく,出席点と課題評価がともに基準点を満たしているかどうかで成績を決定する。
詳細情報
概要
現代社会において大量のデータが日々発生しており,それらの中から必要な情報を取捨選択するだけでなく,データを処理することによって意味ある情報を抽出して読み取る力が重要になってきている。本講義では,このような大量のデータから,意味ある情報を抽出することができるように,実際にパソコンを利用してデータを分析する演習を行う。簡単な分析であれば,Excelを使って行うことが出来るが,少し高度な分析や柔軟な分析を行うためには,数値計算を行うためのプログラミング言語を利用した方が効率が良い。そこで,本講義では,Excelに加えて,データ分析分野で近年よく利用されているPythonを使って,実際のデータ分析を行う。本講義ではアクティブラーニングとして,毎回,コンピュータによる演習を行う。
目標
低学年向けの必修科目で習得したデータサイエンスに関する基礎知識を土台に,その知識を実際の課題に活用する技術を身につける。さらに,データサイエンスに関する知識を実社会に役立てるために,課題を設定する能力の習得も目指す。
授業外の学習
予習:60分程度 ・教材が用意されている場合は,次に行う予定の内容に一通り目を通して,内容と疑問点を把握しておく。 復習:130分程度 ・その日に出された課題に取り組む。 ・講義の内容をよく復習し,関連する事項を調べたり,実際に自分で試してみたりすると良い。
所要時間: 週190分程度
スケジュール
- 講義概要,プログラミング環境の説明
- データの分析:平均,中央値,最頻値,分散,標準偏差
- データの分析:標準化,偏差値,共分散,相関係数
- データの分析:共分散行列,相関行列 行列の掛け算,割り算,逆行列,連立方程式の解
- データの可視化(散布図,箱ひげ図,ヒストグラム)
- データの可視化演習
- 単回帰分析
- 重回帰分析
- 重回帰分析における変数選択,多重共線性,ダミー変数
- データの分割,回帰分析の正則化(リッジ回帰,ラッソ回帰)
- 分類(ロジスティック回帰)
- クラス以上の分類(1) ロジスティック回帰,SVM,ランダムフォレスト
- クラス以上の分類(2) ロジスティック回帰,SVM,ランダムフォレスト
- 期末課題の説明と演習
教科書
特に指定しない。
参考書
特に指定しない。