<理工共通>数学CI(統計データ解析)【情報理工学科クラス】
理工学部 - 情報理工学科
SCT66500
コース情報
担当教員: 後藤 聡史
単位数: 2
年度: 2024
学期: 春学期
曜限: 水5
形式: 対面授業
レベル: 200
アクティブラーニング: なし
他学部履修: 不可
評価方法
出席状況
授業参加
レポート
小テスト等
その他
「小テスト等」は 毎週の演習課題の取組み・提出状況で,「出席状況」「授業参加」は「小テスト等」に含む.
詳細情報
概要
卒業研究において,実験や調査のデータを分析する機会が多くの研究室であります.また,就職後,企画書や報告書を提出する際,自分の考えや主張を裏付けるために,実験や調査データの分析結果を添える必要が生じるときがあります.その際,小難しい統計的データ解析に手をつける前に,目的に応じた図を活用してデータを視覚化し,それらをよく観察して,データの特徴を直感的につかんでおくことはとても重要です.この講義では,R という無料の統計的データ解析用ソフトウェアを活用し,次のことを学びます. 1.データの整理やデータ視覚化の技能 2.多変量データ解析の基礎 3.統計における線形代数の役割 この講義は,ほぼ毎回,PCルームのコンピュータを活用した実習形式で行います.使用するソフトウェア R は,金融,心理,社会調査,データマイニングなど,幅広い分野で使われています.もともとが英語版であるため,インターネット接続環境があれば,世界中どこでも無料で利用できます.R を使ったデータ処理の方法を学んでおけば,仮に世界のどこかでデータ解析のイロハを教える立場になったとき,予算を気にすることなく教えることもできます.これは,有償の表計算ソフトウェアではできないことです.世界で広く利用されているフリーウェアを活用して統計的データ解析の技能を身につけておけば,卒業研究のみならず 卒業後も様々な場面で活用できるスキルとして役立つことでしょう. さらに,このことは,理工学部のカリキュラム・ポリシーにある「科学・技術の諸問題を幅広いおよび国際的視野から解決する基礎的な能力を習得させる」という事項に合致するものでもあります. また,大学1年のときに学んだ線形代数が,統計でどのように使われているかも取り上げます.その意味で,この講義は,単にデータをコンピュータで扱うだけの授業ではありません.すでに学習した線形代数の知識が必須です. 期末レポート課題は,出題内容のほとんどが数学の問題です.
目標
ソフトウェアを活用してデータからさまざまなグラフを描き,複数の切り口からデータの特徴を視覚的につかむ方法を学びます.また,数値型データについては,データ全体を代表する指標である平均値と中央値の使い分け方を習得し,さらに,データ全体を代表する指標にはばらつき具合を測る指標を必ず添える習慣を身につけます.また,数学的な確率モデルにもとづいて,自然界の現象をコンピュータ上で擬似的に再現する技術の初歩的なことができるようにします. また,すでに学習した線形代数が,統計でどのように活用されているかを理解します. これらの到達目標は,理工学部のディプロマ・ポリシーにある「科学・技術の諸問題を幅広いおよび国際的視野から解決する基礎的な能力を備える」に沿ったものです.
授業外の学習
講義の時間中によく理解できなかったグラフや数字の情報の見方,および,それらの解釈の方法については,自分で再度グラフを描く練習をし,次回の講義までにきちんと身につけておいてください. 毎回,Rの操作の復習,講義内容の復習が必要です.また,大学1年までに学んだ線形代数と微分積分を忘れてしまった人は,それらの復習も必要です. (Rの操作と講義内容の復習,必要であれば線形代数と微分積分の復習等,授業時間外学習の所要時間は毎週190分程度)
所要時間: 190分
スケジュール
- 記述統計学の入門(講義)(1)
- 記述統計学の入門(講義)(2),Rの利用のための準備に関する説明
- Rの基本操作
- データのばらつきと固有値および固有ベクトル
- ヒストグラムと箱ひげ図
- 箱ひげ図と四分位値
- 層別をした箱ひげ図の利用
- 平均と標準偏差
- 散布図と相関係数
- 散布図行列と相関係数行列,順位相関
- 分割表とモザイク図
- 主成分分析
- 主成分分析における線形代数(講義)
- 主成分分析の学習
- 期末レポート課題
教科書
この講義専用の教材を毎回配布します.
参考書
フリーソフト「R」ではじめる 統計処理超入門
著者: 加藤 剛
出版社: 技術評論社・2012
「R」でおもしろくなるファイナンスの統計学
著者: 横内大介
出版社: 技術評論社・2012
フリーソフト「R」ではじめる 心理学統計入門
著者: 実吉綾子
出版社: 技術評論社・2013