音声・音響・聴覚情報処理
博士前期課程理工学研究科 - 理工学専攻
MSIS7080
コース情報
担当教員: 荒井 隆行
単位数: 2
年度: 2024
学期: 春学期
曜限: 木1
形式: 対面授業
レベル: 500
アクティブラーニング: あり
他学部履修: 可
評価方法
出席状況
授業内期末試験
授業期間中
中間試験
授業期間中
小テスト等
詳細情報
概要
人間が周囲とコミュニケーションをとる際,そこに「音」,特に「音声」が介在することがしばしばある。その音や音声に関する信号や情報の処理過程を音声・音響・聴覚の立場から詳しくみる。内容は,音響学の基礎,聴覚心理学の基礎,音声・聴覚に関する信号とシステム,(音声生成を含む)音声科学,音声信号処理,音声分析・音声合成,音声認識,音響音声学,音声知覚,音声コミュニケーション障害などである。「高度な専門教育・研究の場である大学院の特性を活かすために,情報科学を基礎としたカリキュラム体制をとり,学部教育との一貫性にも配慮しながら,人間,コミュニケーション,社会の情報分野に加え,文理の学際的視点も兼ね備えた専門能力を修得させる」科目である。
目標
音声,音響,聴覚に関わる基礎的な内容を理解することを目標とする。具体的には,純音と複合音の違い,正弦波の振幅や周波数,音の大きさや高さ,最小可聴値,臨界帯域幅,音のスペクトル,音声生成の基礎,母音と子音,音声知覚の基礎などが含まれる。「情報に関する領域で科学・技術の進歩に寄与する専門性と,人間と社会を深く理解しながら総合的にとらえる学際性を持ち,人間や社会が有する知識,知恵,経験を蓄積できる人材に学位を与える」ことを目標とする。
授業外の学習
【予習】(所要時間:各回80 分程度)。 ・事前にMoodleで配布される資料や指定された学習の範囲について,目を通しておく。 【復習】(所要時間:各回110 分程度) ・講義はなるべくわかりやすく説明をするように工夫されているが,授業中に理解できなかった箇所がある場合は,その理解を前提に次回の授業が進められるため,毎回の復習が重要である。 ・毎回の講義で配布された資料や自分で作成したノート等を併用し,講義内容をまとめる。また,関連する参考書を使って疑問点を解決する。 ・授業中に実施された小テストについて,特に理解が不足しているところを重点的に復習することが,その後の理解を助けることになるので十分に時間を割く。 ・最終的に解決出来ない点をまとめ,担当教員に質問するなどにより解消するよう努力する。
所要時間: 190分
スケジュール
- Pure tone and sinusoids, amplitude, frequency, etc. ※ 以下は予定であり,授業の進捗状況により各テーマの回数は変更することがありうる。
- Pitch, missing fundamental, mel scale
- Minimum audible threshold, loudness, sound pressure level/hearing level/sensation level
- Critical band and masking
- Signals and systems, digital vs. analog
- Fourier transform, spectrum, spectrogram
- Midterm Exam.
- Speech (vowels 1)
- Speech (vowels 2)
- Speech (consonants 1)
- Speech (consonants 2)
- Speech perception
- Spectrogram reading
- Final Exam.
教科書
最新の文献などを含め,講義の中で配布します。
参考書
「音声の音響分析」 「音声・聴覚のための信号とシステム」 「音入門」
著者: 荒井・菅原監訳
出版社: 海文堂, 1996/1998/2002
「音声知覚の基礎」
著者: 今富・荒井・菅原監訳
出版社: 海文堂, 2003