Lectures

DSプログラムで提供する講義
実践データサイエンティスト育成プログラム(DSプログラム)では,実践的なデータサイエンティストになるための講義を揃えています.他の関連プログラムで提供されているような,統計学,プログラミング,機械学習はもちろん,データサイエンスを実践する際に必要となるスキルも学ぶことができます.
 特に,プロジェクトマネジメント基礎,実世界データ処理学,ドメイン数理知識は,本プログラムの特徴的な講義になります.

導入講義(データ科学基礎)

データ科学の基本的な事項(データサイエンスの役割,基礎的な数学など)について,学習する.

データ科学への誘い

  • データ科学の役割
  • コンピュータにおけるデータの表現と処理
  • さまざまなメディアの表現

情報倫理と関連法規

  • 情報倫理と関連法規
  • 個人のデータに関する法、GDPR
  • 倫理に配慮したデータ収集と利活用
  • データサイエンスに関する様々なバイアス
  • 情報セキュリティ:歴史と変遷
  • データの匿名化

データの可視化・要約

  • データの種類
  • データの構造
  • 統計図表
  • 代表値
  • 散布度

変数間の関係

  • 相関関係・連関関係
  • 共変関係・因果関係
  • 予測関係・実際の関係
  • 量的データ間の関係の可視化・要約
  • 質的データ間の関係の可視化・要約

確率について

  • 順列と組み合わせ
  • 確率変数と確率分布
  • 期待値・同時確率と条件付き確率
  • ベイズの定理と応用

統計的推定

  • 統計的推測の前準備
  • 統計的推測の考え方
  • 点推定
  • 区間推定

統計的検定

  • 統計的検定の前準備
  • 統計的検定の手続き
  • 統計的有意性と実質的有意性
  • 統計的検定の注意点

事前科目:基礎的な科目

数理科学基礎

統計学の基礎と,多変量解析や時系列解析などの古典的なデータ解析理論を,用語や基礎方程式を中心に,講義と演習に基づき平易な数学の範囲で教授する.
  • データの整理
  • 確率分布
  • 不偏推定量と標本分散
  • 信頼区間の推定
  • 検定
  • 分散分析
  • 多重比較法
  • 実験計画法
  • 多変量解析

基本データツール

ツールの概要や利用例を,デモンストレーションや体験を交えて幅広く学ぶ.データ解析ツールの基本的な利用スキルを学修する.
  • Python入門
  • NumPy
  • Pandas
  • Matplotlib
  • Scikit-learn
  • 数値計算
  • 回帰
  • 分類

講義科目:より高度な科目

識別,分類,変換等のパターン処理技法を学修する.
  • パターン認識の種類
  • パターン認識に必要なデータの準備
  • 特徴抽出によるパターン認識
  • 最近の(最新の)パターン認識 LDA編
  • 医用画像
  • パーセプトロン
  • ニューラルネットワーク
  • 誤差逆伝播法
  • 学習のテクニックと畳み込みニューラルネットワーク
  • 自己符号化器の異常検知への適用
  • 再帰型ネットワークによる時系列モデル
  • 注意機構による対応付けの学習
機械学習の理論を講義形式で学び,回帰や分類等の典型的な問題に対する機械学習,ディープラーニングにおけるネットワーク表現のバリエーション,入力・出力情報の表現方法など,ディープラーニングを用いるために考慮すべき点を演習を通じて学ぶ.
  • 機械学習とデータの扱い
  • 教師あり学習
  • 教師なし学習
  • 深層学習
  • 強化学習
データ解析ツールの先端的な利用スキルを学修する.
  • MATLAB
  • Linux
  • Python
  • Android
  • OpenCV
  • R
  • MySQL
  • Unity
  • SAS
データサイエンスに関するツールは大きく,データ管理,データ操作,データ分析,可視化に分類できる.本講義では,それぞれの代表的なツールとして以下のツールを紹介する
  • SQLite + Pandas:
    関係データベース(SQL データベース)のSQLite とPandas を連携して使用する方法についての講義
  • mongoDB:
    ドキュメント指向データベースである mongoDB を使用する方法についての講義
  • FeatureTools:
    特徴量抽出器である FeatureTools を使用する方法についての講義
  • PyCaret:
    モデルやパラメータを自動推定する機械学習方式 AutoML を実現したツール PyCaret を使用する方法についての講義
  • sktime:
    時系列データ分析をするためのツール sktime を使用する方法についての講義
  • spaCy:
    自然言語処理(テキストデータ処理)を行うツール spaCy を使用する方法についての講義
  • D3.js:
    Javascript でグラフを描画するツール D3.js を使用する方法についての講義
  • Plotly:
    Matplotlib よりも多様なグラフを描画できるツール Plotly を使用する方法についての講義
  • Tableau:
    データの分析・可視化する BI (Business Intelligent) ツール Tableau を使用する方法についての講義
実世界データを扱う上で重要となる観点を分野・事業において主要な役割を果たしている方から学ぶことができます.データ倫理のような社会的必要性の高い講義や,ビジネスにおけるデータ分析の重要性に関する講義など多岐にわたる講義を用意しています.
タイトル
講師
データを扱う上での倫理
久木田 水生(名古屋大学)
情報処理と法律問題~リクナビ事件を題材に~
小林 正啓(花水木法律事務所)
データを安全に活用するために
大須賀 智子
(国立情報学研究所)
実世界データ処理におけるデータセット・タグ付け
大谷 健登(名古屋大学)
デジタルイノベーション~データ活用がもたらすビジネスの未来~
石黒 不二代
(ネットイヤーグループ(株))
超スマート社会のデータサイエンティストを目指して
〜オプティマインドのケーススタディ~
松下 健
((株)オプティマンド)
自ら学ぶ力が伸びる学習法に関する共同研究
~「進研ゼミ」の学習履歴データを用いて~
佐藤 昭宏(ベネッセ教研)
結晶成長プロセスにおける機械学習の活用
宇治原 徹(名古屋大学)
医療情報の保護と利活用
飯島 祥彦(名古屋大学)
(自治体などの)行政データの扱い
遠藤 守(名古屋大学)
データと事業 クックパッドの場合
成田 一生
(クックパッド(株))
ビジネス的観点からのE-commerce企業における機械学習活用
竹内 伸一(楽天(株))
宇宙地球環境研究におけるデータ解析とハイパフォーマンスコンピューティング入門
三好 由純,梅田 隆行
(名古屋大学)
データ活用、機械学習:鳥の目、虫の目、魚の目〜個人で手を動かし学び続け、実務活用するために〜
増田 知彰
(NTTコミュニケーションズ)
因果推論
藤井 慶輔(名古屋大学)
トヨタ自動車におけるデータ解析のポイントと事例
福島 真太朗
(トヨタ自動車株式会社)
学術データマネジメント
松原 茂樹(名古屋大学)
より専門的に学ぶことをができるように,ドメインに関する数理的な講義も多数用意しています.ただデータ分析ができるだけでなく,より深くドメインを理解し,数理的に把握・表現できるようになるための事例を多数用意しています.全24講義用意しており,自信の専門性・興味に応じて選択的に受講できます.
タイトル
講師
知能化車両のための実世界データ循環
武田 一哉(名古屋大学)
コンテンツ循環を目指した映像の自動再編集
井手 一郎(名古屋大学)
自動運転社会のためのシナジックモビリティ
河口 信夫(名古屋大学)
制約付き書換え帰納法によるプログラム検証
西田 直樹(名古屋大学)
組合せ最適化に対する実践的アプローチ
柳浦 睦憲(名古屋大学)
大規模構造化データの圧縮と直接操作
関 浩之(名古屋大学)
ビッグデータとデータベースシステム
石川 佳治(名古屋大学)
3次元画像システム - 入力から表示まで
藤井 俊彰(名古屋大学)
インテリジェント医療機器の機械学習
森 健策(名古屋大学)
E-コーチングと共生インタラクション
間瀬 健二(名古屋大学)
ビルディングスケールのバーチャルリアリティ(VR):
現実世界を拡張する別の方法
長尾 確(名古屋大学)
パーソナルAI
橋田 浩一(東京大学)
ヒトゲノムにおけるVariants of Unknown Significance (VUS) の予測モデル
大野 欽司(名古屋大学)
医学の進歩における病理診断データと解析の重要性
榎本 篤(名古屋大学)
頻度のまれな疾患関連ゲノム変異から始まる神経発達障害、自閉症スペクトラム障害、統合失調症における分子病態の解明
尾崎 紀夫(名古屋大学)
医科学におけるウェットとドライ
高橋 隆(名古屋大学)
データ循環のための実世界テキスト -コンピューターによる自然言語理解
相澤 彰子(国立情報学研究所)
EVを活用したエネルギー管理システムと車使用の予測
稲垣 伸吉(名古屋大学)
電動化モビリティとそのスマートグリッドへの影響の概要
鈴木 達也(名古屋大学)
データ循環に基づく道路環境認識
出口 大輔(名古屋大学)
因果関係研究への回帰不連続アプローチ
安達 貴教(名古屋大学)
ソーシャルCPS:概念と実証実験で得られた実際的経験
安達 淳(国立情報学研究所)
自動運転技術の価値創造
加藤 真平(東京大学)
統計的検定における多重比較法について
古橋 武(名古屋大学)
分析イメージング法を活用した生物素材の非破壊品質評価
馬 特(名古屋大学)
テスト理論に基づいたテスト作成・分析手法
坪田 彩乃(名古屋大学)
オイラーの多面体定理とホモロジー
若月 駿(名古屋大学)
  • 知能化車両のための実世界データ循環:
    武田 一哉(名古屋大学)
  • コンテンツ循環を目指した映像の自動再編集:
    井手 一郎(名古屋大学)
  • 自動運転社会のためのシナジックモビリティ:
    河口 信夫(名古屋大学)
  • 制約付き書換え帰納法によるプログラム検証:
    西田 直樹(名古屋大学)
  • 組合せ最適化に対する実践的アプローチ:
    柳浦 睦憲(名古屋大学)
  • 大規模構造化データの圧縮と直接操作:
    関 浩之(名古屋大学)
  • ビッグデータとデータベースシステム:
    石川 佳治(名古屋大学)
  • 3次元画像システム - 入力から表示まで:
    藤井 俊彰(名古屋大学)
  • インテリジェント医療機器の機械学習:
    森 健策(名古屋大学)
  • E-コーチングと共生インタラクション:
    間瀬 健二(名古屋大学)
  • ビルディングスケールのバーチャルリアリティ(VR):現実世界を拡張する別の方法:
    長尾 確(名古屋大学)
  • 個人データ循環のためのMyData:
    橋田 浩一(東京大学)
  • ヒトゲノムにおけるVariants of Unknown Significance (VUS) の予測モデル:
    大野 欽司(名古屋大学)
  • 医学の進歩における病理診断データと解析の重要性:
    榎本 篤(名古屋大学)
  • 頻度のまれな疾患関連ゲノム変異から始まる神経発達障害、自閉症スペクトラム障害、統合失調症における分子病態の解明:
    尾崎 紀夫(名古屋大学)
  • 医科学におけるウェットとドライ:
    高橋 隆(名古屋大学)
  • データ循環のための実世界テキスト -コンピューターによる自然言語理解:
    相澤 彰子(国立情報学研究所)
  • 車の使用に関するデータ収集と予測:
    稲垣 伸吉(名古屋大学)
  • 電動化モビリティとそのスマートグリッドへの影響の概要:
    鈴木 達也(名古屋大学)
  • データ循環に基づく道路環境認識:
    出口 大輔(名古屋大学)
  • 因果関係研究への回帰不連続アプローチ:
    安達 貴教(名古屋大学)
  • ソーシャルCPS:その概念と実証実験で得られた経験:
    安達 淳(国立情報学研究所)
  • 自動運転技術の価値創造:
    加藤 真平(東京大学)
  • 統計的検定における多重比較法について:
    古橋 武(名古屋大学)
  • 分析イメージング法を活用した生物素材の非破壊品質評価:
    馬 特(名古屋大学)
  • テスト理論に基づいたテスト作成・分析手法:
    坪田 彩乃(名古屋大学)
  • オイラーの多面体定理とホモロジー:
    若月 駿(名古屋大学)
社会で実践的に活躍するために,プロジェクト管理における基本的な事項,分析結果などの提示方法(可視化、文書化、プレゼンテーション)について学べます.
  • WBS(Work Breakdown Structure)を用いた工程管理
  • 解析結果の可視化
  • 解析結果を文書化する技法
  • プレゼンテーション法

パターン認識

識別,分類,変換等のパターン処理技法を学修する.
  • パターン認識の種類
  • パターン認識に必要なデータの準備
  • 特徴抽出によるパターン認識
  • 最近の(最新の)パターン認識 LDA編
  • 医用画像
  • パーセプトロン
  • ニューラルネットワーク
  • 誤差逆伝播法
  • 学習のテクニックと畳み込みニューラルネットワーク
  • 自己符号化器の異常検知への適用
  • 再帰型ネットワークによる時系列モデル
  • 注意機構による対応付けの学習

機械学習

機械学習の理論を講義形式で学び,回帰や分類等の典型的な問題に対する機械学習,ディープラーニングにおけるネットワーク表現のバリエーション,入力・出力情報の表現方法など,ディープラーニングを用いるために考慮すべき点を演習を通じて学ぶ.
  • 機械学習とデータの扱い
  • 教師あり学習
  • 教師なし学習
  • 深層学習
  • 強化学習

データツール

データ解析ツールの先端的な利用スキルを学修する.
  • MATLAB
  • Linux
  • Python
  • Android
  • OpenCV
  • R
  • MySQL
  • Unity
  • SAS
  • Java

ツールの整理学

データサイエンスに関するツールは大きく,データ管理,データ操作,データ分析,可視化に分類できる.本講義では,それぞれの代表的なツールとして以下のツールを紹介する
  • SQLite + Pandas:
    関係データベース(SQL データベース)のSQLite とPandas を連携して使用する方法についての講義
  • mongoDB:
    ドキュメント指向データベースである mongoDB を使用する方法についての講義
  • FeatureTools:
    特徴量抽出器である FeatureTools を使用する方法についての講義
  • PyCaret:
    モデルやパラメータを自動推定する機械学習方式 AutoML を実現したツール PyCaret を使用する方法についての講義
  • sktime:
    時系列データ分析をするためのツール sktime を使用する方法についての講義
  • spaCy:
    自然言語処理(テキストデータ処理)を行うツール spaCy を使用する方法についての講義
  • D3.js:
    Javascript でグラフを描画するツール D3.js を使用する方法についての講義
  • Plotly:
    Matplotlib よりも多様なグラフを描画できるツール Plotly を使用する方法についての講義
  • Tableau:
    データの分析・可視化する BI (Business Intelligent) ツール Tableau を使用する方法についての講義

実世界データ処理学

実世界データを扱う上で重要となる観点を分野・事業において主要な役割を果たしている方から学ぶことができます.データ倫理のような社会的必要性の高い講義や,ビジネスにおけるデータ分析の重要性に関する講義など多岐にわたる講義を用意しています.
  • データを扱う上での倫理:
    久木田 水生(名古屋大学)
  • 情報処理と法律問題~リクナビ事件を題材に~:
    小林 正啓(花水木法律事務所)
  • データを安全に活用するために:
    大須賀 智子(国立情報学研究所)
  • 実世界データ処理におけるデータセット・タグ付け:
    大谷 健登(名古屋大学)
  • デジタルイノベーション~データ活用がもたらすビジネスの未来~:
    石黒 不二代(ネットイヤーグループ(株))
  • 超スマート社会のデータサイエンティストを目指して〜オプティマインドのケーススタディ~:
    松下 健((株)オプティマンド)
  • 自ら学ぶ力が伸びる学習法に関する共同研究~「進研ゼミ」の学習履歴データを用いて~:
    佐藤 昭宏(ベネッセ教研)
  • 材料系・生産系のデータ:
    宇治原 徹(名古屋大学)
  • 医療情報の倫理や個人情報保護法の観点:
    飯島 祥彦(名古屋大学)
  • (自治体などの)行政データの扱い:
    遠藤 守(名古屋大学)
  • データと事業 クックパッドの場合:
    成田 一生(クックパッド(株))
  • ビジネス的観点からのE-commerce企業における機械学習活用:
    竹内 伸一(楽天(株))
  • 宇宙地球環境研究におけるデータ解析とハイパフォーマンスコンピューティング入門:
    三好 由純 梅田 隆行(名古屋大学)
  • 実世界データ処理学(企業におけるデータ活用のポイント等):
    増田 知彰(NTTコミュニケーションズ)
  • 因果推論:
    藤井 慶輔(名古屋大学)
  • トヨタ自動車におけるデータ解析のポイントと事例:
    福島 真太朗(トヨタ自動車株式会社)

ドメイン数理知識

より専門的に学ぶことをができるように,ドメインに関する数理的な講義も多数用意しています.ただデータ分析ができるだけでなく,より深くドメインを理解し,数理的に把握・表現できるようになるための事例を多数用意しています.全24講義用意しており,自信の専門性・興味に応じて選択的に受講できます.
  • 知能化車両のための実世界データ循環:
    武田 一哉(名古屋大学)
  • コンテンツ循環を目指した映像の自動再編集:
    井手 一郎(名古屋大学)
  • 自動運転社会のためのシナジックモビリティ:
    河口 信夫(名古屋大学)
  • 制約付き書換え帰納法によるプログラム検証:
    西田 直樹(名古屋大学)
  • 組合せ最適化に対する実践的アプローチ:
    柳浦 睦憲(名古屋大学)
  • 大規模構造化データの圧縮と直接操作:
    関 浩之(名古屋大学)
  • ビッグデータとデータベースシステム:
    石川 佳治(名古屋大学)
  • 3次元画像システム - 入力から表示まで:
    藤井 俊彰(名古屋大学)
  • インテリジェント医療機器の機械学習:
    森 健策(名古屋大学)
  • E-コーチングと共生インタラクション:
    間瀬 健二(名古屋大学)
  • ビルディングスケールのバーチャルリアリティ(VR):現実世界を拡張する別の方法:
    長尾 確(名古屋大学)
  • 個人データ循環のためのMyData:
    橋田 浩一(東京大学)
  • ヒトゲノムにおけるVariants of Unknown Significance (VUS) の予測モデル:
    大野 欽司(名古屋大学)
  • 医学の進歩における病理診断データと解析の重要性:
    榎本 篤(名古屋大学)
  • 頻度のまれな疾患関連ゲノム変異から始まる神経発達障害、自閉症スペクトラム障害、統合失調症における分子病態の解明:
    尾崎 紀夫(名古屋大学)
  • 医科学におけるウェットとドライ:
    高橋 隆(名古屋大学)
  • データ循環のための実世界テキスト -コンピューターによる自然言語理解:
    相澤 彰子(国立情報学研究所)
  • 車の使用に関するデータ収集と予測:
    稲垣 伸吉(名古屋大学)
  • 電動化モビリティとそのスマートグリッドへの影響の概要:
    鈴木 達也(名古屋大学)
  • データ循環に基づく道路環境認識:
    出口 大輔(名古屋大学)
  • 因果関係研究への回帰不連続アプローチ:
    安達 貴教(名古屋大学)
  • ソーシャルCPS:その概念と実証実験で得られた経験:
    安達 淳(国立情報学研究所)
  • 自動運転技術の価値創造:
    加藤 真平(東京大学)
  • 統計的検定における多重比較法について:
    古橋 武(名古屋大学)
  • 分析イメージング法を活用した生物素材の非破壊品質評価:
    馬 特(名古屋大学)
  • テスト理論に基づいたテスト作成・分析手法:
    坪田 彩乃(名古屋大学)
  • オイラーの多面体定理とホモロジー:
    若月 駿(名古屋大学)

プロジェクトマネジメント基礎

社会で実践的に活躍するために,プロジェクト管理における基本的な事項,分析結果などの提示方法(可視化、文書化、プレゼンテーション)について学べます.
  • WBS(Work Breakdown Structure)を用いた工程管理
  • 解析結果の可視化
  • 解析結果を文書化する技法
  • プレゼンテーション法

MDSAI認定制度応用基礎レベルスキルセットとの対応関係

文部科学省によるMDSAI教育プログラム認定制度「応用基礎レベル」のスキルセットと本プログラムで提供する講義の対応表です.本プログラムは,MDSAI教育プログラムの認定を受けているものではありませんので,あくまで参考までに御覧ください.
対応表内の表記:◯ = スキルを網羅している,△ = スキルを一部含んでいる
スキルセットの詳細については,以下のリンクからダウンロードされる資料の14-20頁をご参照下さい:
http://www.mi.u-tokyo.ac.jp/consortium/pdf/model_ouyoukiso.pdf
MDSAI認定制度応用基礎レベル
スキルセット
DS育成プログラム 全学教養講義
スキル
番号
スキル内容 ☆コア
※基盤
数理科学基礎 基本データツール 機械学習 実世界データ処理学 データツール パターン認識 ドメイン数理知識 プロジェクトマネジメント基礎 データ科学基礎
1 データサイエンス基礎
1-1 データ駆動型社会とデータサイエンス ☆II
1-2 分析設計 ☆II
1-3 データ観察
1-4 データ分析
1-5 データ可視化
1-6(1) 数学基礎
(確率・統計)
※I
1-6(2) 数学基礎
(線形代数)
※I
1-6(3) 数学基礎
(解析)
※I
1-7 アルゴリズム ※I
2 データエンジニアリング基礎
2-1 ビッグデータとデータエンジニアリング ☆II
2-2 データ表現 ☆I
2-3 データ収集
2-4 データベース
2-5 データ加工
2-6 ITセキュリティ
2-7 プログラミング基礎 ※I
3 AI基礎
3-1 AIの歴史と応用分野 ☆II
3-2 AIと社会 ☆II
3-3 機械学習の基礎と展望 ☆II
3-4 深層学習の基礎と展望 ☆II
3-5 認識
3-6 予測・判断
3-7 言語・知識
3-8 身体・運動
3-9 AIの構築と運用 ☆II