学部・大学院区分
Undergraduate / Graduate
理・博後
時間割コード
Registration Code
4600020
科目区分
Course Category
データサイエンス科目群
Data Science Classes
科目名 【日本語】
Course Title
機械学習概論D
科目名 【英語】
Course Title
Introduction to Machine Learning D
コースナンバリングコード
Course Numbering Code
担当教員 【日本語】
Instructor
竹内 努 ○
担当教員 【英語】
Instructor
TAKEUCHI Tsutomu ○
単位数
Credits
1
開講期・開講時間帯
Term / Day / Period
通年集中(春秋) その他 その他
Full-year course Intensive(Sp-Fa) Other Other
授業形態
Course style
講義
Lecture
学科・専攻
Department / Program
理学研究科素粒子宇宙物理学専攻
必修・選択
Required / Selected
選択


授業の目的 【日本語】
Goals of the Course(JPN)
機械学習の問題意識と問題設定を理解し,いくつかの問題設定に対する代表的な手法を,その理論的背景から学ぶ.
授業の目的 【英語】
Goals of the Course
To understand the problem awareness and problem setting of machine learning, and learn typical methods for some problem setting from the theoretical background.
到達目標 【日本語】
Objectives of the Course(JPN))
機械学習の代表的な問題設定を知り,それらに対する適切なアプローチを選択して自身の持つ問題に適用できるようになる.
到達目標 【英語】
Objectives of the Course
Students will be able to know typical problem settings of machine learning, select an appropriate approach to them, and apply them to your own problems.
授業の内容や構成
Course Content / Plan
1.機械学習のオーバービュー
「機械学習」として研究されている課題を概観し,本講義で扱う内容と扱わない内容を説明する.特に,問題設定による手法群の分類を強調する.

2.教師なし手法
データからの構造抽出のための代表的手法であるクラスタリングと密度推定について説明する.

3.アンサンブル法
主に教師あり学習(判別,回帰問題)のためのアンサンブル法を概説する.多数の予測器の組み合わせで予測性能が向上する理由と,様々なアンサンブル法のアイディアを述べ,特徴選択や結果の解釈性に関する議論をする.

4.様々な問題設定
能動学習,ベイズ最適化,転移学習といった発展的な話題を概説する.

5.統計的学習理論
機械学習アルゴリズムの良さは汎化性能(汎化誤差,generalization error)として定量化される.汎化性能に関する色々な疑問に理論的に答えるのが,統計的学習理論である.具体的には,データを増やすとどれだけ性能向上が期待できるか?そもそも学習データで最適化した予測器がなぜテストデータに「使える」のか?といった問に,理論的な観点から回答する.

6.談話会
講義で取り上げた話題を中心に,諸問題への機械学習の適用可能性を受講者とディスカッションをして理解を深める.


1. Machine learning overview
We will give an overview of the tasks being studied as "machine learning" and explain what is covered and what is not covered in this lecture. In particular, we emphasize the classification of method groups by problem setting.

2. Unsupervised method
Clustering and density estimation, which are typical methods for structural extraction from data, will be explained.

3. Ensemble method
It mainly outlines the ensemble method for supervised learning (discrimination, regression problem). The reason why the prediction performance is improved by the combination of many predictors, the idea of ​​various ensemble methods, and the feature selection and the interpretability of the result are discussed.

4. Various problem settings
It outlines advanced topics such as active learning, Bayesian optimization, and transfer learning.

5. Statistical learning theory
The goodness of machine learning algorithms is quantified as generalization performance (generalization error). Statistical learning theory answers various questions about generalization performance theoretically. Specifically, how much performance improvement can be expected by increasing the data? Why can a predictor optimized with training data be "usable" for test data in the first place? Answer such questions from a theoretical point of view.

6. Discourse
Focusing on the topics taken up in the lecture, we will discuss with the students the applicability of machine learning to various problems and deepen their understanding.
履修条件
Course Prerequisites
学部の微積分、線形代数
関連する科目
Related Courses
特になし
成績評価の方法と基準
Course Evaluation Method and Criteria
レポートを課して評価する。60点以上を合格とする。
By a report. Criterion is 60/100.
教科書・テキスト
Textbook
講義中に配布。


Distributed during the lecture.
参考書
Reference Book
講義中に指示。

Indicated during the lecture.
課外学習等(授業時間外学習の指示)
Study Load(Self-directed Learning Outside Course Hours)
講義後1時間程度の復習。
注意事項
Notice for Students
他学科聴講の可否
Propriety of Other department student's attendance
他学科聴講の条件
Conditions of Other department student's attendance
学部の微積分、線形代数。
レベル
Level
キーワード
Keyword
履修の際のアドバイス
Advice
授業開講形態等
Lecture format, etc.
ハイブリッドを予定
遠隔授業(オンデマンド型)で行う場合の追加措置
Additional measures for remote class (on-demand class)