学部・大学院区分情報・博前
時間割コード2560081
科目区分
主専攻科目
科目名 【日本語】データアナリティクス1
科目名 【英語】
コースナンバリングコードGSI166025J
担当教員 【日本語】石川 佳治 ○ 武田 浩一 笹野 遼平
担当教員 【英語】ISHIKAWA Yoshiharu ○ TAKEDA Koichi SASANO Ryohei
単位数1
開講期・開講時間帯春1期 木曜日 2時限
Spring1 Thu 2
対象学年1年
1
授業形態
開講系(学部)・開講専攻(大学院)
知能システム学専攻
必修・選択


授業の目的 【日本語】
データアナリティクスは,大規模なデータの高度な分析を意味しており,データから有益な知識を抽出し,行動指針の策定などに役立てることを目指している。本講義では,データアナリティクスの中心的話題であるデータマイニングの主要な手法について,歴史的・技術的背景と最新の研究動向を含め学ぶ。
授業の目的 【英語】
Data analytics means an advanced analysis of large-scale data. It aims to extract useful knowledge from the data and use it for formulating action guidelines. In this course, from the viewpoint of data engineering, we will learn major methods of data mining including historical and technical backgrounds and latest research trends.
到達目標 【日本語】
データマイニングおよび関連する技術に関する基本的な知識を身に着けることを目的とする。講義した内容について深く理解し,具体的に説明できることを到達目標とする。
到達目標 【英語】
The objective is to acquire basic knowledge about data mining and related technologies. The goal is to have a deep understanding of the contents of the lecture and to be able to explain it concretely.
授業の内容や構成
本講義では,データ工学の領域におけるデータマイニングについて導入を行う。具体的には,代表的なマイニング技術である,相関ルールマイニング,クラスタリング,分類などについて,主要な手法と,目的に特化した先進的手法について解説する。また,テキストマイニング,統計的仮説検定などの関連するトピックについても紹介する。必要に応じて,講義内で演習の時間を設ける。

0. イントロダクション
1. 相関ルールマイニングの基礎
2. 相関ルールマイニングの発展
3. シーケンスマイニング
4. クラスタリングの基礎
5. クラスタリングの応用・発展
6. データの分類:決定木
7. テキストマイニング
8. 統計的仮説検定
This course introduces data mining from the viewpoint of data engineering. Popular methods and advanced methods specialized for purpose are explained. Specifically, association rule mining, clustering, and data classification are covered. In addition, text mining and statistical hypothesis testing are explained. As necessary, exercises are assigned in the classroom.

0. Introduction
1. Foundations of Association Rule Mining
2. Advanced Association Rule Mining
3. Sequence Mining
4. Foundations of Clustering
5. Advanced Clustering Methods
6. Data Classification: Decition Trees
7. Text Mining
8. Statistical Hypothesis Testing
履修条件・関連する科目
成績評価の方法と基準
課題およびレポートにより評価し,合計100点満点で60点以上を合格とする。
Evaluation is based on exercies and reports. The total score more than or equal to 60 points in 100 points is evaluated as passed.
教科書・参考書
教科書は特にない。参考文献は講義の中で紹介する。必要に応じて講義資料を配布する。コンピュータサイエンスおよび数学(線形代数,確率・統計など)に関する知識を前提とする。
There is no textbook. References will be introduced in the lecture. If necessary, lecture materials are distributed in the classroom. Knowledge of computer science and mathematics (linear algebra, probability, statistics, etc.) is assumed.
課外学習等(授業時間外学習の指示)
講義において説明した手法・理論を理解するための課題を与える。また,次回の講義について事前に予備調査を指示する。
Exercises and reports are assigned to understand methods and theories explained in the class. In addition, a preliminary survey will be ordered in advance for the next lecture.
授業開講形態等
遠隔授業(オンデマンド型)で行う場合の追加措置