学部・大学院区分
Undergraduate / Graduate
情報学部
時間割コード
Registration Code
1000175
科目区分
Course Category
専門基礎科目(コンピュータ科学科 対象)
科目名 【日本語】
Course Title
データマイニング入門
科目名 【英語】
Course Title
Introduction of Data Mining
コースナンバリングコード
Course Numbering Code
SIS-03-2009-J
担当教員 【日本語】
Instructor
石川 佳治 ○
担当教員 【英語】
Instructor
ISHIKAWA Yoshiharu ○
単位数
Credits
1
開講期・開講時間帯
Term / Day / Period
春1期 水曜日 1時限
Spring1 Wed 1
対象学年
Year
2年
2
授業形態
Course style
講義
Lecture
開講系(学部)・開講専攻(大学院)
Subject
共通
必修・選択
Required / Selected
必修


授業の目的 【日本語】
Goals of the Course(JPN)
データの中から有用な知識を発見しようとするデータマイニングは,確率・統計,パターン認識・機械学習などを基盤として発展を続けている。本講義では,データマイニングへの入門として,R言語を用いた統計的データ分析の手法について学ぶ。RとR Studioについて紹介した後,回帰分析,判別分析,決定木,主成分分析,クラスター分析などの分析技術について演習をもとに学ぶ。Rに関する基本的な知識を身に付け,統計的データ分析への理解を深めることを目的とする。
授業の目的 【英語】
Goals of the Course
Data mining, which seeks to find useful knowledge from data, shows continual progress based on probability, statistics, pattern recognition, and machine learning. In this lecture, we will learn data mining methods using R language as an introduction to statistical data analysis. After an overview of R and R Studio, we study statistical analysis techniques such as regression analysis, discriminant analysis, decision trees, principal component analysis, and clustering using computer exercises. The purpose of this course is to acquire basic knowledge of R and to deepen understanding of statistical data analysis.
到達目標 【日本語】
Objectives of the Course(JPN)
第一の目的は,代表的なデータマイニング手法について,R言語を用いた演習によりその概要を把握することである。第二の目的は,R言語について,その利用環境なども含めて学ぶことにより,データサイエンスのためのシステム利用に関するリテラシーを身に着けることである。基礎的なデータマイニングの概念を理解し,R言語により分析に活用できることを到達目標とする。
到達目標 【英語】
Objectives of the Course
The first objective is to grasp an overview of typical data mining methods through exercises using the R language. The second objective is to acquire literacy in the use of systems for data science by learning the R language, including its usage environment. The goal is to understand basic data mining concepts and to be able to use the R language for analysis.
授業の内容や構成
Course Content / Plan
回帰分析,相関分析と検定,主成分分析,判別分析,決定木などについて基礎理論を解説すると共に, R言語を用いて分析の実習を行う。
1. RとRStudioについて
2. データの可視化と要約
3. 回帰分析:単回帰モデル
4. 回帰分析:重回帰モデル,ロジスティック回帰モデル
4. 判別分析
5. 決定木
6. 主成分分析
7. クラスター分析
8. まとめと評価
履修条件・関連する科目
Course Prerequisites and Related Courses
履修要件は課さない。ただし,演習室に定員があるため,定員をオーバーした場合は他学科からの履修者を受け付けない可能性がある。
成績評価の方法と基準
Course Evaluation Method and Criteria
講義ごとに与えるレポート課題をもとに評価する。A~Fの評定を行い、C以上を合格要件とする。
教科書・参考書
Textbook/Reference book
【教科書】
林 賢一(著),下平 英寿(編),Rで学ぶ統計的データ解析,講談社,2020年

【参考書】
必要に応じて授業中に指示する。
課外学習等(授業時間外学習の指示)
Study Load(Self-directed Learning Outside Course Hours)
講義で説明した内容の理解を深めるためのレポート課題を与える。
授業開講形態等
Lecture format, etc.
計算機室で実習しながらの講義となります。講義資料の共有やレポート提出のためNUCTを利用します。
遠隔授業(オンデマンド型)で行う場合の追加措置
Additional measures for remote class (on-demand class)
状況に依存するため、講義が始まる前にアナウンスします。