授業の目的 【日本語】 Goals of the Course(JPN) | | 近年のライフサイエンスの研究は、計測装置や評価技術の高度化に伴い、爆発的な量のデータが生産されることが当たり前の時代に突入しています。少し前の時代に「一つ一つの遺伝子」を理解することに挑戦していた生命科学は、今では体内で動く全ての遺伝子を計測し、生命システムそのものを理解しよう、という挑戦に取り組みつつあります。言い換えれば、生命科学の研究者が、バイオを深く研究しようとすればするほど、大量の情報と向き合う必要が出てきているのです。 また、化学においても、近年は反応の理解やデザインを行うための高度な構造計算を行うことが容易になりつつあります。コンピュータ解析の支援を得て、いかに効率的な研究を実施することができるかは、実用化研究などでは必須のスキルとされるようになってきているのです。 しかし多くの現場では、生物学・化学の「実験を得意とする」研究者は、データ解析に苦手意識を持っています。結果、自らが設計し、実験したデータの多くを、情報処理の専門家に丸投げしてしまうことが多いのです。これは、実験・計測の途中で得られた知見や発見、実験者ならではのひらめきを切り捨てて、味気ない数字情報へと意味を薄めてしまう行為とも考えることができます。そしてこのような生物・化学のデータサイエンスからの乖離は、本質的なライフサイエンスの発見の障壁となっているのです。 このため、今後の化学・生命を推進するには、自らのデータを、自らのひらめきとつなぎ合わせるデータの分析・理解の能力が重要になります。生物や化学から生まれる「データ」を理解するための基礎的技能を身につけることができれば、複雑なライフサイエンスの問題解決の大きな力となります。特に工学系の研究者に求められることは、他の生命系・化学系の専門性と異なるエンジニアリングのマインドによるデータの理解です。 本講義では、生物学・化学などの情報学以外をバックグラウンドとする学生を対象とし、ライフサイエンスから得られる複雑なデータを工学的な視点から分析・理解するデータサイエンスの基礎的知識とセンスを学ぶことを目指します。データサイエンスの基礎を平易な言葉で解説すると共に、ディスカッション・質疑の形で考察する力を養います。 (注:本講義は、プログラミングスキルの習得や向上、プログラミング言語の指導は行いません。すなわち、事前の数学的素養やプログラミング能力等は不要です。本講義は、データサイエンスの必要性を理解し、その後の自らの技術アップを目指すための基礎を作るための講義です。このため、講義では実例の紹介とこれに基づく議論・討論を中心とし、データについて考える作業を中心とします。) |
|
|
授業の目的 【英語】 Goals of the Course | | In recent life science researches, explosive quantity of "data" is being produced by the advances of measurement instruments and assay systems. The research styles in life sciences that had been struggling with the exploration of single gene-related mechanisms had been drastically changed to explore the systematic mechanism of whole expression profiles. As a result, biologists now have to process massive amount of data to further interpret the biology. In chemistry, it is also a trend to handle massive database of molecular structures to interpret or design the reactions by computer assisted approaches. Therefore, the active usage of data analysis is now a key skill to design efficient experiments. However, in common, biologists and chemists are not amused by computer assisted data analysis. Therefore, as a fact, in many researches, the precious and live data obtained by biologists and chemists are passed to the information professionals before "understanding the data". This is almost throwing out the inspirations and clues obtained through the experiment, and frequently cause trouble in understanding the complex analysis results. Therefore, to further lead the next generation life sciences, researchers are strongly required to understand, interpret, and connect their own data with their original inspirations and ideas. Especially for researchers with engineering background, the "original aspect of engineering mind" that makes them differ from other faculty professionals is important to play their professional role. This lecture aims to support students whose background is biology/chemistry (outside of information science) to learn the basics of data science to analysis and interpret the life science related data by engineering minded aspect. (Note: This lecture is not designed to teach programming language or skills. This is the lecture to understand the importance of data science in life science, and educate the basic sense for further skill up by own effort. Therefore, this lecture focus on discussion and debate, and spare more time for thinking about the data). |
|
|
到達目標 【日本語】 Objectives of the Course(JPN)) | | 近年のライフサイエンスの研究は、計測装置や評価技術の高度化に伴い、爆発的な量のデータが生産されることが当たり前の時代に突入しています。少し前の時代に「一つ一つの遺伝子」を理解することに挑戦していた生命科学は、今では体内で動く全ての遺伝子を計測し、生命システムそのものを理解しよう、という挑戦に取り組みつつあります。言い換えれば、生命科学の研究者が、バイオを深く研究しようとすればするほど、大量の情報と向き合う必要が出てきているのです。 また、化学においても、近年は反応の理解やデザインを行うための高度な構造計算を行うことが容易になりつつあります。コンピュータ解析の支援を得て、いかに効率的な研究を実施することができるかは、実用化研究などでは必須のスキルとされるようになってきているのです。 しかし多くの現場では、生物学・化学の「実験を得意とする」研究者は、データ解析に苦手意識を持っています。結果、自らが設計し、実験したデータの多くを、情報処理の専門家に丸投げしてしまうことが多いのです。これは、実験・計測の途中で得られた知見や発見、実験者ならではのひらめきを切り捨てて、味気ない数字情報へと意味を薄めてしまう行為とも考えることができます。そしてこのような生物・化学のデータサイエンスからの乖離は、本質的なライフサイエンスの発見の障壁となっているのです。 このため、今後の化学・生命を推進するには、自らのデータを、自らのひらめきとつなぎ合わせるデータの分析・理解の能力が重要になります。生物や化学から生まれる「データ」を理解するための基礎的技能を身につけることができれば、複雑なライフサイエンスの問題解決の大きな力となります。特に工学系の研究者に求められることは、他の生命系・化学系の専門性と異なるエンジニアリングのマインドによるデータの理解です。 本講義では、生物学・化学などの情報学以外をバックグラウンドとする学生を対象とし、ライフサイエンスから得られる複雑なデータを工学的な視点から分析・理解するデータサイエンスの基礎的知識とセンスを学ぶことを目指します。データサイエンスの基礎を平易な言葉で解説すると共に、ディスカッション・質疑の形で考察する力を養います。 (注:本講義は、プログラミングスキルの習得や向上、プログラミング言語の指導は行いません。すなわち、事前の数学的素養やプログラミング能力等は不要です。本講義は、データサイエンスの必要性を理解し、その後の自らの技術アップを目指すための基礎を作るための講義です。このため、講義では実例の紹介とこれに基づく議論・討論を中心とし、データについて考える作業を中心とします。) |
|
|
到達目標 【英語】 Objectives of the Course | | In recent life science researches, explosive quantity of "data" is being produced by the advances of measurement instruments and assay systems. The research styles in life sciences that had been struggling with the exploration of single gene-related mechanisms had been drastically changed to explore the systematic mechanism of whole expression profiles. As a result, biologists now have to process massive amount of data to further interpret the biology. In chemistry, it is also a trend to handle massive database of molecular structures to interpret or design the reactions by computer assisted approaches. Therefore, the active usage of data analysis is now a key skill to design efficient experiments. However, in common, biologists and chemists are not amused by computer assisted data analysis. Therefore, as a fact, in many researches, the precious and live data obtained by biologists and chemists are passed to the information professionals before "understanding the data". This is almost throwing out the inspirations and clues obtained through the experiment, and frequently cause trouble in understanding the complex analysis results. Therefore, to further lead the next generation life sciences, researchers are strongly required to understand, interpret, and connect their own data with their original inspirations and ideas. Especially for researchers with engineering background, the "original aspect of engineering mind" that makes them differ from other faculty professionals is important to play their professional role. This lecture aims to support students whose background is biology/chemistry (outside of information science) to learn the basics of data science to analysis and interpret the life science related data by engineering minded aspect. (Note: This lecture is not designed to teach programming language or skills. This is the lecture to understand the importance of data science in life science, and educate the basic sense for further skill up by own effort. Therefore, this lecture focus on discussion and debate, and spare more time for thinking about the data). |
|
|
バックグラウンドとなる科目【日本語】 Prerequisite Subjects | | 生命科学に関連した科目: 分子生物学、生物工学、生化学、分析科学、等 |
|
|
バックグラウンドとなる科目【英語】 Prerequisite Subjects | | Life science related subjects: Molecular Biology, Bioengineering, Biochemistry, Analytical chemistry, etc. |
|
|
授業の内容【日本語】 Course Content | | 本講義では、生物学・化学などの情報学以外をバックグラウンドとする学生を対象とし、極めて平易な言葉と図解により、データサイエンスの基礎と概念を学ぶ。
データサイエンスの基礎として、データサイエンスが必要とされる社会的バックグラウンドの理解、データを生み出す技術および課題の理解を深く行った後、実際のデータサイエンスで必要な解析概念の習得を「データ」「解析法」の両面から進める。
また、3回の課題提出を通じて、講義を経て得た知識を実感的な理解へとつなげ、その講評・ディスカッションを経て、理解を深めることを目指す。
講義内容の配分については初日にガイダンスを行うが、下記に示す項目の学習を進める。
・イントロダクション ・データサイエンス概論(データサイエンスに求められること) ・データサイエンス概論(データと情報) ・ライフサイエンスデータの計測・評価技術1(基礎技術) ・ライフサイエンスデータの計測・評価技術2(先端技術) ・ライフサイエンスデータの計測・評価技術3(先端技術) ・データを作る1(実験デザイン) ・データを作る2(実験デザイン) ・データを作る3(ノイズ・バイアスへの対応) ・情報解析(統計的アプローチ) ・情報解析(機械学習的アプローチ)
合計3回、課題(レポート)の提出と、この講評の日を設けます。 課題講評の日には、選抜された課題をもとにそのアプローチの 長所・欠点についてディスカッションを行い、理解を深めます。
|
|
|
授業の内容【英語】 Course Content | | This lecture is designed for students whose background in biology/chemistry (outside the information science) and will be presented with simple and basic language and illustration to learn the basics of data science.
The lecture is designed to learn the requirements for data science in society, issues in the technology which creates data, and the actual data science basics (data preparation and analysis) as basics for data science.
This lecture requires three times of "report and discussion" day, to collect the knowledge from the lecture and bridge it to deeper understanding.
The detailed lecture schedule will be announced on the first day of lecture.
・Introduction ・Data scicence basics (Requirements for data science) ・Data science basics (Data and information) ・Technologies for life science data1(Conventional) ・Technologies for life science data2 (Advanced) ・Technologies for life science data3 (Advanced) ・Making data1 (Experimental design) ・Making data2 (Experimental design) ・Making data3(Noise and Bias control) ・Analysis (Statistical approach) ・Analysis (Machine learning approach)
Three times of report submissions are required for the lecture. By commenting and discussion on the report, the lecture aims to connect the knowledge to understanding. |
|
|
成績評価の方法と基準【日本語】 Course Evaluation Method and Criteria | | レポート50%、通常授業での質疑応答50%の総合評価により、目標達成度を評価する。 100点満点で60点以上を合格とする。 質疑を持って講義に参加することを重視する。3回以上の欠席者は「欠席」とする。 履修取り下げ制度を採用する。
<2019年度までの入学者> 100~90点:S,89~80点:A,79~70点:B,69~60点:C,59点以下:F <2020年度以降の入学者> 100~95点:A+,94~80点:A,79~70点:B,69~65点:C,64~60点:C-,59点以下:F |
|
|
成績評価の方法と基準【英語】 Course Evaluation Method and Criteria | | Students are evaluated totally by "report 50%", "Q&A discussion 50%". Score 60 in total score 100 is required to pass the lecture. Students are required to attend the lecture with questions. Students who skipped the lecture more than 3 times are regarded as "absent". Students can decline the lecture registration. For further detail, contact the lecturer. |
|
|
履修条件・注意事項【日本語】 Course Prerequisites / Notes | | 基本的には対面での講義を実施します。社会情勢によっては、Teamsなどの沿革(同時双方向型)授業を行う可能性もあるので、初日のガイダンスおよびNUCTにおける通知を確認してください。 教員への質問は、NUCT機能「メッセージ」により行ってください。どうしても急ぎの場合などにだけ下記の講師への直接メールを利用してください。 授業に関する受講学生間の意見交換は、NUCT機能「メッセージ」により行ってください。 |
|
|
履修条件・注意事項【英語】 Course Prerequisites / Notes | | Basically, the lecture is held face-to-face in the classroom. However, considering the social circumstances, online simultaneous interactive lectures (ex. Teams) can be a choice. Therefore, please carefully confirm the schedule at the introduction, and also at the NUCT announcements. Questions to the lecturer are welcome with NUCT "message" function. If it is urgent, direct mail is possible. The opinion exchange and discussion about the lecture should be done with NUCT "message" function. |
|
|
教科書【日本語】 Textbook | | 特になし。 必要に応じて参考ウェブページなどを紹介する。 |
|
|
教科書【英語】 Textbook | | Support web materials will be suggested if necessary. |
|
|
参考書【日本語】 Reference Book | | 書籍名 図解でわかる多変量解析: データの山から本質を見抜く科学的分析ツール 著者 涌井良幸 出版社 日本実業出版社, 2001 ISBN 4534031858, 9784534031853
書籍名 図解でわかる統計解析: データの見方・取り方から回帰分析・多変量解析まで 著者 前野昌弘, 三国彰 出版社 日本実業出版社, 2000 ISBN 4534030363, 9784534030368 |
|
|
参考書【英語】 Reference Book | | Related books are only in Japanese. For further assistance, contact the lecturer. |
|
|
授業時間外学習の指示【日本語】 Self-directed Learning Outside Course Hours | | ・授業終了時に示す課題についてレポートを作成すること。 ・授業中に紹介した参照HPや動画情報などを確認すること。 |
|
|
授業時間外学習の指示【英語】 Self-directed Learning Outside Course Hours | | Prepare a report on the assignment shown at the end of the class. Check the reference websites and video information introduced in the class. |
|
|
使用言語【英語】 Language used | | |
|
使用言語【日本語】 Language used | | |
|
授業開講形態等【日本語】 Lecture format, etc. | | |
|
授業開講形態等【英語】 Lecture format, etc. | | Basically, the lecture is held face-to-face in the classroom. |
|
|
遠隔授業(オンデマンド型)で行う場合の追加措置【日本語】 Additional measures for remote class (on-demand class) | | |
|
遠隔授業(オンデマンド型)で行う場合の追加措置【英語】 Additional measures for remote class (on-demand class) | | |
|