데이터 처리 기초 수료증
모집인원999명
학습기간2024-03-01 ~ 2025-12-31
강의 소개 및 개요입니다.
성명 |
김화종 |
소속기관 |
강원대학교 |
과목명 |
데이터처리 기초 |
강의시간 |
10 |
학습목표 |
화합물 데이터를 머신러닝(AI 모델)에서 사용하기 위한 데이터 표현 방식의 이해 데이터의 표현형을 변경하는 데이터 전처리 및 탐색적 분석 실습 |
강의 선수과목 및 준비사항입니다.
선수과목 |
파이썬 프로그래밍 기초 |
||||
참고자료 |
파이썬으로 배우는 머신러닝 – 김화종 저 |
||||
준비사항 |
아나콘다 설치 및 쥬피터 노트북 실행 |
||||
Keyword |
데이터전처리 |
데이터프레임 |
시각화 |
탐색적분석 |
머신러닝 |
강의시간 |
강의내용 |
실습여부 |
1 |
머신러닝과 데이터 전처리 이해 - 머신러닝의 동작 원리 이해 및 구현 방법 소개 - 머신러닝 모델의 성능을 높이기 위해서 필요한 데이터 전처리의 이해 |
O |
2 |
판다스와 넘파이 실습 데이터처리의 기본 도구인 데이터프레임을 이용한 데이터 처리 방법 습득 데이터프레임과 ndarray와의 변환 방법 습득 |
O |
3 |
데이터 전처리 실습 - 결측치 처리, 이상치 처리, 스케일링 이해 및 실습 로그변환, 역수변환, 카테고리 변환 등 데이터 변환 실습 |
O |
4 |
데이터 시각화 기법 matplotlib, seaborn, plotly 등 라이브러리 사용법 streamlit을 이용한 웹기반 시각화 기법 |
O |
5 |
탐색적 분석 시각화를 이용한 데이터 탐색 방법 실습 통계적 특성 분석 |
O |
6 |
특성 공학 이해 및 실습 특성 선택, 차원축소, PCA 이해 및 t-SNE를 이용한 시각화 특성 추가, polynomial 방법 습득 |
O |
7 |
화합물 데이터 표현형 이해 1차원, 2차원, 3차원의 화합물 표현형의 이해 - SMILE, Fingerprint, mol, SDF 소개 |
O |
8 |
클러스터링 이해 데이터 샘플의 유사도를 이용한 클러스터링 이해 화합물의 유사도를 이용한 클러스터링 이해 |
O |
9 |
화합물 데이터 처리 라이브러리 실습 RDKit을 이용한 화합물 데이터 처리 및 특성 파악 방법 실습 DeepChem이 제공하는 데이터 처리 및 특성 파악 방법 실습 |
O |
10 |
화합물 데이터베이스 이용법 공개 화합물 데이터베이스 PubChem 데이터 액세스 및 처리 방법 실습 ChEMBL 데이터를 프로그램에서 접근하는 방법 실습 |
O |