데이터 처리 기초 수료증

  • 모집인원999명

  • 학습기간2024-03-01 ~ 2024-12-31

로그인하시면 강좌에 등록할 수 있습니다.
강좌 소개

강의 소개 및 개요입니다.

성명

김화종

소속기관

강원대학교

과목명

데이터처리 기초

강의시간

10

학습목표

화합물 데이터를 머신러닝(AI 모델)에서 사용하기 위한 데이터 표현 방식의 이해

데이터의 표현형을 변경하는 데이터 전처리 및 탐색적 분석 실습

강의 선수과목 및 준비사항입니다.

선수과목

파이썬 프로그래밍 기초

참고자료

파이썬으로 배우는 머신러닝 – 김화종 저

준비사항

아나콘다 설치 및 쥬피터 노트북 실행

Keyword

데이터전처리

데이터프레임

시각화

탐색적분석

머신러닝

과정 소개

강의시간

강의내용

실습여부

1

머신러닝과 데이터 전처리 이해

- 머신러닝의 동작 원리 이해 및 구현 방법 소개

- 머신러닝 모델의 성능을 높이기 위해서 필요한 데이터 전처리의 이해

O

2

판다스와 넘파이 실습

데이터처리의 기본 도구인 데이터프레임을 이용한 데이터 처리 방법 습득

데이터프레임과 ndarray와의 변환 방법 습득

O

3

데이터 전처리 실습

- 결측치 처리, 이상치 처리, 스케일링 이해 및 실습

로그변환, 역수변환, 카테고리 변환 등 데이터 변환 실습

O

4

데이터 시각화 기법

matplotlib, seaborn, plotly 등 라이브러리 사용법

streamlit을 이용한 웹기반 시각화 기법

O

5

탐색적 분석

시각화를 이용한 데이터 탐색 방법 실습

통계적 특성 분석

O

6

특성 공학 이해 및 실습

특성 선택, 차원축소, PCA 이해 및 t-SNE를 이용한 시각화

특성 추가, polynomial 방법 습득

O

7

화합물 데이터 표현형 이해

1차원, 2차원, 3차원의 화합물 표현형의 이해

- SMILE, Fingerprint, mol, SDF 소개

O

8

클러스터링 이해

데이터 샘플의 유사도를 이용한 클러스터링 이해

화합물의 유사도를 이용한 클러스터링 이해

O

9

화합물 데이터 처리 라이브러리 실습

RDKit을 이용한 화합물 데이터 처리 및 특성 파악 방법 실습

DeepChem이 제공하는 데이터 처리 및 특성 파악 방법 실습

O

10

화합물 데이터베이스 이용법

공개 화합물 데이터베이스 PubChem 데이터 액세스 및 처리 방법 실습

ChEMBL 데이터를 프로그램에서 접근하는 방법 실습

O

분류
  • 주제
    파이썬프로그래밍
  • 분야
    인공지능 & 프로그래밍
  • 실습
    프로그래밍 (Python)
  • 활용 단계
    기타
교수자/개설자