독성예측인공지능 모델 활용 수료증
모집인원999명
학습기간2024-03-01 ~ 2024-12-31
강의 소개 및 개요입니다.
성명 |
신현길 |
소속기관 |
안전성평가연구소 |
과목명 |
독성 예측 인공지능 모델 활용 |
강의시간 |
6시간 |
학습목표 |
1. 무료로 사용 가능한 독성 예측 프로그램 설치 및 활용 방법 익히기 2. python을 이용한 데이터 분석 및 처리 방법 익히기 3. 예측 모델 개발을 위한 python 코드 완성해보기 |
강의 선수과목 및 준비사항입니다.
선수과목 |
파이썬 프로그래밍 기초(2-5강), 화학정보학개론, QSAR, RDKit의 기초와 이를 이용한 화학정보학 실습 |
참고자료 |
RDKit의 기초와 이를 이용한 화학정보학 실습 [강사 강원대학교 이주용] 1. 컴퓨터를 이용한 신약 개발 방법론 https://www.ibric.org/myboard/list.php?Board=news&Page-2&&PARA3-21) 2. pubchempy (https://pubchempy.readthedocs.io/en/latest/) 3. openbabel 파이썬 모듈 http://openbabel.org/wiki/python) 참고자료 4. MOPAC 홈페이지 (http://openmopac.net/) 5. Chembl 데이터베이스 (https://www.ebi.ac.uk/chembin 6. binding DB (https://www.bindingdb.org/rwd/bind/index.jsp) 7. DILIrank 미국 FDA에서 정리한 데이터 베이스 (classificaion 모델 개발용 데이터) https://www.fda.gov/science-research/liver-toxicity-knowledge-base-ltkb/drug-induced-liver-in jury-rank-cdilirank-dataset) |
준비사항 |
아나콘다 파이썬으로 진행(아나콘다 파이썬이 아닌 경우 pandas, matplotilb, sci-kit learn 모듈 추가 설치 필요) 아나콘다 파이썬에서 추가 설치가 필요한 모듈 (pubchempy, mopac, openbabel, joblib) 아나콘다에서 제공하는 spyder 사용방법 숙지(다른 IDE 호라용해도 문제 X) text editor 프로그램(Atom, Sublime 등) binding DB 데이터 활용을 위한 홈페이지 가입 필요 |
독성 예측 인공지능 모델 활용 강의 과정입니다.
1 |
독성 예측 인공지능 모델 활용 분야 1. 현재 활용되고 있는 독성 예측 인공지능 모델 현황 -기계 학습 모델 사례 딥러닝 모델 사례 독성 예측 모델 활용과 연관된 규제 소개 2. 사용 가능한 독성 예측 소프트웨어 웹 프로그램 Danish QSAR Database, ProTox-ll ToxSTAR. (약물 대사 예측 Xenosite, SmartCYP) GUE VEGA, OECD (SAR Toolbox. 미국 환경청 (EPI suite & test) |
2 |
데이터 전처리 (python 코드 제공) 1. Pandas를 이용한 데이터 분석 데이터 분석 및 모델 개발을 위해서 pandas에서 자주 사용하는 함수 정리. 2. CHEMBL 데이터 전처리 방법 -ChEMBL 데이터 활용 방법 동일한 구조에서 실험값이 다른 경우 처리 방법 실험 값 단위 환산의 중요성 3. Binding DB 데이터 전처리 방법 Binding DB 활용 방법 sdr 파일에서 원하는 구조만 선별하기 |
3 |
데이터 구조 준비 자동화 (python 코드 제공) 1. Pubchempy를 이용한 구조 다운로드 - DILUrank 데이터에서 약물 이름으로 구조 다운 받기 -Pubchempy에서 다운받은 데이터 이해하기 2. Python에서 구조 파일 형식 변환하기 (OpenBabel) -다양한 분자 구조 파일 형태로 전환하기 3. MOPAC을 이용한 양자 descriptor 계산 |
4 |
양자 재산을 위한 input 준비 자동화 -양자 계산 결과 output parsing 방법 구조 분포 시각화 (python 코드 제공) 1. Matplotlib을 이용한 구조 분포 시각화 - scatter plot, bar plot 그려보기 2. PCA를 활용한 구조 분포 시각화 -다차원 데이터를 이용한 구조 분포 비교 분석
|
5 |
개발된 예측 모델 활용 방법 (python 코드 제공) 1. 개발된 예측 모델 저장 방법 scilat-leam을 이용한 모델 개발 과정 -개발한 모델 저장하기 (joblib) 2 개발된 모델 활용하기 (classification model) 3. 개발된 모델 활용하기 (Regression model) -input을 준비할 때 조심해야 하는 부분 모델 파일 불러와서 예측하기 |
6 |
의미 있는 독성 예측 1. 의미 있는 데이터 2 의미 있는 descriptor 3. OECD QSAR validation guideline 4. 적용 범위 분석 5. 독성 예측 소프트웨어 개발 필요성 (model deployment) |