단백질 언어 모델을 활용한 컨텍트 예측 수료증

  • 모집인원999명

  • 학습기간2024-03-01 ~ 2024-12-31

로그인하시면 강좌에 등록할 수 있습니다.
강좌 소개

강의 소개 및 개요입니다.

성명

김재훈

소속기관

카카오브레인

과목명

단백질 언어 모델을 활용한 컨텍트 예측

강의시간

2시간

학습목표

Pre-training 개념을 이해한다.

단백질 서열 데이터를 전처리하여 딥러닝 언어 모델에 학습시킬 수 있다.

학습된 결과를 예측모델에 적용할 수 있다.

 

강의 선수과목 및 준비사항입니다.

선수과목

Python

참고자료

논문: Biological structure and function emerge from scaling unsupervised learning to

250 million protein sequences

준비사항

Jupyter notebook 환경

과정 소개

단백질 언어 모델을 활용한 컨텍트 예측 강의 과정입니다.

1

일반적 언어 모델에서 Pre-training의 의미

단백질 언어 모델 내의 embedding이 가지는 의미: co-evolution

Contact prediction task에 적용하기

2

Huggingface API 이용 단백질 언어 모델 생성

Masked 언어 모델 학습 코드 작성

Contact prediction task에 적용 코드 작성

분류
  • 주제
    단백질구조
  • 분야
    생물학 & 생물정보학
  • 실습
    프로그래밍 (Python)
  • 활용 단계
    Drug Discovery
교수자/개설자