본문 바로가기

반응형

┄┈┄  ┄┈┄

(100)
[코호트] * 코호트 - 특정 기간안에 하나 이상의 포함 기준에 속하는 사람의 집단 - '표현형(phenotype)'이라고도 함 *OHDSI에서의 코호트 정의 방식 - 한 사람은 여러개의 코호트에 속할 수도 있다. - 한 사람이 동일한 코호트에 여러 다른 기간에 걸쳐 속할 수도 있다. - 한 사람이 같은 기간에 동일한 코호트에 여러번 속하지 않을 수도 있다. - 코호트에는 0명 혹은 그 이상의 구성원을 가질 수도 있다. ex) 고혈압 치료 약물인 ACE inhibitor를 복용하기 시작한 사람 중에서 혈관성 부종이 일어날 위험을 예측하기 위한 연구. -> target cohort : ACE inhibitor를 복용하기 시작한 사람 -> outcome cohort : 혈관성 부종이 발생한 사람 * 규칙 기반 코호트(..
[유전체 분석] 3. Proteomics / Protein analysis 01. 왜 단백질을 연구해야하나? - 단백질의 변화는 DNA, RNA만 가지고는 예측/설명하기 힘듦 - (ex. 애벌레 -> 나비) DNA는 동일한데, 전혀 다른 phenotype(표현형)으로 나타나지는 경우 발생 - 따라서 단백질을 분석하면서, 이러한 현상들에 있어 어떤 일들이 일어난 건지 직접적으로 알 수 있음 02. Proteomics - 단백질을 연구하는 것 - 전체 단백질에 대해, 어떤 단백질이 있는지, 양적으로 어떻게 변화하는지, 단백질의 구조가 어떻게 되는지, 단백질이 기능적으로 어떻게 변화하는지를 개체/소기관 레벨에서 연구하는 것 - 시간 / 공간 / 생리학적 변화에 따라서 단백질의 특징들이 어떻게 변화하는지 연구하는 것 03. Protein연구가 힘든 이유 1) Protein dynami..
[유전체 분석] 2. RNA-sequencing 01. RNA-sequencing - NGS기술로 샘플에서 발현되는 RNA 서열을 시퀀싱 - RNA-seq를 통해 어떤 유전자가 활성화되어 있고, 많이 전사되는지 알 수 있음 02. Mutation(돌연변이) 1) Passenger mutation - mutation의 대부분은 passenger mutation - mutation이 있어도 positive selection이 안 됨 - 세포가 증식하는데 아무 도움이 안됨 2) Driver mutation - 일부만 driver mutation - 실제 암세포를 증식시키는 역할 - 암의 phenotype(표현형, 기능적 형질)을 결정짓는 mutation - 이 driver mutation이 신체의 어느 부위에 생겼냐에 따라서 암의 이름이 달라지는 것 *mu..
[유전체 분석] 1. Next Generation Sequencing (NGS) 01. 생물정보학 주요 분야 1) 유전체학(Genomics) - 개체의 전체 유전 정보 연구 - DNA염기 서열 및 유전자 발현을 분석하여 유전자의 기능과 조절 연구 2) 단백체학(Proteomics) - 전체 단백질의 조성 / 기능 / 단백질 간의 상호작용, 단백질의 조절 연구 3) 시스템생물학(Systems biology) - 생물학적 시스템을 전체적으로 이해 - 여러 생물학적 구성 요소간의 상호작용 및 네트워크 연구 4) 구조생물학(Structural biology) - 단백질간의 구조 (ex. 어떤 부분 / 구조에서 상호작용되는지 보는 것) 5) 진화생물학(Evolutionary biology) - 생물 다양성과 진화 과정을 연구하여 생물의 종류와 형태의 변화를 이해하고 설명 02. Next Ge..
Regularization(정규화/규제화) 기법 - Ridge(L2 norm) / LASSO(L1 norm) 00. What is a good model? '좋은 모델'이란 다음과 같은 조건을 만족시켜야 한다. 1) 학습 성능이 좋은 모델 - 즉, 현재 데이터(train set)를 잘 설명하는 모델 - train set에 대한 에러가 적은 모델 - training error를 최소화하는 모델 2) 일반화 성능이 좋은 모델 - 미래 데이터(test set)에 대한 예측 성능이 좋은 모델 - 학습에 사용되지 않은 새로운 데이터(test data)에 대한 예측 성능이 좋은 모델 여기서 둘 중 하나만 만족시킨다고 좋은 모델은 아니고, 1번과 2번을 적절하게 잘 만족시켜야 좋은 모델이라고 할 수 있다. 01. Bias와 Variance Expected MSE : 실제 y값과 모델이 예측한 y값의 차이의 제곱에 대한 기댓..

반응형