본문 바로가기

바이오 데이터/유전체 분석5

Microarray 데이터 전처리(RMA) 전처리가 필요한 이유 2-color Micro array에서 발현량을 signal로 비교한다. 이때 background 효과를 제거, normalization 이 필요하고 형광 signal 값을 발현량 값으로 변환이 필요하다. RMA preprocessing 위에서 말한 변환 과정을 RMA라고 한다. # assayData를 RMA 전처리 RMA_assay 2021. 3. 17.
GEO 에서 데이터 다운받기(R) GEO에서 데이터 다운로드하기(web)에서 확인한 accession number를 이용합니다. R에서 GEOquery package를 이용하여 2가지 방법으로 데이터를 받을 수 있다. 1. R을 이용하여 데이터 파일을 다운받기 (web으로 받는 것과 같은 결과) - pheno, feature Data를 가져올 수 없다. 2. R 객체(ExpressionSet)으로 받기 (권장) - pheno, feature Data를 가져올 수 있다. GEOquery 다운로드 # BiocManager를 이용 BiocManager::install(GEOquery) library(GEOquery) 1. 데이터 파일 다운로드 - 파일을 로컬에 저장한다. getGEOSuppFiles('Accession number') - 저장.. 2021. 3. 17.
GEO 에서 데이터 다운받기(web) GEO : NCBI에서 운영하는 공개 데이터 저장소 - microarray, NGS 등 유전체 데이터를 제공한다. - 실험 platform, sample, 실험 내용에 대한 정보로 구분하여 제공한다. - platform:GPL, sample:GSM, Series:GSE라는 명칭으로 제공 ● GEO 사이트 이용방법 1. 구글에서 GEO를 검색한다. 2. GEO 페이지 검색창에 키워드 or Accession number를 입력하면 해당 실험에 대한 데이터를 볼 수 있다. - 검색결과는 아래 빨간 필터들로 필터링하여 원하는 데이터를 찾을 수 있다. 3. 클릭하여 정보를 확인한다. 실험에 정보와 accession number를 확인할 수 있다.(기억할 것) - 해당 실험의 platfrom 정보(GPL), sam.. 2021. 3. 17.
RNA-seq Technology ● RNA-seq 과정 samples -> isolate RNA -> cDNA -> Create sequencing library -> NGS ● RNA-seq purpose ▶ Gene expression pattern vary in - Tissue types - Cell type - Development stages - Disease conditions - Time points + detection of novel transcripts ● Uses of RNA-seq 1. Assembling and annotating a transcriptome : 새로운 RNA 찾기 2. Characterization of alternative splicing patterns 3. Gene fusion detect.. 2021. 3. 12.
전차체 분석 기초 - 전사체 분석 개론 전사체 : transcriptome ● 전사체 분석의 목적 - 표현형 질의 특성, 조절 기전의 이해 - 유전정보 기능 분석 - 질병 or 생물학적 기능 이상의 검출, 예측 ● DNA가 아닌 RNA 발현을 연구하는 이유 - 기능적 연구, 유전자 발현량에 대해 알 수 있다. - 일부 분자적 특성이 RNA에서만 나타난다. splicing, RNA editting - 단백질 서열에 영향을 미치지 않는 돌연변이 해석 가능 - 단백질 코딩 체세포 돌연변이의 우선순위를 결정 가능 ● 전사체 분석으로 알 수 있는 것 - 참조 유전체/전사체가 없을 때 새로운 전사체를 조립 - 새로운 isoform 검색 - 전사체 기능 검색과 분류 - 발현량 측정 및 서로 다른 환경에서 차등적으로 발현되는 유전자 분석 - 유전자의 온톨로.. 2021. 3. 12.