전체 글53 [컴퓨터 비전] 주요 Dataset 과 openCV, 컴퓨터 비전 패키지 인프런 - 권철민 님의 '딥러닝 컴퓨터 비전 완벽 가이드'를 정리한 내용입니다. Object Detection과 Segmentation을 위한 주요 Dataset 1. PASCAL VOC (주로 2012 버전) - Detection을 위한 20개의 카테고리를 갖는 데이터를 제공한다. - Detection, Segmentation, Action Classification, Person Layout을 위한 데이터를 제공한다. - Annotation을 xml 형태로 제공 Annotation이란? 이미지의 Detection 정보를 설명 파일로 저장한 것을 말한다. 이미지 class, Boundering box의 위치 등을 특정 포맷으로 전달한다. 2. MS-COCO (주로 2017 버전) - Detection을.. 2021. 4. 22. [컴퓨터 비전] 개요 및 Object Detection 인프런 - 권철민 님의 '딥러닝 컴퓨터 비전 완벽 가이드'를 정리한 내용입니다. 컴퓨터 비전의 업무 1. Classification : 이미지가 무엇인지 구분하는 것 2. Localization : 하나의 object의 위치를 찾는 것 3. Object Detection : 여러 개의 Object들에 대한 위치를 Bonding box(네모 박스)로 찾는 것 4. Segmentation : Detection보다 발전된 형태로 Pixel 단위로 Object를 구분하는 것 Localization과 Detection 이미지에서 해당 Object의 위치를 Bounding box로 찾고, Boundering box내의 Object를 판별한다. boundering box를 찾는 과정은 regression과정이며 Ob.. 2021. 4. 21. [그로스 해킹] AARRR 개념 및 Acquistion 인프런 - 그로스 해킹 양승화 님의 강의를 듣고 정리한 자료입니다. 지표의 중요성 지표(metric) - 로그를 특정 기준에 따라 요약한 숫자 1. 현재 상황을 정확하게 이해하도록 해준다. 2. 목표를 명확하게 해 준다. 3. 의사결정을 하는데 기준이 된다. ● 지표를 관리하는 2가지 방법 1. Task-based, 업무기반 - 결과적으로 안좋은 것 마케팅, 운영, 개발, 사업 등 업무를 기반으로 생성된 지표를 각각 관리하는 것 - 마케팅 팀: 검색광고 키워드별 CTR은 3.5% 이다. - 운영 팀: CS 문의 처리 건 수가 300건이다. - 개발 팀: 이번 배포에서 총 12개의 버그를 수정했다. - 사업 팀: 이 달 신규계약은 12건입니다. ▶ 문제점 - 무엇이 중요한지 판단하기 어렵다. - 전체 프로.. 2021. 4. 19. [약동학] 약동학 parameters 약물 투여 루트(2가지 기준) 1. Enteral vs Parenteral - 소화관으로 넣는지 아닌지로 구분, 실제 약물을 적용할 때 편한 분류기준 ● Enteral : 소화관으로 투여, Oral(입), Rectal(직장) ● Parenteral : 소화관이 아닌 곳으로 투여, Injection(정맥, 근육주사), Topical(피부), Respiratory(호흡기) 2. Intravascular vs Extravascular - 혈관으로 즉시 투여와 혈관이 아닌 곳으로 투여, 흡수과정의 유무에 따라 나뉜다. 약동학 실험 시 사용하는 기준 ● Intravascular - 정맥 또는 동맥으로 직접 약을 투여한다. - 흡수(Absorption)과정이 없다. - 즉시 효과가 나타난다. (onset : 효과가.. 2021. 4. 14. [약동학] 약동학 이해 ADME 약동학이란 약의 성질을 시간에 대한 함수로 나타낸 학문 약의 흡수, 퍼짐, 대사, 배출 4가지에 대한 성질(ADME)을 나타낸다. 최근에는 독성까지 포함하기도 한다. 신약개발에 있어 가장 많이 실패하는 이유는 Biopharmaceutical Properties가 부족해서이다. 즉, 약동학의 ADME가 기준에 미치지 못해서이다. 신약개발에 있어 약동학이 중요한 이유가 된다. 1. Absorption : 약을 투여한 후 흡수가 되는 속도 2. Distribution : 흡수가 된 후 몸으로 퍼져나가는 정도 3. Metabolism : 간 등에서 약이 다른 구조로 변하는 속도 4. Excretion : 약이 몸에서 배출되는 속도 1. Absorption - 약을 투여한 위치에서 약의 수치를 측정 가능한 부위(.. 2021. 4. 12. [딥러닝] - few shot learning, 적은 데이터로 학습하기 few shot learning 이미지 분류 문제에서 딥러닝 모델을 학습시키기 위해서는 많은 데이터가 필요하다. (imagenet 12만장) 하지만 사람의 경우 몇 장의 이미지만으로 새로운 것을 배우고 구분할 수 있다. 사람이 배우는 것 처럼 딥러닝 모델을 학습 시키는 방법을 메타러닝(Meta-learning)이라고 하며 image 문제에 사용되는 메타 러닝을 few shot learning이라고 한다. 접근 방법 few shot learning의 학습 방식은 두 이미지 비교다. 기존 분류 문제는 이미지가 어떤 카테고리에 포함 되는가를 찾는 방법이고 few shot learning은 두 이미지를 비교하여 같은지 다른지를 판단한다. 서포트 셋은 우리가 가지고 있는 labeling된 데이터 이고 쿼리 셋은 .. 2021. 4. 12. [그로스 해킹] 그로스 해킹이란 + 전제조건_PMF 인프런 - 그로스 해킹 양승화 님의 강의를 듣고 정리한 자료입니다. 그로스 해킹이란? "데이터를 기반으로 서비스/비지니스에서 마주한 문제를 푸는 일, 그 문제를 풀어 기대하는 효과는 서비스의 성장" ● 그로스 해킹의 필요성 좋은 아이디어, 안정적인 개발, 예쁜 디자인, 효과적인 마케팅을 바탕으로 성공하는 서비스를 만들던 시대는 지나갔다. 쏟아져 나오는 제품/서비스 중에서 선택받는 소수가 되는 것은 매우 어렵다. - 프린세스 메이커 VS 클래시 오브 클랜 프린세스 메이커 : 완전한 제품을 만들어 출시하는 방식, 과거의 제품의 공급 방식이다. -> 어떻게 하면 좋은 제품을 만들까? 클래시 오브 클랜 : 제품 출시가 곧 시작, 사용자 로그, 반응 등을 분석하여 제품을 관리하고 개선해 나간다. -> 어떻게 제품.. 2021. 4. 8. [핸즈온 머신러닝] 12장. 텐서플로우를 사용한 사용자 정의 모델과 훈련 ● 텐서플로우(Tensorflow) - 강력한 수치 계산용 라이브러리, 딥러닝 최적화가 되어있다. - 핵심 구조는 넘파이(Numpy)와 비슷하지만 GPU를 지원한다. - 분산 컴퓨팅을 지원한다. - 계산 그래프를 이용하여 함수 최적화 및 중립적 포맷을 유지한다.(리눅스 python 환경에서 훈련 후 안드로이드 자바에서 사용 가능) - 자동 미분 기능 제공, 고성능 옵티마이저 제공 - 텐서 플로 허브 등에서 다수의 만들어진 모델을 다운 가능하다. (커뮤니티가 잘 되어 있고 사용자도 많다.) 목차 1. 텐서 플로우 연산(numpy처럼 사용하기) 2. 사용자 정의로 모델 만들기 - 손실 함수, 활성화 함수, 규제, 지표, 층 등 사용자 정의로 모델의 구성요소를 만들어 보기 3. 텐서 플로우 함수 만들기 1. .. 2021. 3. 31. [핸즈온 머신러닝] 11장. 심층 신경망 훈련하기 목차 1. 그레디언트 소실 및 그레디언트 폭주 문제 2. 전이 학습 3. 옵티마이저 4. 규제 ● 그레디언트 소실 및 그레디언트 폭주 - 깊은 신경망 학습 시 그레디언트가 점점 작아지거나 발산하는 현상 - 하위층에 대한 훈련이 매우 어려워진다. 시간 또는 비용이 많이 발생하게 된다. - 과대 적합에 빠질 위험이 많다. - 초반에 많이 사용하던 로지스틱 활성화 함수와 표준 정규분포 초기화로 인해 발생 ▶ 글로럿 초기화 출력층의 분산과 입력층의 분산이 같아야 적절한 신호가 흐를 수 있다. 글로럿 초기화를 사용하면 훈련 속도를 매우 높일 수 있다. 현재 딥러닝의 성공을 견인한 기술이다. 입력층의 개수를 $fan_{in}$, 출력층의 개수를 $fan_{out}$으로 표현하고 $fan_{avg}$는 둘의 평균입니.. 2021. 3. 28. [유전체 분석] R을 이용한 clustering Clustering 데이터를 기반으로 비슷한 특성을 갖는 값들을 집단으로 분류하는 과정이다. 비지도 학습으로 집단의 개수, 분류 기준에 따라 결과가 달라진다. 목차. 유전체 분석에서 많이 사용되는 clustering 방법 1. Hierarchical clustering 2. Consensus clustering 3. NMF clustering Expression Set의 데이터 전처리(cluster 하기 위한) 유전체 분석에서 많이 사용되는 clustering 방법 ● Hierarchical clustering 가장 일반적으로 사용되는 방법이다. 가장 비슷하다고 생각되는 것을 묶어가며 군집화 한다. 최종적으로 1개의 군집이 될 때까지 진행한 뒤 그래프를 기준으로 적당한 클러스터 개수에서 분류한다. 아래 .. 2021. 3. 19. Differential Expression Gene(DEG) with R DEG(차등 발현 유전자 분석)은 microarray나 RNA-seq을 이용한 분석방법 같은 유전자에 대해 sample별로 발현량을 비교하는 방법이다. DEG 분석 후 GO, KEGG pathway 분석 등을 통해 차등 발현한 유전자의 fuctional analysis도 함께 진행한다. 목차 1. DEG 분석 (차등 발현된 유전자 골라내기) 2. 간단한 GO, KEGG-pathway 3. web을 이용한 방법 1. DEG 분석 (차등 발현된 유전자 골라내기) GEO에서 받은 데이터와 R limma package를 이용하여 분석한다. # limma 설치 및 로드 BiocManager::install('limma') # RMA 전처리한 data GSEdata # limma package를 이용하기 위해 da.. 2021. 3. 17. Microarray 데이터 전처리(RMA) 전처리가 필요한 이유 2-color Micro array에서 발현량을 signal로 비교한다. 이때 background 효과를 제거, normalization 이 필요하고 형광 signal 값을 발현량 값으로 변환이 필요하다. RMA preprocessing 위에서 말한 변환 과정을 RMA라고 한다. # assayData를 RMA 전처리 RMA_assay 2021. 3. 17. 이전 1 2 3 4 5 다음