본문 바로가기

python24

[핸즈온 머신러닝] 3장. 분류 1. MNIST 데이터 0~9까지 손글씨 70000개의 데이터를 가지고 있다. (28*28) 픽셀은 흑백으로 0~255까지의 값을 갖는다. 2. 이진 분류 A or B, True or False 등 2가지 lable로 나누는 분류를 이진 분류라 한다. 3. 성능 검증 ▶ 오차 행렬 - 검증을 시행했을 때 결과를 행렬로 만든다. 진짜 음성(TN) : 실제 FALSE를 FALSE로 예측한 경우 가짜 음성(FN) : 실제 TURE를 FALSE로 예측한 경우 가짜 양성(FP) : 실제 FALSE를 TURE로 예측한 경우 진짜 양성(TP) : 실제 TRUE를 TURE로 예측한 경우 ▶ 정확도: 전체 중 맞춘 값(TN, TP)의 비율 = (TN+TP)/total ▶ 정밀도: TRUE로 예측한 것 중 맞춘 값(TP).. 2021. 1. 31.
[핸즈온 머신러닝] 2장. 머신러닝 프로젝트 처음부터 끝까지 1. 큰 그림 보기 ▶ 문제 정의 하기 비즈니스의 목적 파악: 목적에 따라 문제의 구성, 알고리즘의 선택, 평가 지표, 튜닝 정도가 달라지기 때문이다. 학습 방법 정의: 지도 학습, 비지도 학습, 강화 학습 중 어떤 방법을 선택할 것인가? 지도 학습이라면 분류인가 회귀인가? 온라인 학습과 배치 학습 중 무엇이 더 효율적인가? ▶ 성능 측정 지표 선택 분류의 경우 정확도, 회귀의 경우 RMSE, MAE 등 오차 계산법이 있다. 이 중 올바른 것을 선택한다. ▶ 가정 검사 문제를 정의하고 성능지표를 선택하는 등 세운 계획에 대해 검토하는 과정이다. 2. 데이터 가져오기 및 작업 환경 구축 ▶ 작업환경 구축 분석 환경에 필요한 프로그램과 패키지를 다운로드하고 필요하다면 가상 환경을 준비한다. ▶ 데이터 구조 .. 2021. 1. 21.
[핸즈온 머신러닝] 1장. 한 눈에 보는 머신러닝 1. 머신러닝이란 무었인가? "어떤 작업 T에 대한 컴퓨터 프로그램의 성능을 P로 측정하였을 때 경험 E로 인해 성능이 향상됐다면, 이 컴퓨터 프로그램은 작업 T와 성능 측정 P에 대해 경험 E로 학습한 것이다.' - 톰 미첼 머신러닝은 학습을 통하여 명시적인 코딩없이 성능을 향상시키는 프로그램을 말한다. 훈련을 할 수 있는 데이터를 이용하여 성능을 높이는 것이다. 알파고는 기존 바둑의 기보를 통하여 학습하여 대국에서의 승률을 높이는 머신러닝을 통하여 탄생하였다. 2. 머신러닝의 종류 머신러닝의 훈련 데이터의 지도 방식에 따라 지도학습, 비지도 학습, 준지도 학습, 강화 학습으로 나뉜다. ▶ 지도 학습 정답이 있는(lable) 훈련 데이터를 통한 학습한다. 데이터들이 변수와 정답을 통해 새로운 데이터의 .. 2021. 1. 21.
[밑러닝 1] 2장 퍼셉트론 1. 퍼셉트론의 정의 다수의 신호를 받아 하나의 신호를 출력한다. 출력값이 0 or 1을 가질 수 있다. 동그라미 : 노드, 뉴런 값을 연산하여 출력한다. X : 입력 신호 W : 가중치 y : 출력값 $$ y= \begin{cases} 0 & (w_1x_1 + w_2x_2 \leq \theta ) \\ 1 & (w_1x_1 + w_2x_2 > \theta ) \end{cases} $$ 입력값과 가중치를 연산하여 더한값이 임계값(θ)보다 크면 1을, 작으면 0을 출력한다. 2. 간단한 게이트 1. AND 게이트 두 입력값이 모두 1일 때만 1을 출력하는 게이트 $$x_1$$ $$x_2$$ $$y$$ 0 0 0 1 0 0 0 1 0 1 1 1 ex) w1, w2, θ = 0.5, 0.5, 0.8 일 때 A.. 2021. 1. 2.
[python 그래프] 그래프 설정 matplotlib, seaborn, pandas 모두 matpoltlib 기반으로 그래프를 만들기 때문에 같은 방법으로 설정이 가능하다. import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 그래프 표현방식 설정 %matplotlib notebook # 아래 코드 - 그래프에 한글 폰트 설정 from matplotlib import font_manager, rc, rcParams font_name = font_manager.FontProperties(fname="c:/Windows/Fonts/malgun.ttf").get_name() rc('font', family=font_name) r.. 2020. 9. 7.
[python 그래프] 데이터 분석 그래프 종류 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns # 그래프 표현방식 설정 %matplotlib notebook # 그래프에 한글 폰트 설정 from matplotlib import font_manager, rc, rcParams font_name = font_manager.FontProperties(fname="c:/Windows/Fonts/malgun.ttf").get_name() rc('font', family=font_name) rcParams['axes.unicode_minus'] = False # 그래프 크기 설정 rcParams["figure.figsize"] = (6,4) -.. 2020. 9. 2.