머신러닝과 딥러닝에 대해 공부해보려고 합니다 모두를 위한 머신러닝/딥러닝 강의를 수강하고 배운 것들을 정리해보겠습니다 [참고] (https://hunkim.github.io/ml/) Cost Function 최소화 Hypothesis and Cost H(x) = Wx + b cost를 최소화하는 W와 b의 값을 우리가 가지고 있는 데이터를 통해 구해보자 ! What cost(W) looks like? cost함수 x y 1 1 2 2 3 3 W = 1일때, cost(W)=? {(1 x 1 - 1)^2 + (1 x 2 - 2)^2 + (1 x 3 - 3)^2}/3 = 0 + 0 + 0 = 0 W = 0일때 cost(W) = 4.67 W = 2일때 cost(W) = 4.67 - 목적 : Cost = 0인 지..
머신러닝과 딥러닝에 대해 공부해보려고 합니다 모두를 위한 머신러닝/딥러닝 강의를 수강하고 배운 것들을 정리해보겠습니다 [참고] (https://hunkim.github.io/ml/) Linear Regression Regression Training Data x y 1 1 2 2 3 3 Linear Hypothesis 우리의 데이터들과 맞아 떨어지는 어떠한 선형적인 모델 H(x)= Wx + b linear model 을 통한 가설을 세운다 어떤 방정식이 더 가설과 잘 맞을까 ? 가장 적합한 W와 b값을 구해야함! -> 더 좋은 모델 Cost Function = Loss function 우리가 세운 Linear Hypothesis와 실제 데이터가 얼마나 다른가? H(x)-y -> 음수가 나올수도 있기 때문..
머신러닝과 딥러닝에 대해 공부해보려고 합니다 모두를 위한 머신러닝/딥러닝 강의를 수강하고 배운 것들을 정리해보겠습니다 [참고] (https://hunkim.github.io/ml/) Machine Learning Basic Machine Learning - explicit programming -> 각 환경에서의 출력을 명시해놓음 - explicit programming 의 한계 Spam filter : 너무 많은 규칙들 Automatic driving Machine Learning이란? explicit programming 처럼 일일히 프로그래밍하지 말고 어떤 자료나 현상에서 자동적으로 컴퓨터가 배우도록 해보자 컴퓨터가 데이터를 보고 학습하여 어떠한 능력을 가지게 하는 것 입력을 기반으로 데이터를 읽어..
1. 데이터 분류 데이터들이 점점 많아지면서 데이터를 이해하고 분석하는 능력은 매우 중요하다 학교에서 배운 데이터 분석 관련 내용들을 정리해보겠다 데이터의 다양한 종류 Structured or Unstructured 구조화가 되어있는가 i.i.d. data or non-i.i.d. data (independent and identically distributed) 독립적이고 균일하게 분포되어 있는가 Vectorial or non-Vectorial data 벡터 형태의 데이터인가 Labeled or unLabeled data 라벨화가 되어있는가 데이터의 종류 Images, text, languages, time series, graphs, and so on 2. Regression Correlation A..