머신러닝야학-Tensorflow (python) 핵심요약-2

독립변수와 종속변수가 여럿인 예제 (보스턴 집값 예측)

중앙값 (Median Value)란?

해당 지역 주택 값 중에 가장 가운데에 있는 값 (Range List 중 중앙 인덱스 값)

일반적으론 평균값이 집단을 대표하는 숫자로 많이 사용되지만, 평균값의 표준편차가 너무 커서, 평균의 대표성을 무너뜨리는 이상치(Outlier)가 평균을 왜곡시킬때, 중앙값을 많이 사용함.

Machine Learning으로 여러 독립변수가 하나의 종속변수에 영향을 미치는 가중치를 공식화 할 수 있다!


보스턴 집값 모델 딥러닝 프로세스

보스턴 집값 예측 모델의 딥러닝 프로세스. 종속변수와 독립변수의 값을 입력한다.

보스턴 집값 예측 모델은 하나의 종속변수를 에측하기 위해 13개의 독립변수를 사용한다.

이런식으로 여러 독립변수가 목표한 종속변수에 미치는 영향을 분석하는 모형을 퍼셉트론이라고 부르고,각각의 변수(뉴런)가 종속변수에 미치는 영향력의 비율을 가중치라고 부른다.

각각의 뉴런으로 입력된 모든 값을 다 더한 다음(가중합)에 이 값에 더 해주는 상수를 편향이라고 한다.

즉, 하나의 뉴런에서 활성화 함수를 거쳐 최종적으로 편향을 더해야 예측값이 출력된다고 볼 수 있다.


퍼셉트론, 가중치, 편향

퍼셉트론, 가중치와 편향


예제 코드는 레모네이드 예제와 거의 비슷하므로 생략한다. 추가로, get_weight 메소드를 통해
머신러닝이 학습한 가중치와 편향값을 알아볼 수 있다.

가중치를 확인시켜주는 get_weights 메소드


생활코딩에선 이러한 딥러닝이 이루어지는 과정을 직접 실행해 보는 워크북을 제공한다.

현재의 Loss 값과 이전의 Loss 값을 비교해가며 가중치의 +- 값을 대입해 학습한다

가중치를 미분해가며 근사값을 대입해 가는 방식으로 딥러닝이 이루어지는데,
Learning Rate는 따로 정해진 값이 아니라, 학습을 반복하면서 적절한 값을 컴퓨터가 선택하게 된다.


출처


생활코딩 Deep Learning Tensorflow (python) 강의

https://opentutorials.org/course/4570

생활코딩의 딥러닝 교육컨텐츠는 CCL 라이선스 BY를 따르고 있습니다.

댓글