머신러닝 야학-머신러닝1 핵심 요약노트

2021 머신러닝 야학 2기 개강!

2021 머신러닝 야학 2기 개강

평소 SSAFY 에서부터 관심이 생겼던 Machine Learning 분야에 새롭게 도전해 보았다.
친구들이 딥러닝 프로젝트로 Image Scanning 이나 Classification 기술을 도입해서
얼굴 관상 보기 프로젝트라던지, 물고기 종류 분류라던지 신박한 기술들을 많이 보여줬었는데,
평소 자연어 처리에 관심 많았던지라, 그동안 배워왔던 빅데이터 기술들을 좀 더 딥하게 적용시켜 보고 싶어서
머신러닝 야학 2기를 신청하게 되었다.

내가 직면한 문제를 해결하려는 절실함이 필요하다!


인공지능을 구현하는 기술, 머신러닝이란?

기계학습이란? 기계를 학습시켜, 인간의 판단을 위임하기 위해서 고안된 기술!

전염병판정, 기계번역, 자율주행 등 많은 분야에서 활용되고 있다.

머신러닝의 가장 큰 키워드는 바로 인간의 결정 을 도와 준 다는 것.

결정 = 비교 + 선택

여러가지의 선택지가 있을 때, 객관적인 데이터를 기계에게 학습시켜 분석하여, 인간의 빠르고 정확한 결정을 도와주는 것.

Google Teachable Machine을 이용해 곰돌이를 학습시켜 보았다.

여러 장의 사진을 학습시켜, 그 결과가 내가 정한 클래스에 속하는지 쉽게 이용해 볼 수 있는 사이트가 있다. 역시 갓구글..
https://teachablemachine.withgoogle.com/

머신러닝야학에선 이 google teachable machine에서 만들어준 model을
간단한 App으로 만들어주는 활용 예제도 존재했다.

곰돌이 인지, 스프인지 판단해주는 기특한 녀석

많은 사람들이 머신러닝에 대해 고민하고있고, 자신만의 기획서를 작성하기도 한다. 프로그래머로서 고민하는 것보다, 자신의 문제를 먼저 어떻게 해결할지 궁리 해보라는 강의의 포인트에 맞게, 남녀노소 다양한 사람들의 아이디어가 살아 숨쉬는 공간인 것 같다.

https://bit.ly/ml-my-plan/


좀 더 본격적으로 머신러닝을 시작해보자.

아이디어를 현실화 하기 위해선, 데이터가 필요하다.
그리고 그 데이터는 가장 효율적으로 2가지로 전달가능하다. 표 (Table) 과 좌표평면(Coordinates)

표라는 것을 좀 더 자세히 보자.
표는 가로(row) 와 세로 (column), 즉 행과 열로 구성되어 있다.

이 표는 다양한 분야에서 다양한 이름으로 불리는데,
특히 데이터 분야에서는 테이블을 데이터셋(DataSet)이라고 부르고, 주로 행의 데이터를 관측치, 열을 특성 및 변수라고 지칭한다.

Table의 요소를 가리키는 많은 이름들


독립변수와 종속변수

변수(Variable)란? 즉, 변화하는 수!
데이터셋에선 ‘열’을 의미한다.

독립변수원인이 되는 열, 종속변수는 그 원인으로 인해 결과가 되는 열이라고 이해하면 쉽다.

예를 들어 온도가 20도 일때, 맥주의 판매량이 40병이라는 데이터가 있다면,
온도라는 원인에 의해 맥주의 판매량이 영향을 준다고 가정 했을때,
온도는 결과에 영향을 받지 않는 독립적인 사건이지만, 결과는 원인에 종속되어서 발생한 사건이다.

물론 세상의 모든 데이터는 인과관계로 존재하지 않는다. 다양한 상관관계가 있을 수 있고, 인과관계는 그 중 하나일 것이다!

독립변수는 원인이다.
종속변수는 결과다.
독립변수와 종속변수의 관계를 인과관계라고 한다.
인과관계는 상관관계에 포함된다.


머신러닝의 분류

머신러닝의 다양한 분야들

지도 학습 (Supervised Learning)

정답이 있는 문제를 해결하는 것

보통은 과거의 데이터를 통해서 결과를 예측하는 것에 사용된다. (ex) 온도와 아이스크림 판매량 간의 원인-결과 분석을 통해 판매량을 예측하는 모델)

  1. 분류 (Classification)
    예측하고자 하는 종속변수가 이름일 때, 보통 사용됨.
    ex) 공부시간과 합격여부, 키,몸무게와 현역-공익, 메일 발신인과 스팸메일 여부 등

  2. 회귀 (Regression)
    예측하고자 하는 종속변수가 숫자일 때, 보통 사용됨.
    ex) 공부시간과 시험점수의 상관관계, 역세권과 집 값, 자동차 속도와 안전성, 나이와 키 등

비지도학습 (Unsupervised Learning)

관찰을 통해 새로운 의미나 관계를 밝혀내는 것

  1. 군집화 (Clustering)
    군집화란 비슷한 행을 찾아서 그룹을 만드는 것
    ex) 좌표평면내의 비슷한 위치의 좌표값들을 여러 단위의 군집(Cluster) 단위로 나누어 그룹핑하는 것

  2. 연관 규칙 학습(Association rule learning)
    서로 관련이 있는 특성을 그룹화 해주는 것
    ex) 쇼핑몰 내의 상품추천, 영화추천, 드라마 추천 등

관측치를 그룹핑 해주는것 -> 군집화
특성을 그룹핑 해주는 것 -> 연관 규칙 학습

지도학습 vs 비지도학습

강화학습 (Reinforcement Learning)

더 좋은 보상을 받기 위해서 수련하는 것

강화학습하는 수달(귀엽다)

현재의 상태를 관찰 -> 관찰에 따라 행동 -> 보상을 더 받을 수 있도록 Agent가 학습하는 일련의 과정을 반복하는 것.

머신러닝 지도

당신이 필요한 머신러닝 Roadmap

다음과 같은 판단 절차로 내게 필요한 머신러닝의 기법이 무엇인지 판단 할 수 있다.


출처)

생활코딩
https://opentutorials.org/course/4548/28891

포스트 내의 삽화와 자료들은 생활코딩의 저작권 정책에 따라 작성되었습니다.

댓글