(기초)인공지능 딥러닝, 머신러닝 개념 완벽 이해 (6화 머신러닝 Model 알아보기)
본문 바로가기
IT

(기초)인공지능 딥러닝, 머신러닝 개념 완벽 이해 (6화 머신러닝 Model 알아보기)

by 하고싶은거하는여자 2025. 2. 3.
728x90
반응형

 

 

 

 

 

 

데이터 분포가 여러 군데 있을 때에는 선형 모델로 구현하기 어렵다.

 

 

이럴경우 

비선형 모델로 구현한다.

 

 

 

 

 

 

X는 학습 시키기 위한 문제

Y는 찾고자 하는 값 (예측하고자 하는)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

적절한 데이터만 넣어주면 컴퓨터가 알아서 거대한 트리 형식으로 스스로 학습한다

 

 

 

 

 

 

질문을 많이해서 디테일하게 분기를 나눌수록 복잡도가 높아지고 과대적합이 높아진다

 

 

학습데이터 데이터 포인트가 아니면 제대로 예측 못함

 

회귀=수치

 

 

 

 

 

 

 

 

 

수학식을 통해서 값보다 크면 왼쪽 작으면 오른쪽으로 반복적인 수학 연산에 따라서 가지를 뻗어 분기를 나누게 된다

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

트리 깊이를 늘리면 오른쪽은 정확해 지지만 왼쪽은 TEST 데이터 셋에는 잘 맞지 않는다

 

 

 

 

 

 

 

 

완전 생뚱맞은 데이터는 예측 불가능

 

(가지를 뻗어 분기를 하기 때문에)

 

적절하게 하이퍼파라미터를 조정해서 단점 극복해라

 

 

 

 

 

 

 

 

가운데 선은 초평면

 

선 그리는 기준은 선의 마진값을 계산해서 

마진값 주변 안에는 어떠한 데이터 값이 있으면안된다

 

마진값이 커지면 커질수록 기울기가 적절하게 설정된다

 

데이터 포인트들과 최대한 멀리 떨어지도록 학습한다

데이터 포인트들과 사이가 멀어진다는건 마진의 크기가 커지는 방향으로 학습을 진행한다

 

 

 

 

 

LOW cost 초평면과 데이터 사이의 마진을 최대한 넓게

 

large는 초평면과 좁게

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

728x90
반응형

댓글