본문 바로가기

반응형

머신러닝

[머신러닝] 다중 선형 회귀(Multiple Linear Regression) [목차] 1. 다중 선형 회귀 2. 다중 선형 회귀 실습 1. 다중 선형 회귀 다중 선형 회귀(Multiple Linear Regression, MLR)는 여러 개의 독립 변수와 하나의 종속 변수의 선형 관계를 모델링하는 것이다. 독립 변수들을 $x_i$라고 하고, 종속 변수를 $y$라고 하면 다중 선형 회귀 식은 다음과 같다. $y = W_1x_1 + W_2x_2 + ... + W_nx_n + b$ 다중 선형 회귀를 사용할 땐 다음과 같은 가정들이 필요하다. 1. 각각의 독립 변수는 종속 변수와의 선형 관계가 존재한다. ($y = W_ix_i$ 그래프를 그렸을 때 직선의 형태) 2. 독립 변수 사이에서는 높은 수준의 상관관계가 존재하지 않아야 한다. 만약 그렇지 않다면 관계를 분석하기가 어렵다. 3. ..
[머신러닝] 단순 선형 회귀(Simple Linear Regression) [목차] 1. 선형 회귀 2. 단순 선형 회귀 실습 1. 선형 회귀(Linear Regression) 선형 회귀(Linear Regression)는 널리 사용되는 대표적인 회귀 알고리즘이다. 선형 회귀는 종속 변수 y와 하나 이상의 독립 변수 x와의 선형 상관관계를 모델링하는 기법이다. 만약 독립 변수 x가 1개라면 단순 선형 회귀라고 하고, 2개 이상이면 다중 선형 회귀라고 한다. 1) 단순 선형 회귀 (Simple Linear Regression) 단순 선형 회귀는 $y = Wx + b$의 식으로 나타난다. 머신러닝에서는 독립 변수 x에 곱해지는 W값을 가중치(weight), 상수항에 해당하는 b를 편향(bias)이라고 부른다. 따라서 단순 선형 회귀 모델을 훈련하는 것은 적절한 W와 b값을 찾는 것..
[머신러닝] K-최근접 이웃 회귀 (K-NN Regression) 개념 및 실습 [목차] 1. K-NN Regression 2. KNeighborsRegressor Class 3. K-NN Regression 실습 4. 과대적합 vs 과소적합 5. K-NN Regression의 한계 1. K-NN Regression 이전에는 생선이 도미에 속하는지 빙어에 속하는지 '분류'하는 문제를 다루었다. (https://rebro.kr/183) 다른 문제로 생선의 크기나 길이를 보고 생선의 무게를 예측하는 문제도 다룰 수 있다. 이처럼 클래스 중 하나로 분류하는 것이 아니라 임의의 어떤 '숫자'를 예측하는 문제를 회귀(Regression)라고 한다. 그중 K-NN Regression(K-최근접 이웃 회귀) 알고리즘은 주변의 가장 가까운 K개의 샘플을 통해 값을 예측하는 방식이다. 예를 들어 가..
[머신러닝] K-최근접 이웃(K-NN) 알고리즘 및 실습 [목차] 1. K-NN 알고리즘이란? 2. K-NN 알고리즘 실습 3. K-NN 알고리즘 실습 (훈련 셋과 데이터 셋 분리) 4. K-NN 알고리즘의 주의점 1. K-NN 알고리즘이란? K-최근접 이웃(K-NN, K-Nearest Neighbor) 알고리즘은 가장 간단한 머신러닝 알고리즘으로, 분류(Classification) 알고리즘이다. 비슷한 특성을 가진 데이터는 비슷한 범주에 속하는 경향이 있다는 가정하에 사용한다. 예를 들어 위와 같이 데이터가 주어져 있을 때, 빨간색인 세모 모양의 데이터는 초록색 그룹과 노란색 그룹 중 어디에 속한다고 말할 수 있을까? 주변에 가까운 데이터들이 모두 노란색이기 때문에 '노란색 그룹에 속할 것이다'라고 추측할 수 있다. 이처럼, 주변의 가장 가까운 K개의 데이터..
[머신러닝] 머신러닝(Machine Learning) 정의 및 종류 [목차] 1. 머신러닝이란? 2. 지도 학습 3. 비지도 학습 4. 준지도 학습 5. 강화 학습 1. 머신러닝이란? 머신러닝(Machine Learning)이란, 규칙을 일일이 프로그래밍하지 않아도 자동으로 데이터에서 규칙을 학습하는 알고리즘을 연구하는 분야이다. 인공지능의 하위 집합으로, 지능을 구현하기 위한 소프트웨어를 담당하는 핵심 분야다. 머신러닝에서의 알고리즘은 대규모 데이터셋에서 패턴과 상관관계를 찾고, 분석을 토대로 최적의 의사결정과 예측을 수행하도록 훈련된다. 학습과 개선을 위해 명시적으로 컴퓨터를 프로그래밍하는 대신, 컴퓨터가 데이터를 통해 학습하고 경험을 통해 개선하도록 훈련하는 데 중점을 둔다. 머신러닝 모델의 종류로는 크게 지도 학습, 비지도 학습, 준지도 학습, 강화 학습 총 4개..