statistics program
week 5. Regression Analysis _ 영현2 본문
안녕하세요 영현2입니다. 오늘은 5주차 학습 내용에 대해서 이론적으로 정리해보겠습니다.
회귀 분석(Regression Analysis)은 한 변수(또는 여러 변수)가 다른 변수에 어떻게 영향을 미치는지를 분석하는 통계적 기법입니다. 이를 통해 변수들 간의 관계를 이해하고 예측하는 데 사용됩니다.
1. **단순 선형 회귀 (Simple Linear Regression)**:
- 하나의 설명변수(독립변수)가 종속변수에 미치는 영향을 분석합니다.
- 예를 들어, 공부 시간에 따른 시험 점수와 같은 관계를 분석할 수 있습니다.
2. **다중 선형 회귀 (Multiple Linear Regression)**:
- 여러 개의 설명변수가 종속변수에 동시에 영향을 미치는 경우를 분석합니다.
- 예를 들어, 집의 가격을 결정하는 데에는 위치, 크기, 시장 상황 등 여러 요소가 포함될 수 있습니다.
3. **회귀 모델의 평가**:
- **결정 계수 (Coefficient of Determination, R-squared)**: 모델이 설명하는 데이터 변동의 비율을 나타냅니다.
- **잔차 분석 (Residual Analysis)**: 모델의 잔차가 정규성, 독립성, 등분산성을 만족하는지 검토하여 모델의 적합성을 평가합니다.
4. **회귀 계수의 해석**:
- 각 설명변수의 회귀 계수는 해당 변수가 종속변수에 미치는 영향의 크기와 방향을 나타냅니다.
- 회귀 계수의 유의성 검정을 통해 통계적으로 중요한 변수를 식별할 수 있습니다.
5. **회귀 분석의 활용**:
- 예측(Prediction): 새로운 데이터에 대한 종속변수의 값을 예측합니다.
- 인과 관계 추론(Causal Inference): 변수들 간의 인과 관계를 추론하여 정책 결정이나 전략 수립에 활용할 수 있습니다.
회귀 분석은 다양한 분야에서 데이터 분석과 예측에 널리 사용되며, 변수들 간의 복잡한 관계를 분석하는 데 강력한 도구로 작용합니다.
학습한 코드 내용은 아래에 첨부합니다
'학습 정리 > 영현2' 카테고리의 다른 글
| week 4. Statistical Inference _영현2 (0) | 2024.06.29 |
|---|---|
| week 3. Descriptive Statistics_영현2 (0) | 2024.03.31 |
| week 2. Toolboxes for Data Scientists _ 영현2 (0) | 2024.03.31 |
| week 1 . 초기 환경 설정 _ 영현2 (2) | 2024.03.30 |