목록전체 글 (21)
statistics program
안녕하세요 영현2입니다. 오늘은 5주차 학습 내용에 대해서 이론적으로 정리해보겠습니다. 회귀 분석(Regression Analysis)은 한 변수(또는 여러 변수)가 다른 변수에 어떻게 영향을 미치는지를 분석하는 통계적 기법입니다. 이를 통해 변수들 간의 관계를 이해하고 예측하는 데 사용됩니다. 1. **단순 선형 회귀 (Simple Linear Regression)**: - 하나의 설명변수(독립변수)가 종속변수에 미치는 영향을 분석합니다. - 예를 들어, 공부 시간에 따른 시험 점수와 같은 관계를 분석할 수 있습니다. 2. **다중 선형 회귀 (Multiple Linear Regression)**: - 여러 개의 설명변수가 종속변수에 동시에 영향을 미치는 경우를 분석합니다. - 예를 들어, 집의 가격을..
통계적 추론은 데이터를 분석하여 모집단에 대한 결론을 도출하는 과정입니다. 주어진 표본 데이터를 사용하여 모집단의 특성이나 현상을 추정하거나, 가설을 검정하는 것이 주된 목표입니다. 1. **추정 (Estimation)**: - **점 추정 (Point estimation)**: 하나의 값으로 모수(모집단의 특성)을 추정하는 방법입니다. 예를 들어, 표본 평균을 사용해 모집단 평균을 추정할 수 있습니다. - **구간 추정 (Interval estimation)**: 추정된 모수 주변의 신뢰구간을 계산하여 모수의 위치를 정확히 파악하는 방법입니다. 2. **가설 검정 (Hypothesis Testing)**: - 특정 가설을 데이터를 통해 검증하는 과정입니다. 일반적으로 귀무가설(H0)과 대립가설(H1)을..
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltIn [ ]:from google.colab import drivedrive.mount('/content/drive')Mounted at /content/driveIn [ ]:ice = pd.read_csv('/content/drive/MyDrive/Colab Notebooks/SeaIce.txt',delim_whitespace=True)print('shape:', ice.shape)shape: (424, 6)In [ ]:ice2 = ice[ice.data_type != '-9999']ice2Out[ ]:yearmodata_typeregionextentarea01234...419420..
import pandas as pdimport numpy as npimport matplotlib.pyplot as pltIn [ ]:from google.colab import drivedrive.mount('/content/drive')Mounted at /content/driveIn [ ]:data = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/ACCIDENTS_GU_BCN_2013.csv",encoding='latin-1')data['Date'] = '2013-'+data['Mes de any'].apply(lambda x : str(x)) + '-' + data['Dia de mes'].apply(lambda x : str(x))data['Da..