2021/02/02 - [Python] - [개미의 걸음 scikit-learn 2차시] Classification(분류)의 이해
2021/02/03 - [Python] - [개미의 걸음 scikit-learn 3차시] Classification① 회귀분석
## pandas 모듈
import pandas as pd
## iris 데이터 모듈
from sklearn.datasets import load_iris
## train과 test set 구분 모듈
from sklearn.model_selection import train_test_split
## 선형회귀분석 모듈
from sklearn.linear_model import LinearRegression
## 데이터 표준화 모듈
from sklearn.preprocessing import StandardScaler
## MSE(평균제곱오차)
from sklearn.metrics import mean_squared_error
## 정확도 예측 모듈(연속적인 데이터에서 사용 안함)
## from sklearn.metrics import accuracy_score
## train, test 데이터를 각각 8:2로 구분
x_train, x_test, y_train, y_test = train_test_split(iris_data, iris_label, test_size=0.2, random_state=1)
## 데이터 표준화
sc = StandardScaler()
sc.fit(x_train)
x_train_std = sc.transform(x_train)
x_test_std = sc.transform(x_test)
linear_model = LinearRegression()
linear_model.fit(x_train_std, y_train)
print('linear_model.coef : ' , linear_model.coef_ , 'linear_model.intercept : ' , linear_model.intercept_)
y_pred = linear_model.predict(x_test_std)
mse=mean_squared_error(y_true = y_test, y_pred = y_pred)
print('mse :', mse)
## numpy.ndarray 타입을 pandas.core.series.Series 타입으로 변경
y_test = pd.Series(y_test)
y_pred = pd.Series(y_pred)
print( type(y_test), type(y_pred) )
## y_test와 y_pred 상관계수 분석
cor = y_test.corr(y_pred)
cor
## pandas를 이용해 데이터 프레임 만들기
df = pd.DataFrame({'y_pred':y_pred, 'y_test':y_test})
df
## 데이터 프레임 상관계수 분석
cor = df['y_pred'].corr(df['y_test'])
cor
[개미의 걸음 scikit-learn 10차시] 회귀분석 (0) | 2021.02.10 |
---|---|
[개미의 걸음 scikit-learn 오류해결] graphviz 설치 및 오류 해결(with jupyter notebook) (0) | 2021.02.04 |
[개미의 걸음 scikit-learn 4차시] 의사결정트리 실습(with iris) (0) | 2021.02.04 |
[개미의 걸음 scikit-learn 3차시] Classification① 의사결정트리(Decision Tree)의 이해 (0) | 2021.02.03 |
[개미의 걸음 scikit-learn 2차시] Classification(분류)의 이해 (0) | 2021.02.02 |
댓글 영역