[ml] 머신러닝 예측/분류 문제를 풀기 위한 Tips

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Recent Posts

Recent Comments

Today

Total

관리 메뉴

KEEP GOING

[ml] 머신러닝 예측/분류 문제를 풀기 위한 Tips 본문

인공지능/machine learning

[ml] 머신러닝 예측/분류 문제를 풀기 위한 Tips

jmHan 2023. 11. 15. 20:12

Tips

1. dir과 help 함수 이용하기

help(list.append)
help(pandas)
dir(pandas)

2. 어떤 모델을 선택할지 모르겠을 때 랜덤포레스트 사용

from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import RandomForestRegressor

pandas

1. 데이터 불러오기(read_csv) / 저장하기(to_csv)

import pandas as pd

train = pd.read_csv('train.csv')
test = pd.read_csv('test.csv')
submission = pd.read_csv('submission.csv')
submission.to_csv('submission.csv', index=False)

sklearn

1. x, y 데이터로 train, test 세트 구분하기(train, test 비율은 7:3으로 고정. random_state=42로 고정)

from sklearn.model_selection import train_test_split

x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.3,random_state=42)

2. 모델링 순서

model import
model 선언, 초기 하이퍼 파라미터 지정
model.fit(x_train,y_train)을 통한 모델 학습
회귀, 분류 문제 모두 model.predict(x_validation) 을 통한 예측
auc값을 구해야하는 경우 model.predict_proba(x_validation)을 통한 확률 추출 (svm모델의 경우 학습시 probability=True옵션 추가)
원하는 metric으로 모델 평가 eg) accuracy_score(y_validation, model.predict(x_validation))

3. 라이브러리

#ensemble

from sklearn.ensemble import AdaBoostClassifier
from sklearn.ensemble import AdaBoostRegressor
from sklearn.ensemble import BaggingClassifier
from sklearn.ensemble import BaggingRegressor
from sklearn.ensemble import ExtraTreesClassifier
from sklearn.ensemble import ExtraTreesRegressor
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.ensemble import RandomForestClassifier
from sklearn.ensemble import RandomForestRegressor



#linear_model
from sklearn.linear_model import BayesianRidge
from sklearn.linear_model import ElasticNet
from sklearn.linear_model import GammaRegressor
from sklearn.linear_model import HuberRegressor
from sklearn.linear_model import Lasso
from sklearn.linear_model import LinearRegression
from sklearn.linear_model import LogisticRegression    # 분류
from sklearn.linear_model import Ridge
from sklearn.linear_model import SGDRegressor
from sklearn.linear_model import SGDClassifier # 분류

import sklearn.metrics # 모델 평가

'인공지능 > machine learning' 카테고리의 다른 글

[ML] 부스트코스 Data Scientist Projects 2024 1주차 (0)	2024.01.17
[DL] 모두를 위한 딥러닝 노트 정리 (2/2) (0)	2023.12.08
분류(Classification) vs 회귀(Regression) 문제 구분하기 (+평가 지표 정리 Confusion Matrix, Precision, Recall, f1-score, ROC, AUC, MAE, MSE, RMSE, ...) (1)	2023.11.16
[ml] 머신러닝 분류 classification 문제 뽀개기 (0)	2023.11.15
[ml] 머신러닝 예측 regression 문제 뽀개기 (0)	2023.11.15

'인공지능/machine learning' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

KEEP GOING

KEEP GOING

[ml] 머신러닝 예측/분류 문제를 풀기 위한 Tips 본문

[ml] 머신러닝 예측/분류 문제를 풀기 위한 Tips

Tips

pandas

sklearn

'인공지능 > machine learning' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역