'분류 전체보기' 카테고리의 글 목록 (2 Page)

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Recent Posts

Recent Comments

Today

Total

관리 메뉴

목록 분류 전체보기 (304)

KEEP GOING

독서후기 : 진작 이렇게 말할걸 (저자 : 모리타 시오무)

전달 매체가 아무리 늘어나도 사람과 사람이 마주하는 '원칙'은 바뀌지 않는다고 생각한다. 바로 자신과 상대방을 존중하면서 문제를 해결하기 위해 포기하지 않고 대화하는 자세다. 그 과정에서 얻게 되는 관계의 지혜는 모든 것이 불확실하고 앞이 보이지 않는 시대에도 앞으로 나아갈 수 있는 힘을 길러준다. 자신의 생각이나 감정을 솔직하게 표현하면서도, 상대를 존중하는 말하기 방식을 '어서티브'라고 한다. 어서티브에서는 상대를 이겨야 할 대상이 아닌 꼬인 관계 이면에 숨은 문제를 함께 풀어나가는 협력자로 대한다. 상처때문에 관계 맺기가 두렵다면 한 걸음 더 내디딜 용기마음에 새겨야 할 두가지가 있다. 하나는 무슨 말을 할 때 '상대방이 알아서 잘 헤아려 줄 것'이라는 착각을 버리는 일이다. 상대방은 나와 사고방식..

etc/review 2024. 1. 24. 16:59

[ML] 부스트코스 Data Scientist Projects 2024 2주차

목차 2.1.1 당뇨병 데이터셋 미리보기 EDA(Exploratory Data Analysis) 1주차에서는 전처리 없이 데이터셋을 모델에 입력값으로 넣어 그대로 결과를 예측했었다. EDA를 통해 데이터들의 특징을 알아보고 feature를 어떻게 전처리해줘야 할지 선택해보자. import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt %matplotlib inline # 구버전 주피터노트북에서 그래프 표시를 위함 df = pd.read_csv("data/diabetes.csv") df.shape df.head() df.info() head()를 통해 컬럼에 담긴 값들을 확인할 수 있다. 그리고 in..

인공지능/machine learning 2024. 1. 22. 18:54

[ML] 부스트코스 Data Scientist Projects 2024 1주차

1.1.1 사이킷런 소개 사이킷런은 python에서 제공하는 대표적인 머신러닝 라이브러리이다. 사이킷런은 머신러닝 기법인 classification, regression, clustering 등을 제공하는데 이 기법들은 머신러닝 아래에서 하위 범주들로 나뉜다. classification과 regression은 머신러닝 중 지도학습(supervised learning)에 속한다. 지도학습은 모델이 정답(=label)이 있는 데이터를 학습하여 데이터와 정답간의 관계를 파악하는 방법을 말한다. 그리고 비지도 학습(unsupervised learning)은 정답이 없는 데이터를 모델이 학습하는 방법을 의미한다. 대표적으로 clustering, dimensionality reduction같은 기법이 비지도학습에 ..

인공지능/machine learning 2024. 1. 17. 07:04

[DL] 배치 사이즈(batch size)/에폭(epoch)/반복(iteration) 개념 파악하기

목차 개요 딥러닝에서 최적화(optimization)란 손실함수(loss function)를 최소화(minimize)하는 파라미터를 찾아가는 과정입니다. 파라미터를 최적화하기 위해서는 데이터를 분할하여 여러 번의 훈련 과정을 거칩니다. 이때 구분이 필요한 개념이 배치(batch size)와 에폭(epoch) 그리고 반복(iteration)입니다. 배치 사이즈(batch size) 한 번의 배치마다 주는 데이터 샘플의 크기 배치(=미니 배치라고도 불림)는 전체 데이터셋을 일정 크기로 분할한 작은 데이터 셋을 의미합니다. 이때 배치 사이즈는 이러한 작은 데이터 셋(=배치)의 크기를 뜻합니다. 예를 들어 500개의 데이터셋이 있을 때, 5번에 걸쳐 학습한다면 배치는 5개이고 배치 사이즈는 100이 됩니다. 그..

인공지능/deep learning 2023. 12. 27. 17:31

[DL] 모두를 위한 딥러닝 노트 정리 (2/2)

강의: https://www.youtube.com/watch?v=BS6O0zOGX4E&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 소스코드: https://github.com/hunkim/DeepLearningZeroToAll/tree/master/tf2

인공지능/machine learning 2023. 12. 8. 16:39

분류(Classification) vs 회귀(Regression) 문제 구분하기 (+평가 지표 정리 Confusion Matrix, Precision, Recall, f1-score, ROC, AUC, MAE, MSE, RMSE, ...)

분류 어떤 대상을 정해진 범주에 구분하여 넣는 작업 ex. 사람의 질병 유무 판별(1/0), 책의 IT 도서 유무 판별(1,0) 등 타깃값은 범주형 데이터여야한다. 타깃값의 데이터 범주가 2개라면 => 이진 분류 타깃값의 데이터 범주가 3개라면 => 다중 분류 분류 평가지표 1. 오차(=혼동) 행렬 Confusion Matrix 실제 타깃값과 예측한 타깃값이 어떻게 매칭되는지 확인 실제\예측 0 1 0 1291 74 1 151 110 실제로 매칭 안됐는데, 매칭이 안됐다고 예측한 경우: 1291건 (참 양성) 실제로 매칭이 됐는데, 실제로 매칭이 됐다고 예측한 경우: 110건(참 음성) 실제로 예측이 안됐는데, 매칭이 됐다고 예측한 경우: 74건 (제 1종 오류) 실제로 예측이 됐는데, 매칭이 안됐다고 ..

인공지능/machine learning 2023. 11. 16. 02:52

[ml] 머신러닝 분류 classification 문제 뽀개기

* 와인 종류를 분류하는 문제 https://heytech.tistory.com/149# [Python] Random Forest 알고리즘 정의, 장단점, 최적화 방법📚목차 1. 랜덤포레스트 정의 2. 랜덤포레스트 장단점 3. 실습코드 및 데이터셋 4. 코드 설명 1. Random Forest 정의 Random Forest는 의사결정나무 모델 여러 개를 훈련시켜서 그 결과를 종합해 예측하는 heytech.tistory.com Tips1. dir과 help 함수 이용하기help(list.append) help(pandas) dir(pandas) 2. 어떤 모델을 선택할지 모르겠을 경우 랜덤포레스트 사용 from sklearn.ensemble import RandomForestClassifier from s..

인공지능/machine learning 2023. 11. 15. 20:22

[ml] 머신러닝 예측 regression 문제 뽀개기

문제 - 자동차 가격 예측 모델 선형회귀로 먼저 학습 후 랜덤포레스트 방식으로 성능 개선 (오차 줄이기) https://ebbnflow.tistory.com/m/140 [캐글] 중고차 가격 예측 모델1_선형회귀 Linear Regression() ● Kaggle 캐글(Kaggle)은 머신러닝 대회로 유명한 플랫폼 입니다. 알고리즘 문제를 푸는 백준, 프로그래머스 사이트와 비슷한 개념입니다. 캐글에 있는 여러 데이터셋과 문제들로 데이터 전처리, ebbnflow.tistory.com 랜덤포레스트 오버피팅 문제를 해결하기 위해 앙상블 기법인 랜덤 포레스트를 적용한다. 앙상블 기법은 여러 개의 모델을 훈련하여 결과를 종합하여 예측하는 방법을 뜻한다. train dataset에서 중복을 허용하여 샘플링한 데이터 ..

인공지능/machine learning 2023. 11. 15. 20:21

Prev 1 2 3 4 5 ··· 38 Next

목록 분류 전체보기 (304)

KEEP GOING

티스토리툴바