'분류 전체보기' 카테고리의 글 목록 (2 Page)

태블로 | 도넛 차트 만들기

데이터 : https://www.kaggle.com/competitions/ga-customer-revenue-prediction/data?select=train.csv Google Analytics Customer Revenue PredictionPredict how much GStore customers will spendwww.kaggle.com1. 열 더블클릭 1 입력 → 우클릭 후 차원으로 변경( 이때 1은 임의로 하나의 값을 만들어주는 역할)2. 마크를 파이차트로 설정3. 각도에 Full Visitor Id 드래그 앤 드롭 → 측정값을 카운트 고유로 변경4. 색상에 Channel Grouping 드래그 여기까지는 파이차트 만들기1. 열에 있는 1 복사한 후 하나 이중축으로 설정2. 두번째 1에..

태블로 2025.02.10

TIL 25.2.5

문제 - 오늘 제출인데 아직도 안 끝남 - 자꾸 뭐가 추가됨해결과정 - 하는중~..해결완료 - 시간 안에는 못끝낼 것 같음새롭게 알게 된 점 - 새롭지는 않지만 할 일은 미리미리.. - 근데 미리미리 했는데...ㅜ

내일배움캠프/TIL 2025.02.05

TIL 25.2.3

문제- 군집화했는데 실루엣 계수가 안 높음- 높으면 시각화가 안 이쁨- pca로 3차원 축소했을 때 설명력?이 진짜 낮음해결과정- 계속 변수 돌려보는중해결완료- 해결 못함 (아마 pca 안 쓸듯)새롭게 알게 된 점- 실루엣 계수가 안 높고(or 시각화가 안 이뻐도) 우리 기준?으로 말을 잘 설명하면 괜찮음- 왜냐하면 현실이 그러하기 때문^^..

내일배움캠프/TIL 2025.02.03

WIL (1.27-2.2)

FACTS(사실, 객관) : 이번 일주일 동안 있었던 일, 내가 한 일- 원본 데이터에서 대회 데이터로 바꿨다- 여러가지 모델을 돌려봤다FEELINGS(느낌, 주관) : 나의 감정적인 반응, 느낌- 연휴 내내 원본 데이터로 돌려서 나름 성능 많이 올렸는데 거의 마지막에 데이터를 바꿔서 살짝 당황스러웠다- 그래도 더 큰 데이터라 성능이 더 잘 나왔다FINDINGS(배운 것) : 그 상황으로부터 내가 배운 것, 얻은 것- 열정적이고 적극적인 조원들 사이에서 하니 나도 나름 적극적?으로 변하고 있는 것 같다 (아직 멀었지만)FUTURE(미래) : 배운 것을 미래에는 어떻게 적용할 지- 아직 많이 부족해서 계속 공부를 해야겠다.

내일배움캠프/WIL 2025.02.03

TIL 25.1.31

심화 프로젝트- recall 값을 많이 올리긴 함- 원본 데이터보다 대회용 데이터가 값이 더 잘나와서 주말에 다시 돌려볼 예정- 피피티도 대충 어떻게 만들지 생각- 분석한 코드는 나중에 한꺼번에 정리할 예정

내일배움캠프/TIL 2025.01.31

TIL 25.1.30

심화 프로젝트 - 로지스틱 회귀, catboost 기법 사용 - 오버샘플링 : SMOTE, resample. ADASYN 사용 → 로지스틱 회귀는 다른 오버샘플링 사용해도 값 비슷 → catboost는 resample로 했을 때 recall 0.76, macro avg 0.79로 나름 잘 나옴(근데 f1-score가 0.61) - 이탈한 고객만 뽑아서 kmeans 돌려봤는데 결과가 영..튜터님이 recall 값이 0.7이상이면 나름 잘 나온 값이라고 하긴 하셨지만 다른 값들이 너무 낮아서..물론 아직 기본만 돌리긴 했지만 그래도 찝찝쓰

내일배움캠프/TIL 2025.01.30

TIL 25.1.28

심화 프로젝트데이터 : https://www.kaggle.com/datasets/shubhammeshram579/bank-customer-churn-prediction/data Bank Customer Churn PredictionPredicting customer churn in banking industry using machine learning.www.kaggle.comEDA기본 정보import pandas as pd import seaborn as sns import matplotlib.pyplot as pltbank_df = pd.read_csv('/Users/baehyeyeon/Documents/파이썬/Churn_Modelling.csv')bank_df.shape(10002, 14)bank_..

내일배움캠프/TIL 2025.01.28

TIL 25.1.27

2025.01.27 - [Python/머신러닝] - 머신러닝 | CatBoost 머신러닝 | CatBoost- 범주형 데이터를 수치형으로 자동 변환 → 데이터 처리 간소화- 순서형 부스팅과 고르게 분포된 트리를 사용해 정확도를 높이고, 과적합을 줄이는 것이 특징notes1365.tistory.com계속 돌렸는데 값이 너무 작게 나와서 좋게 나온 기준을 모르겠어서 튜터님과 상담을 했는데 잘 나온거였다...!방향성을 잘 알려주셔서 연휴 동안 값을 더 좋게 만들고 그 이후 작업을 하면 좋을 것 같음한 내용은 내일 정리해야지...ㅎㅎ

내일배움캠프/TIL 2025.01.27

머신러닝 | CatBoost

- 범주형 데이터를 수치형으로 자동 변환 → 데이터 처리 간소화- 순서형 부스팅과 고르게 분포된 트리를 사용해 정확도를 높이고, 과적합을 줄이는 것이 특징

Python/머신러닝 2025.01.27

WIL (1.20-1.26)

FACTS(사실, 객관) : 이번 일주일 동안 있었던 일, 내가 한 일머신러닝 과제, 프로젝트 시작, 파이썬 챌린지 라이브 세션 끝FEELINGS(느낌, 주관) : 나의 감정적인 반응, 느낌통계학 과제 때도 느꼈지만 확실히 아직 개념들이 잘 안 잡혀있어서 너무 헷갈림뭔가 이번주도 집중이 왜 이렇게 안 될까.. FINDINGS(배운 것) : 그 상황으로부터 내가 배운 것, 얻은 것빅쿼리 적재하는 법, 파이썬 가상환경 구축, 데이터 수집 자동화 등을 배움FUTURE(미래) : 배운 것을 미래에는 어떻게 적용할 지챌린지반 내용이 살짝 어렵긴 한데 확실히 잘 익혀두면 나중 프로젝트 때 유용할 것 같다.파이썬 처음에 배웠을 때 안 돌아가서 챗지피티한테 물어봐서 가상환경 구축했었는데 제대로 배우니까 뭔가 아하! 느낌

내일배움캠프/WIL 2025.01.26

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

데이터 짱이 되고 싶은 돌

분류 전체보기 146

티스토리툴바