분류 전체보기 146

태블로 | 도넛 차트 만들기

데이터 : https://www.kaggle.com/competitions/ga-customer-revenue-prediction/data?select=train.csv Google Analytics Customer Revenue PredictionPredict how much GStore customers will spendwww.kaggle.com1. 열 더블클릭 1 입력 → 우클릭 후 차원으로 변경( 이때 1은 임의로 하나의 값을 만들어주는 역할)2. 마크를 파이차트로 설정3. 각도에 Full Visitor Id 드래그 앤 드롭 → 측정값을 카운트 고유로 변경4. 색상에 Channel Grouping 드래그 여기까지는 파이차트 만들기1. 열에 있는 1 복사한 후 하나 이중축으로 설정2. 두번째 1에..

태블로 2025.02.10

WIL (1.27-2.2)

FACTS(사실, 객관) : 이번 일주일 동안 있었던 일, 내가 한 일- 원본 데이터에서 대회 데이터로 바꿨다- 여러가지 모델을 돌려봤다FEELINGS(느낌, 주관) : 나의 감정적인 반응, 느낌- 연휴 내내 원본 데이터로 돌려서 나름 성능 많이 올렸는데 거의 마지막에 데이터를 바꿔서 살짝 당황스러웠다- 그래도 더 큰 데이터라 성능이 더 잘 나왔다FINDINGS(배운 것) : 그 상황으로부터 내가 배운 것, 얻은 것- 열정적이고 적극적인 조원들 사이에서 하니 나도 나름 적극적?으로 변하고 있는 것 같다 (아직 멀었지만)FUTURE(미래) : 배운 것을 미래에는 어떻게 적용할 지- 아직 많이 부족해서 계속 공부를 해야겠다.

TIL 25.1.30

심화 프로젝트 - 로지스틱 회귀, catboost 기법 사용 - 오버샘플링 : SMOTE, resample. ADASYN 사용    → 로지스틱 회귀는 다른 오버샘플링 사용해도 값 비슷   → catboost는 resample로 했을 때 recall 0.76, macro avg 0.79로 나름 잘 나옴(근데 f1-score가 0.61) - 이탈한 고객만 뽑아서 kmeans 돌려봤는데 결과가 영..튜터님이 recall 값이 0.7이상이면 나름 잘 나온 값이라고 하긴 하셨지만 다른 값들이 너무 낮아서..물론 아직 기본만 돌리긴 했지만 그래도 찝찝쓰

TIL 25.1.27

2025.01.27 - [Python/머신러닝] - 머신러닝 | CatBoost 머신러닝 | CatBoost- 범주형 데이터를 수치형으로 자동 변환 → 데이터 처리 간소화- 순서형 부스팅과 고르게 분포된 트리를 사용해 정확도를 높이고, 과적합을 줄이는 것이 특징notes1365.tistory.com계속 돌렸는데 값이 너무 작게 나와서 좋게 나온 기준을 모르겠어서 튜터님과 상담을 했는데 잘 나온거였다...!방향성을 잘 알려주셔서 연휴 동안 값을 더 좋게 만들고 그 이후 작업을 하면 좋을 것 같음한 내용은 내일 정리해야지...ㅎㅎ

WIL (1.20-1.26)

FACTS(사실, 객관) : 이번 일주일 동안 있었던 일, 내가 한 일머신러닝 과제, 프로젝트 시작, 파이썬 챌린지 라이브 세션 끝FEELINGS(느낌, 주관) : 나의 감정적인 반응, 느낌통계학 과제 때도 느꼈지만 확실히 아직 개념들이 잘 안 잡혀있어서 너무 헷갈림뭔가 이번주도 집중이 왜 이렇게 안 될까.. FINDINGS(배운 것) : 그 상황으로부터 내가 배운 것, 얻은 것빅쿼리 적재하는 법, 파이썬 가상환경 구축, 데이터 수집 자동화 등을 배움FUTURE(미래) : 배운 것을 미래에는 어떻게 적용할 지챌린지반 내용이 살짝 어렵긴 한데 확실히 잘 익혀두면 나중 프로젝트 때 유용할 것 같다.파이썬 처음에 배웠을 때 안 돌아가서 챗지피티한테 물어봐서 가상환경 구축했었는데 제대로 배우니까 뭔가 아하! 느낌