분류 전체보기 146

TIL 25.1.24

프로젝트 시작 : [분류] 은행 고객 이탈여부 분류분류 대표적인 분류 알고리즘 - 로지스틱 회귀 : 선형 모델 (이지만 다항 분류에도 쓰임) - k-NN : 거리에 기반하여 가장 가까운 k개의 이웃 클래스를 보고 다수결로 분류 - SVM : 마진을 최대로 하는 결정 경계를 찾아 분류 - Decision Tree / Random Forest (제일 많이 사용)    - 결정 트리 : 데이터 특성을 기준으로 분할하여 분류    - 랜덤 포레스트 : 여러 결정 트리를 앙상블하여 과적합을 방지, 성능을 높임 - Gradient Boosting (XGBoost, LightGBM 등) : 결정 트리를 약한 학습기로 사용, 에러를 점진적으로 줄임 - Naive Bayes : 독립 변수 간 독립성을 가정한 확률 기반 ..

TIL 25.1.21

2025.01.21 - [SQL/문제] - SQL | QCC 4회차 SQL | QCC 4회차1번 지역별로 매출이 가장 높은 매장의 매출을 조회.단, 해당 지역에 매장이 두 개 이상인 경우만 결과에 포함결과는 지역 이름을 기준으로 오름차순SELECT REGION_NAME AS region_name, MAX(SALES) AS highest_snotes1365.tistory.com2025.01.21 - [Python/개념] - 파이썬 | API구현하고 출력하기 파이썬 | API구현하고 출력하기from google.colab import userdataimport requestsimport pandas as pdimport xml.etree.ElementTree as ET# API 엔드포인트url = 'http..

파이썬 | 코드 저장하고 빅쿼리에 데이터 올리기

빅쿼리에 데이터 업로드 - 빅쿼리 회원가입 후 서비스 계정 생성 - 키 (.json파일로)- 다운받은 키 파일 업로드- 빅쿼리 - 스튜디오 - 프로젝트 이름 옆 점 세개 - 데이터 세트 만들기- 만들면 내 프로젝트 밑에 추가됨key_path = list(uploaded.keys())[0]credentials = service_account.Credentials.from_service_account_file(key_path)from google.cloud import bigqueryclient = bigquery.Client(credentials=credentials, project=credentials.project_id)job = client.load_table_from_dataframe(df,'myd..

Python/개념 2025.01.21

SQL | QCC 4회차

1번 지역별로 매출이 가장 높은 매장의 매출을 조회.단, 해당 지역에 매장이 두 개 이상인 경우만 결과에 포함결과는 지역 이름을 기준으로 오름차순SELECT REGION_NAME AS region_name, MAX(SALES) AS highest_salesFROM stores s GROUP BY 1HAVING COUNT(REGION_NAME) >=2ORDER BY 1 ;2번다음 조건에 해당되는 사용자 수를 출력 :결제를 하지 않고 상품을 주문한 사용자첫 번째 결제일보다 이전에 상품을 주문한 사용자내가 쓴 답 : WITH a AS( SELECT USER_ID, MIN(PAY_DATE) AS first_pay_date FROM payments GROUP BY 1)SELECT COUNT(o.USER_ID) ..

SQL/문제 2025.01.21

A/B 테스트 제대로 이해하기 ③, ④, ⑤

https://yozm.wishket.com/magazine/detail/1656/ A/B 테스트 제대로 이해하기: 3 A/B 테스트 계산기의 세팅과 해석 | 요즘IT앞선 두 편의 글에서, ‘실제 A/B 테스트를 설계할 때 우리가 진짜 궁금한 질문’과 ‘A/B 테스트 실험 결과의 유의미한 방안’, 그리고 ‘이를 바탕으로 A/B 테스트의 설계 및 해석에 필요한 기초yozm.wishket.comA/B 테스트 제대로 이해하기: ③ A/B 테스트 계산기의 세팅과 해석요약계산기 세팅 및 해석 : AB TestguideTest Data : 각 그룹 표본 크기, 그룹별 최종 전환 숫자Setting-Hypthesis : 단측 검정 / 양측 검정 설정Setting-Confidence : 신뢰수준 설정양측 검정 vs 단측..

아티클스터디 2025.01.17