분류 전체보기 146

통계학 기초 | 기술 통계, 추론 통계

기술 통계: 데이터를 요약하고 설명하는 통계 방법- 평균, 중앙값, 분산, 표준편차 등을 사용- 데이터 중 이상치 항상 존재할 수 있음분산- 평균으로부터 얼마나 떨어져 있는지, 데이터의 흩어짐 정도 : 직관적이지 않음표준편차- 분산에 제곱근을 취해서 계산 -> 원래 데이터 값과 동일한 단위로 변환 : 직관적임- 상관관계는 연관관계가 아님 : 추가 분석으로 알아내야함추론 통계: 표본 데이터를 통해 모집단의 특성을 추정, 가설 검정하는 통계 방법 - 주로 신뢰구간, 가설검정 등을 사용 - 데이터 일부를 가지고 전체를 추정하는 것이 핵심

Python/통계학 2025.01.08

파이썬 과제

5번) 이상치 탐지하기 - IQR = Q3 - Q1 (Q3 : 백분율 상위 25%, Q1 : 백분율 하위 25%)- 상한 이상치 = Q3 + 1.5 * IQR- 하한 이상치 = Q1 - 1.5 * IQRheights = [157, 160, 153, 100, 186, 159, 169, 181, 179, 189, 300, 207, 157, 153, 166, 186, 189, 169, 180, 164]import numpy as np def calculate_iqr(data): #numpy 이용해 분위수 계산 data= np.array(data) q1 = np.percentile(data, 25) # 25th percentile q2 = np.percentile(data, 50) # 50th perc..

Python/문제 2025.01.08

파이썬 과제

1번) 짝수 판별하기내가 쓴 답 : n = 3if n == 0: print('0입니다.')elif n % 2 == 0: print('이 숫자는 짝수 입니다.')else: print('이 숫자는 홀수 입니다.')정답 : n = 1if n == 0: print('0 입니다.')elif n%2 == 0: print('짝수입니다.')else: print('홀수입니다.')2번) 제품 재고 관리내가 쓴 답 :inventory_list = [90,60,80]value = 80print('현재 기준 값은', value, '% 입니다.')for index, i in enumerate(inventory_list): # enumerate - 인덱스와 값 동시에 돌릴 때 사용 if i ==..

Python/문제 2025.01.07

SQL | Customers Who Bought All Products, Primary Department for Each Employee

https://leetcode.com/problems/customers-who-bought-all-products/description/Customers Who Bought All Products# 모든 제품을 구매한 고객 아이디# 1) 모든 상품 개수 조회SELECT COUNT(*) FROM Product ;# 2) 고객테이블과 상품테이블 조인# 3) 고객이 산 제품 개수와 모든 상품 개수 같은 고객 아이디만 조회SELECT c.customer_idFROM Product p JOIN Customer c ON p.product_key = c.product_keyGROUP BY 1HAVING COUNT(DISTINCT c.product_key) # 고객이 산 상품 개수= (SELECT COUN..

SQL 2025.01.07

QCC 2회차

📍 고유수면 무조건 distinct 붙이는 습관1번내가 쓴 답 : # 이메일 프로모션에 “동의”한 고객# 해당 고객들 중 "개인(소매)" 고객의 수SELECT COUNT(*) AS customer_countFROM Person_PersonWHERE EmailPromotion != 0 AND PersonType = 'IN';정답 : SELECT COUNT(DISTINCT BusinessEntityID) as customer_countFROM Person_PersonWHERE EmailPromotion > 0 -- 0 = 이메일 프로모션을 받지 않음AND PersonType = 'IN' -- IN = 개인(소매) 고객💡 고유수 구할 때는 무조건 distinct 붙이는 습관! 기억하기2번내가 (뒤늦게) 쓴..

SQL/문제 2025.01.07

SQL | Game Play Analysis IV, Product Sales Analysis III

https://leetcode.com/problems/game-play-analysis-iv/description/Game Play Analysis IV# 처음 로그인하고 바로 다음날 로그인한 플레이어 소수점 둘째자리 반올림# 첫 로그인 날짜부터 최소 이틀 연속 플레이어수 / 전체 플레이어 수# 1) 최초 로그인 날짜 찾기SELECT player_id, MIN(event_date) AS min_dateFROM ActivityGROUP BY 1 ;# 2) 최초 로그인 날짜를 with로 데려옴# 3) 날짜 차이 1일인 것들 합계와 중복제거한 플레이어 수를 나눔WITH a AS( SELECT player_id, MIN(event_date) AS min_date FROM ..

SQL/문제 2025.01.07

SQLD | 데이터 모델링 요소

엔터티 (Entity) : 개체라고도 표현하면 의미있는 하나의 정보 단위를 뜻함엔터티와 인스턴스 관계 : 인스턴스는 특정 데이터 내용이 전체 집합, 이러한 인스턴스가 모여서 엔터티를 형성엔터티 특징- 업무에서 필요로 하는 정보- 식별 가능 여부- 인스턴스의 집합 : 기본적으로 2개 이상의 인스턴스로 구성되어야 함- 업무 프로세스에 의해 활용되어야 함- 속성을 포함해야 함- 관계가 설정되어 있어야 함엔터티의 분류 - 유/무형에 따른 분류  1. 유형 엔터티 : 물리적인 형태가 존재  2. 개념 엔터티 : 개념적인 정보로 구분  3. 사건 엔터티 : 특정 이벤트에 따라 발생    - 발생 시점에 따른 분류  1. 기본/키 엔터티 : 독립적 생성 가능, 고유한 주식별자 갖음  2. 중심 엔터티 : 기본 엔터티..

자격증/SQLD 2025.01.07

데이터 문해력 7장

'데이터로 문제를 해결할 수 있다'는 착각- 시야 확대력 : 데이터로부터 시야를 넓히는 힘데이터 안에는 답이 없다고 생각하라 : 데이터에 의존하지 말고 문제 정의와 목적을 스스로 내린 후, 알맞은 데이터를 걸러서 분석해야한다. 무조건 정답은 하나인 사회 교육을 받아 이런 방식이 어렵겠지만 그래도 해야한다. 데이터 범위를 제한하면 거기에 도출된 결론이 알맞은 결론인지 알 수 없게 된다. 데이터를 다루기 전에 넓게 잡고 가정하는 것이 좋다. 폭넓고 논리적인 시야로 고찰하면 정보나 결과를 놓칠 위험도 줄어들게 된다.시야를 넓히면 분석의 폭도 넓어진다  : 즉흥적으로 생각난 가설에 그치지 말고 논리적으로 생각해 문제를 구조화하는 것이 중요하다. 논리적으로 정리하게 되면, 즉흥적으로 생각할 수 없었던 문제도 알게..

2025.01.07

SQLD | 데이터 모델링

모델링- 현실세계를 얼마나 추상화시켜 표현할 것인지 그리는 과정- 데이터 관점의 업무를 분석하는 과정 (for 정보 시스템, 데이터 베이스 구축)- 현실 세계 데이터 -> 약속된 표기법으로 표현하는 과정데이터 모델이 제공하는 기능- 시각화- 문서화- 구체화- 구조화된 틀 제공- 다양한 관점 제공모델링의 특징- 추상화- 단순화- 명확화데이터 모델링 단계- 개념적 데이터 모델링- 논리적 데이터 모델링- 물리적 데이터 모델링데이터 모델링의 관점데이터 모델링의 중요성- 파급효과 : 구체적인 내용은 변해도 큰 구조는 변화x- 간결한 표현- 데이터 품질- 중복  - 비유연성   - 비일관성- 정보시스템을 구축하는 모든 사람들은 데이터 모델링을 정확하게 해석할 수 있어야함데이터 독립성의 필요성- 유지보수 비용 증가-..

자격증/SQLD 2025.01.07