Python 27

통계학 기초 | 모집단과 표본집단

- 모집단 : 관심있는 집단의 전체- 표본집단 : 모집단에서 뽑아낸 임의의 집단 (이때 데이터가 편향되지 않도록 추출해야함, 방법 여러가지 존재)분포 종류분포 : 이산확률분포와 연속확률분포 존재베르누이 분포 : 확률변수가 취할 수 있는 경우가 2가지이항 분포 : 베르누이 분포의 N번 확장 버전균등 분포 : 모든 X에 대해서 확률이 동일정규 분포 : 평균을 기준으로 좌우 대칭, 종모양 - 평균과 표준편차를 알면 전체 데이터 몇 % 포함되는지 알 수 있음왜도와 첨도- 왜도 : 확률 비대칭 정도 (긴꼬리 분포라고도 함)- 첨도 : 종모양의 뾰족한 정도  - 정규분포보다 첨도가 낮으면 뭉특, 이상치 적음  - 정규분포보다 첨도가 높으면 꼬리 길고, 이상치 많음표준정규분포 : 평균(μ) = 0, 표준편차(σ) =..

Python/통계학 2025.01.08

통계학 기초 | 기술 통계, 추론 통계

기술 통계: 데이터를 요약하고 설명하는 통계 방법- 평균, 중앙값, 분산, 표준편차 등을 사용- 데이터 중 이상치 항상 존재할 수 있음분산- 평균으로부터 얼마나 떨어져 있는지, 데이터의 흩어짐 정도 : 직관적이지 않음표준편차- 분산에 제곱근을 취해서 계산 -> 원래 데이터 값과 동일한 단위로 변환 : 직관적임- 상관관계는 연관관계가 아님 : 추가 분석으로 알아내야함추론 통계: 표본 데이터를 통해 모집단의 특성을 추정, 가설 검정하는 통계 방법 - 주로 신뢰구간, 가설검정 등을 사용 - 데이터 일부를 가지고 전체를 추정하는 것이 핵심

Python/통계학 2025.01.08

파이썬 과제

5번) 이상치 탐지하기 - IQR = Q3 - Q1 (Q3 : 백분율 상위 25%, Q1 : 백분율 하위 25%)- 상한 이상치 = Q3 + 1.5 * IQR- 하한 이상치 = Q1 - 1.5 * IQRheights = [157, 160, 153, 100, 186, 159, 169, 181, 179, 189, 300, 207, 157, 153, 166, 186, 189, 169, 180, 164]import numpy as np def calculate_iqr(data): #numpy 이용해 분위수 계산 data= np.array(data) q1 = np.percentile(data, 25) # 25th percentile q2 = np.percentile(data, 50) # 50th perc..

Python/문제 2025.01.08

파이썬 과제

1번) 짝수 판별하기내가 쓴 답 : n = 3if n == 0: print('0입니다.')elif n % 2 == 0: print('이 숫자는 짝수 입니다.')else: print('이 숫자는 홀수 입니다.')정답 : n = 1if n == 0: print('0 입니다.')elif n%2 == 0: print('짝수입니다.')else: print('홀수입니다.')2번) 제품 재고 관리내가 쓴 답 :inventory_list = [90,60,80]value = 80print('현재 기준 값은', value, '% 입니다.')for index, i in enumerate(inventory_list): # enumerate - 인덱스와 값 동시에 돌릴 때 사용 if i ==..

Python/문제 2025.01.07

데이터 전처리, 데이터 시각화 | 기본 개념

데이터 전처리데이터 불러오기/저장하기- 불러오기 : pd.read_csv(excel)('./파일명.(csv(xlsx)')- 인덱스 0부터 시작, 범위 지정 가능 [0:2] - 0부터 2까지- reset_index : 현재 인덱스를 0부터 다시- 저장하기 : df.to_csv('./newfile.csv', index = False)데이터 확인하기- data.head() : head()은 기본 5개 행에 대한 데이터를 보여줌- data.info() : 데이터 정보 파악 (null 값 확인할 때 활용)- data.info() : 데이터 기초통계량 파악- df.isnull() : 결측치 확인 (.sum 추가하면 몇 개 있는지 확인 가능)- df.dropna() : 결측지 제거데이터 선택하기- data.iloc[..

Python/개념 2025.01.06

파이썬 실시간 강의 4회차

프린트 방법현재 기준 값은 value 입니다.1. print('현재 기준 값은', value, '입니다.')2. print(f'현재 기준 값은 {value} 입니다.'-> 나중에 소수점? 많은 데이터 사용시 유용함3. print('현재 기준 값은 {} 입니다.'.format(value))문제 푸는 순서1. 함수 생각 안 하고 우선 스크립트를 구현2. 잘 작동하는 것을 확인 후 모조리 들여쓰기3. 그 위에 함수 얹기

Python/개념 2025.01.06

파이썬

- 딕셔너리에서 for를 사용하면 key만 순차적으로 가져옴→ key, value 둘 다 출력 원하면 .items() 이용- 매개변수 값이 정해지지 않은 값이면 변수이름 앞에 *을 사용- 함수는 return을 만나는 순간 결괏값을 돌려준 후 함수를 빠져나감→ return을 단독으로 사용하면 함수에서 빠져나갈 수 있음- split(자를 기준)[자른 놈 중 몇번째 추출할지]- startswith(,인덱스 가능) : 전방일치, 검색하는 문자열 앞부터 검색- endswith(,인덱스 가능) : 뒤부터 검색

Python/개념 2025.01.06

파이썬 오류 | ValueError: too many values to unpack, dictionary changed size during iteration, 'NoneType' object is not subscriptable

ValueError: too many values to unpack : 설정한 변수의 개수와 리턴해주는 변수의 개수가 차이가 있을 때 발생하는 오류 -> 개수 맞춰주면 해결dictionary changed size during iteration : 중간에 key를 변경할 경우 데이터 변경 변영에 의해 발생하는 오류  -> list를 넣으면 해결'NoneType' object is not subscriptable : nonetype 객체가 인덱싱될 수 없어서 발생하는 오류

Python/오류 2025.01.06