통계학 기초 | 모집단과 표본집단

Python/통계학

통계학 기초 | 모집단과 표본집단

jjangdoll 2025. 1. 8. 10:54

- 모집단 : 관심있는 집단의 전체
- 표본집단 : 모집단에서 뽑아낸 임의의 집단 (이때 데이터가 편향되지 않도록 추출해야함, 방법 여러가지 존재)

분포 종류

분포

: 이산확률분포와 연속확률분포 존재

베르누이 분포

: 확률변수가 취할 수 있는 경우가 2가지

이항 분포

: 베르누이 분포의 N번 확장 버전

균등 분포

: 모든 X에 대해서 확률이 동일

정규 분포

: 평균을 기준으로 좌우 대칭, 종모양
- 평균과 표준편차를 알면 전체 데이터 몇 % 포함되는지 알 수 있음

왜도와 첨도

- 왜도 : 확률 비대칭 정도 (긴꼬리 분포라고도 함)
- 첨도 : 종모양의 뾰족한 정도
- 정규분포보다 첨도가 낮으면 뭉특, 이상치 적음
- 정규분포보다 첨도가 높으면 꼬리 길고, 이상치 많음

표준정규분포

: 평균(μ) = 0, 표준편차(σ) = 1인 정규분포

rvs (난수 생성)

: Numpy Random 모듈에 대응
- scipy.stats.norm.rvs(loc = 평균, scale = 표준편차, size = 생성할 데이터 갯수, random_state = 시드 설정)

pdf (특정 위치 확률 구하기)

- scipy.stats.norm.pdf(x = 구할 x축 값, loc = 평균, scale = 표준편차)

cdf (누적확률 분포 구하기)

: pdf 의 적분값 -> 면적
- scipy.stats.norm.cdf(x = 구할 x축 값, loc = 평균, scale = 표준편차)

ppf (백분율 알 때 거꾸로 x 값 구하기)

: cdf의 역함수
- scipy.stats.norm.ppf(q = 백분율, loc = 평균, scale = 표준편차)

'Python > 통계학' 카테고리의 다른 글

통계학 기초 \| 가설검정의 주의점 (0)	2025.01.10
통계학 기초 \| 유의성검정, 회귀, 상관관계 (0)	2025.01.08
통계학 기초 \| 기술 통계, 추론 통계 (1)	2025.01.08

현재글통계학 기초 | 모집단과 표본집단

데이터 짱이 되고 싶은 돌

🪨

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

데이터 짱이 되고 싶은 돌