본문 바로가기

2024 - 1학기/데이터분석입문

7장: 이항분포와 그에 관련된 분포들 Reporting Date: July. 15, 2024 모집단의 구성원들이 두 그룹으로 나누어져 있는 경우의 표본추출에서 광범위하게 쓰이는 확률모형과 그의 특징 및 관련된 다른 확률모형들을 다루고자 한다.   1 .  자 료 의  입 력## 교재 출처 최하단에 표시 ### 예제 7 : 어떤 초등학교에서 10 년간 조사결과# 평균적으로 4 % 의 학생이 색맹인 것으로 나타났다고 한다. (p.213)# 올해에도 색맹인 학생의 비율이 예년과 같다고 할 때,# 임의로 추출된 200 명의 학생 중 색맹인 학생이 10 명 이하일 확률은 얼마인가?   2 .  베 르 누 이  시 행 ( Bernoulli  Distribution ) 모집단의 각 구성원이 두 그룹 중 하나에 속하는 경우, 각각의 구성원이 특정.. 더보기
6장: 확률분포 Reporting Date: July. 11, 2024 5 장에서 다룬 표본공간의 근원사건들은 특성을 표현하는 형태로 다뤘다. 이제는 확률변수를 중심으로 실험의 수치적 결과에 대해 다루고자 한다.   1 .  확 률 변 수  ( Random  Variable )각각의 근원사건들에 실수값을 "대응시키는 함수"이며  X, Y, … 등으로 표시한다.  확률변수가 가질 수 있는  "값의 개수" 가 유한하거나 무한이라도  "셀 수 있는 경우" 에 이를  "이산확률변수" 라고 한다.또한, 연속적인 구간에 속하는 모든 값을 다 가질 수 있는  "연속확률변수" 도 있다.   2 .  이 산 확 률 분 포  ( Discrete  Probability  Distribution )확률변수가 갖는 값들과 그에  "대응하는 확.. 더보기
5장: 확률 Reporting Date: July. 8, 2024 통계적인 추론을 통해서도 모집단에 대한 다양한 정보를 얻을 수 있다.그 통계적 추론의 기초가 되는 확률이론에 대해 다루고자 한다.   1 .   사 건 의  확 률동일한 조건하에서  "한 가지 실험을 반복할 때,"전체 실험 횟수에서 그 사건이 일어나리라고  "예상되는 횟수의 비율" 을 말한다. 사건을  A 라고 하면,  사건  A 의 확률은  P ( A ) 로 표시한다.  1 - 1 .  표 본 공 간  ( Sample  Space:  Ω )한 실험에서 나올 수 있는 모든 결과들의 모임.유한표본공간 ( Finite Sample Space )  연속표본공간 ( Continuous Sample Space )    1 - 2 .  근 원 사 건  ( El.. 더보기
4장: 두 변수 자료의 요약 Reporting Date: July. 4, 2024 조사 대상의 각 개체로부터 둘 또는 그 이상의 변수들을 동시에 관측하는 경우가 더 많다.두 변수에 관한 관측값을 도표로 요약하고 해석하는 방법을 다루고자 한다.   1 .  자 료 의  입 력## 교재 출처 최하단에 표시 ### 예제5: 통계학과 신입생 51명의 키와 몸무게를 기록한 것이다.# 키와 몸무게의 표본상관계수를 구하고, 산점도를 그려라. (p.108)import numpy as np# 키와 몸무게 자료의 입력height = np.array([181,161,170,160,158,168,162,179,183,178,171,177,163, 158,160,160,158,173,160,163,167,165,163,17.. 더보기
3장: 수치를 통한 연속형 자료의 요약 Reporting Date: June. 30, 2024 연속형 자료가 어떤 값을 중심으로 분포되어 있는가를 나타내는 중심위치의 측도,각 자료가 중심위치의 값으로부터 흩어진 정도를  나타내는 퍼진 정도의 측도 등을 다루고자 한다.   1 .  자 료 의   입 력## 교재 출처 최하단에 표시 ### 예제13: 정량 100인 음료수 80병을 임의로 추출하여 그 내용물의 실제 측정된 양을 잰 자료이다.(p.42)import numpy as np# 변수 drink에 NumPy 배열을 할당drink = np.array([98, 99, 100, 99, 99.4, 101.7, 98.8, 101.8, 101.5, 101.8, 102.6, 101, 98.8, 101.4, 99.7, 99.7.. 더보기
2장: 표와 그림을 통한 자료의 요약 Reporting Date: June. 9, 2024 자료를 효과적으로 요약하고 이해하기 위해 표나 그림을 사용하는 방법에 대해 다루고자 한다.자료 요약은 분석 대상인 자료의 형태와 특성에 따라 다양한 방법으로 이루어진다. 1 .  자 료 의  입 력## 교재 출처 최하단에 표시 ### 예제1: 사망자 목록 중 130명을 임의로 추출, 이들의 사망원인을 10가지로 분류하였다.(p.35)import numpy as np# 변수 death에 NumPy 배열을 할당death = np.array([2, 1, 2, 4, 2, 5, 3, 3, 5, 6, 3, 8, 3, 3, 6, 3, 6, 5, 3, 5, 2, 6, 2, 3, 4, 3, 2, 9, 2.. 더보기