* Exam Focus 이산과 계속확률 분포의 차이를 배워보자. 여기서는 이항분포와 정규분포가 가장 중요하다. 당신은 반드시 두 분포의 특성에 대해 배워야하고, 이항분포의 평균과 분산을 위한 공식과 이항분포가 주어졌을 때 특수한 값의 확률을 찾아내기 위한 공식을 기억해야한다. 어떻게 확률 변수를 정규화하는지, 그리고 Z-table 을 어떻게 사용하는지 알아두어라. 이 스킬들은 아래의 토픽에서 반복적으로 사용된다.
Discrete and Continuous Random Variables (이산 확률 변수와 연속 확률 변수)
LO 2.1 : 이산 확률 변수와 연속확률 변수를 구별하고 그들의 확률분포를 비교하라.
확률 분포는 확률 변수의 가능한 모든 결과들을 설명한다. 가능한 모든 결과의 확률의 합은 반드시 1로 수렴한다. 단순 확률 분포는 공정한 주사위를 굴리는 것과 같다 ; 여기 6개의 가능한 결과가 있고, 하나의 확률은 1/6이다. 내년의 S&P 500지수의 모든 가능한 이익의 확률분포는 같은 생각의 버전보다 복잡하다.
이산 확률 변수는 각각 셀 수 있는 가능한 모든 결과이고, 그들은 측정 가능하고 양의 확률을 가진다. 이산 확률 변수의 예는 1달 동안 비가 내리는 날들의 수이다. 왜냐하면 가능한 결과들의 수가 유한하기 때문이다. - 1달 동안 비오는 날들의 수는 한 달 안에 있는 날짜의 수로 정의된다.
연속 확률 변수는 낮거나 높은 경계가 존재하는 것처럼 가능한 모든 결과가 무한한 수를 말한다. 0 에서 100 인치까지 내리는 실제 강수량은 연속 확률 변수의 좋은 예이다. 왜냐하면 실제로 내리는 비의 양은 그 값에 따라 무한하다. 하루 내리는 양은 인치, 인치의 반, 1/4인치, 1/1000 인치 혹은 매우 작은 증가로 나눌 수 있다. 그래서 가능한 0 에서 100 사이의 가능한 강우량은 반드시 무한하다.
이산 확률 변수와 연속 확률 변수를 위한 측정 가능한 결과치들의 확률의 배분은 우리에게 이산 확률 분포와 연속 확률 분포를 제공한다. 이 분포들의 차이는 가장 명백히 다음의 특성을 따른다.
ㆍ 이산 분포는 사건 x 가 발생하지 않을 때 P(x) = 0 이고, x가 발생하면 P(x) > 0 이다. P(x) 는 "확률 변수 X = x 일 확률" 이다. 예를 들면 6월에 33일 동안 비가 올 확률은 이것이 발생할 수 없기 때문에 0이다. 그러나 25일 동안 비가 올 확률은 양의 값을 가진다.
ㆍ 연속 분포는 사건 x 가 발생할 수 있어도 P(x) = 0 일 수 있다. 우리는 단지 x1 과 x2가 실제 숫자들일 때 P(x1 =< X =< x2) 를 가정한다. 예를 들면 6월에 2 인치의 비가 올 확률은 0이다. 왜냐하면 2 인치는 가능한 값의 무한한 범위에 있는 하나의 점이기 때문이다. 반면에 비의 양이 1.99999999 와 2.00000001 사이의 인치에 있을 확률은 양의 값을 가진다. 연속 분포의 경우, P(x1) = P(x2) = 0 이므로 관심사는 P(x1 =< X =< x2) = P(x1 < X < x2) 이다.
금융에서 몇 몇 이산 분포는 가능한 결과의 수가 매우 크기 때문에 연속적으로 다루어진다. 예를 들면 미국 주식 거래소에서 거래되는 주식 가격의 증감은 달러와 센트로 기록된다. 그러나 정확히 1.33 과 1.34 의 변화가 있을 확률이나 그 밖의 특별한 변화가 있을 확률은 0 이다. 관습적으로 가능한 가격의 변화의 범위의 확률을 말하기 위해, 1.00 과 2.00 사이의 갑승ㄹ 말한다. 바꿔 말하면 p(price change = 1.33) 은 필연적으로 0이지만 p(1달러 < price change < 2달러) > 0 이다.
Probability Function, Probability Density Function, and Cumulative Distribution Function : 확률 함수, 확률 밀도 함수, 누적 분포 함수
LO 2.2 : 확률 함수, 확률 밀도 함수, 그리고 누적 분포 함수를 토론하라.
p(x) 로 나타내어지는 확률 함수는 구체적인 값과 동등한 확률 변수의 구체적인 확률이다. 보다 공식적으로 말하면 p(x) 는 확률 변수 X 가 x 의 값을 가질 때의 확률이다. p(x) = P(X=x)
확률 함수의 두가지 키 포인트가 있다.
ㆍ 0 =< p(x) =< 1 ㆍ p(x) 의 모든 합은 1이다.
* 예제문제는 생략한다.
f(x) 로 표시되는 확률 밀도 함수는 결과의 특별한 범위 안에 위치하는 연속 분포의 결과를 만들기 위한 확률로 사용된다. 연속 분포는 이산 분포의 확률 함수와 동등하다. 연속 분포에서 무한한 어떤 특수한 결과의 확률은 0 이라는 사실을 기억하라. 확률 밀도 함수는 두 값 사이의 결과의 확률을 계산하는데 사용된다. 인테그랄을 이용한 계산 방식은 시험에 요구되는 수준을 벗어나 있다.
누적 분포 함수는 확률 변수 X 가 동등하거나 그보다 작은 특수한 값 x 를 가져오는 단순한 분포 함수이다. 이는 발생한 결과와 특별한 결과를 포함한 확률의 합 혹은 누적 가치를 의미한다. 확률 변수 X에 대한 누적 분포 합수는 F(x) = P(X =< x) 로 표현된다. 예를 들면 확률 함수가 X = {1,2,3,4} 라는 집합과 p(x) = x / 10 으로 정의되어 있다고 하자. 이 분포에 따르면 F(3) = 0.6 = 0.1 + 0.2 + 0.3 이고 F(4) = 1 = 0.1 + 0.2 + 0.3 + 0.4 이다. F(3) 은 1, 2, 혹은 3이 발생했을 때의 누적 확률을 의미한다. F(4) 는 발생 가능한 모든 결과의 누적 확률이다.
Discrete Uniform and Binomial Random Variables
LO 2.3 : Discrete Uniform 확률 변수와 이항 확률 변수를 설명하라.
Discrete Uniform 확률 변수는 이산 확률 변수로부터 가능한 결과와 같다. 예를 들어 discrete uniform 확률 분포는 X = {1,2,3,4,5}, p(x) = 0.2 로 정의된다. 여기서 각각의 결과에 대한 확률은 0.2 로 동일하다. 또한 누적 확률 함수도 n 번째 결과에서 F(xn) = np(x) 이고, 결과의 범위를 위한 확률도 p(x)k 이다. 여기서 k 는 범위 내에서 발생 가능한 결과의 수이다.
* 예제 문제는 생략한다.
The Binomial Distrubution : 이항분포
이항 확률 변수는 시도의 횟수가 주어졌을 때 "성공" 한 횟수로 정의된다. 즉 결과는 "성공" 혹은 "실패" 일 수 있다. 성공할 확률을 p 는 각각의 시도에 대해 연속적이고, 그 시도들은 독립적이다. 이 최소 실험의 시도를 생각하라. 최종 결과는 n 번 시도했을 때의 성공의 수이다. 이 조건 하에서 이항 확률 함수는 n 번 시도에 있어서 x 번 성공 확률로 정의된다. 이것은 다음의 공식을 사용해서 표현된다.
p(x) = P (X = x) = (n 으로부터 x를 선택하기 위한 방법의 수)p^x(1 - p)^(n-x)
이 때 (n 으로부터 x를 선택하기 위한 방법의 수) 는 nCr 이고 p 는 각각의 시도에서 성공할 확률이다.
* 예제 문제는 생략한다.
The Expected Value of a Binomial Random Variable
n 번의 시도가 주어졌을 때, 기대되는 성공 횟수나 E(X) 그리고 X의 분산이나 Var(X) 는 다음의 공식을 따른다.
기대되는 X의 값 = E(X) = np X 의 분산 = Var(X) = np(1-p) = npq