랜덤변수들

Bernoulli

변수의 의미

어떤 사건이 일어났을 때 동시에 다른 사건도 일어나는 겨우를 말하며 예를 들면 성공이 있으면 반대로 실패도 있는 경우를 말한다. 베르누이 랜덤변수는 성공했을 때 1이고 실패했을 때는 0 인 indicator function이다. parameter로는 어떤 사건이 성공할 확률 p를 말한다.

PMF와 CDF

$P_{X}(k) = p^{k}(1-p)^{1-k}, k = 0,1, ... \\ F_{X}(x) = \begin{cases} 0 & ,x<0 \\ 1-p & ,0 \leq x < 1 \\ p & ,x \geq 1 \\ \end{cases}$

평균과 분산

평균은 당연히 p확률로 일어나므로 p이고 분산은 정의에 의해 구하면 아래와 같다. $\mu_{X} = p \\ \sigma_{X}^{2} = p(1-p)$

Binomial

변수의 의미

n번의 독립 베르누이 실행 중 성공한 횟수이다. 파라미터로 시행횟수 n 과 성공할 확률 p를 갖는다. n=1 일때는 베르누이 와 같다. 그래서 n개의 Bernoulli 변수 의 합은 binomial 변수 이다. $Y\text{ ~ Binomial R.V with }(n,p) \\ X_{i} \text{ ~ Bernoulli R.V with } (p) = \text{Binomial R.V with } (1,p) \\ Y = \sum_{i=1}^{n}X_{i}$

PMF와 CDF

CDF는 우측방향에서 만 연속이 된다. $P_{X}(k) = \sum_{k=0}^{n} {n \choose k} p^{k}(1-p)^{n-k} \text{ for } k = 0,1, ... \\ F_{X}(x) = \sum_{k=0}^{n} {n \choose k} p^{k}(1-p)^{n-k} \text{ for } n \leq x < n+1 \\$

평균과 분산

Binomial은 Bernoulli의 n개 합이므로 아래와 같은 값을 갖는다. 직관적으로 n번 시행했을 때 평균은 np가 된다. $\mu_{X} = np \\ \sigma_{X}^{2} = np(1-p)$

Geometric

변수의 의미

Bernoulli 시행의 sequence에서 첫번재 성공까지의 시행횟수이며 파라미터로 p 를 갖는다.

중요한 특징으로는 Memoryless property를 갖으며 Exponential distribution도 동일한 특성을 지닌다.

아래서 보면 알겠지만 Exponetial r.v는 연속적인 변수에서 Geometric r.v와 비슷한 것을 알 수있다.

시행이 무수히 많아지고 (n이 무한으로) 성공확률이 희박해질때 (p가 0으로) 로 근사화시켜서 생각해보면 된다.

Memoryless Property는 아래와 같다. $P(X > i + j | X > i) = P(X > j) \text{ for } i,j \geq 1$ i시간 까지 계속 일어나던 사건이 j시간후 에도 일어날 확률은 j 시간 후에 사건이 일어날 확률과같다.

즉 i시간 까지 일어난 사건은 j시간 후에 그 사건이 일어나는데 아무런 관련이 없다는 말과 같다.

PMF와 CDF

0 번 째 부터 사건이 성공할 수 없으므로 k =1 부터 시작이다.

k-1 번째까지는 계속 실패하다가 k번째에 성공할 확률로 구할 수 있다. $P_{X}(k) = (1-p)^{k-1}p \text{ for } k = 1,2, ... \\ F_{X}(x) = 1 - (1 - p)^{x} \text{ for } k \leq x < k+1$

평균과 분산

Bernoulli 시행의 성공확률이 높을 수록 빨리 끝나게 되고 낮을 수록 늦게 끝나니까 평균은 Bernoulli와 반비례관계를 갖게 된다. $\mu_{X} = \frac{1}{p} \\ \sigma_{X}^{2} = \frac{(1-p)}{p^2}$

Negative Binomial

변수의 의미

Bernoulli 시행의 sequence에서 k번재 성공까지의 시행횟수이며 파라미터로 k와 p 를 갖는다.

k=1 일때는 Geometric R.V 와 같다. 그래서 n개의 Bernoulli 변수 의 합은 binomial 변수 이다. $Y\text{ ~ Negative Binomial R.V with }(k,p) \\ X_{i} \text{ ~ Geometric R.V with } (p) = \text{Negative Binomial R.V with } (1,p) \\ Y = \sum_{i=1}^{n}X_{i}$

PMF와 CDF

최소시행 횟수는 k가 된다.

x-1 번째 시행 $P_{X}(x) = {x-1 \choose k-1} p^{k}(1-p)^{x-k} \text{ for } x = k,k+1, ... \\ F_{X}(x) = \sum_{i=0}^{n} {x-1 \choose k-1} p^{k}(1-p)^{i-k} \text{ for } k \leq x < k+1 \\$

평균과 분산

Negative Binomial R.V은 Geometric R.V의 n개 합이므로 아래와 같은 값을 갖는다. 직관적으로 n번 시행했을 때 평균은 k/p가 된다. $\mu_{X} = \frac{K}{p} \\ \sigma_{X}^{2} = \frac{K(1-p)}{p^2}$

Poisson

변수의 의미

평균적으로 일정시간동안 $\lambda$ 번 일어나는 사건이 일정시간동안 일어나는 실제 횟수를 의미하며 파라미터로 $\lambda> 0$를 갖는다. Binomial R.V의 Continuous Version이라고 생각하면 된다. 그러면 시행 n 은 무수히 많아지고 사건이 일어날 확률은 p는 거의 0에 가깝게 된다. $Y \text{ ~ Poisson R.V($\lambda$)} \\ X \text{ ~ Binomial R.V (n, p)} \\ Y = lim_{n \rightarrow \infty, p \rightarrow 0}X$

PMF와 CDF

시간의 nonegative이므로 정의역 k 는 0부터 시작한다. $P_{X}(k) = e^{\lambda}\frac{\lambda^{k}}{K!} \text{ for } k = 0,1,...\\ F_{X}(x) = e^{\lambda}\sum_{k=0}^{n}\frac{\lambda^{k}}{K!} \text{ for } n \leq x < n+1$

평균과 분산

Binomial에서 n의 시행동안 사건이 일어나는 평균은 np였기 때문에 $\lambda = np$ 로 생각할 수있고 평균 또한 직관적으로 $\lambda$ 가 된다. $\mu_{X} = \lambda \\ \sigma_{X}^{2} = \lambda$

Exponential

변수의 의미

Poisson 분포를 따르는 사건이 처음 발생할 때까지 대기시간이며 파라미터로 $\lambda > 0$ 를 갖는다.

Geometric R.V의 Continous Version이라고 생가하면 되고 유사하게 memoryless property를 갖는다. 즉 memoryless property로부터 그것을 만족하는 distribution을 유도하면 Cauchy Functional Equation에 의해서 Exponential ditribution이 유도된다.

PDF와 CDF

랜덤변수가 시간이므로 연속적인 값을 갖기 때문에 정의역도 양의 연속적인 값을 갖는다. $f_{X}(x) = \lambda e^{-\lambda x} \text{ for } x > 0 \\ F_{X}(X) = 1 - e^{-\lambda x} \text{ for } x \geq 0$

평균과분산

평균은 $\lambda$ 가 클수록 대기시간이 길어지고, 작을수록 대기시간이 짧으므로 반비례적인 관계를 갖는다. $\mu_{X} = \frac{1}{\lambda} \\ \sigma_{X}^{2} = \frac{1}{\lambda^{2}}$

Rayleigh

변수의 의미

직교성분이 Gaussian R.V 일때 벡터의 크기 혹은 실수부와 허수부가 Gaussian 분포일 때 복소수의 크기를 의미하며 파라미터로 가우시안 분포의 표준편차인 $\sigma$ 를 갖는다.

직관적으로 Gaussian R.V 의 제곱합은 exponential R.V이기 때문에 루트 expontential R.V 와 관계를 갖음을 알 수 있다. 따라서 아래와 같은 관계식을 갖는다. $Y \text{ ~ Rayleigh R.V}(\sigma) \\ X \text{ ~ Exponential R.V}(\lambda) \\ Y = \sqrt{X}, \sigma = \frac{1}{\sqrt{2\lambda}}$

PDF와 CDF

크기의 값을 갖으므로 랜덤변수가 음이 아닌 실수값을 갖고 정의역도 음이아닌 실수가된다. $f_{X}(x) = \frac{x}{\sigma^2}e^{-\frac{x^{2}}{2\sigma^{2}}} \text{ for } x \geq 0 \\ F_{X}(x) = 1 - e^{-\frac{x^{2}}{2\sigma^{2}}} \text{ for } x \geq 0$

평균과분산

각성분의 분산값이 커질수록 평균 벡터들의 값도 커지며 분산도 커지게 될것이다. 그래서 직관적으로 표준편차와 비례하는 형태를 갖을 것으로 예측할 수 있고 값을 아래와 같다. $\mu_{X} = \sigma\sqrt{\frac{\pi}{2}} \\ \sigma_{X}^{2} = \frac{4 - \pi}{2}\sigma^{2}$

Gamma

변수의 의미

poisson분포를 따르는 사건이 $\alpha$ 번 일어날 때까지 대기시간을 의미하며 파라미터로는 $\alpha, \lambda > 0$ 를 갖는다.

Exponential R.V 와 Gamma R.V과의 관계 Bernoulli 와 Binomial과의 관계의 Continous Version이라고 생각하면 된다. 따라서 Exponential R.V 로 부터 Gamma R.V를 만들 수 있다는 말이다. 잘생각해보면 Exponential R.V 로 Rayleigh R.V를 만들수 있고 그 말은 Rayleigh R.V로 부터 Gamma R.V를 만들 수 있다는 말이다. 관계는 아래와 같다. $Y\text{ ~ Gamma R.V with }(\alpha,\lambda) \\ X \text{ ~ Exponential R.V with } (\lambda) = \text{Gamma R.V with } (1,\lambda) \\ R_{i} \text{ ~ Rayleigh R.V}(\sigma) \\ R_i = \sqrt{X}, \sigma = \frac{1}{\sqrt{2\lambda}} \\ Y = \sum_{i=1}^{n}R_{i} \\ \begin{cases} \alpha=n \\ \lambda = 2\sigma^2 \end{cases}$

PDF와 CDF

Exponetial 분포와 마찬가지로 랜덤변수가 시간의 의미를 갖기에 정의역도 양의 연속적인 값을 갖는다. $f_{X}(x) = \frac{\lambda e^{-\lambda x (\lambda x)^{\alpha - 1}}}{\Gamma(\alpha)} \text{ for } x > 0 \\ \Gamma(\alpha) = \int_{0}^{\infty} e^{-x}x^{\alpha-1} dx \\ F_{X}(x) = \int _{0}^{x} f_{X}(x) dx$

여기서 $\Gamma(\alpha)$ 는 Factorial 을 복소수로 확장한 의미를 지닌다고한다. 그래서 아래와 같은 성질을 지닌다. $\Gamma(\alpha) =\Gamma(\alpha-1)\Gamma(\alpha-2)...\Gamma(1) \\ \text{양의 정수 n에 대해서 } \Gamma(n) = (n-1)!$

평균과 분산

직관적으로 Exponential distribution의 평균에 $\alpha$ 배 를 한 것임을 알 수있다. $\mu_{X} = \frac{\alpha}{\lambda} \\ \sigma_{X}^{2} = \frac{\alpha}{\lambda^{2}}$

Gamma R.V를 이용하면 여러가지 다른 분포를 가진 R.V들을 만들어 낼 수있다. 또다른 분포들은 추후에 업데이트 하도록 할 것이다. 관계식을 보면 아래와 같다. $Chi-Squared\text{ R.V with } (\lambda = \frac{1}{2}) = Gamma \text{ R.V with } (\alpha = \frac{n}{2}, \lambda = \frac{1}{2}) \\ Erlang \text{ R.V with } (n, \lambda = Gamma \text{ R.V with } (n, \lambda)$

Share on

Twitter Facebook LinkedIn

Random Variables

sw Yoo

랜덤변수들

Bernoulli

변수의 의미

PMF와 CDF

평균과 분산

Binomial

변수의 의미

PMF와 CDF

평균과 분산

Geometric

변수의 의미

PMF와 CDF

평균과 분산

Negative Binomial

변수의 의미

PMF와 CDF

평균과 분산

Poisson

변수의 의미

PMF와 CDF

평균과 분산

Exponential

변수의 의미

PDF와 CDF

평균과분산

Rayleigh

변수의 의미

PDF와 CDF

평균과분산

Gamma

변수의 의미

PDF와 CDF

평균과 분산

Share on

Leave a comment

You may also enjoy

Pybullet Tutorial을 해보자.

Reeds-Shepp (RS) Path

Model Predictive Control (MPC)

RRT star