均匀分布

均匀分布

在概率论中,均匀分布(uniform distribution)是最简单的连续型随机变量所服从的概率分布。它可以推广到有限维随机向量上去,即得到几何概型的概率分布。

目录

1 模型

2 数字特征

3 有限维情形

4 应用

5 统计特性

6 上下节

7 参考资料

模型[]

a

>

b

{\displaystyle a > b}

为有限数,如果一个连续型随机变量

X

{\displaystyle X}

的概率密度函数是如下形式

f

(

x

)

=

{

1

b

a

,

a

x

b

,

0

,

otherwise

.

{\displaystyle f(x) = \begin{cases}

\dfrac{1}{b-a}, & a \leqslant x \leqslant b, \\

0 , & \text{otherwise}.

\end{cases}}

我们就称随机变量

X

{\displaystyle X}

服从均匀分布,记作

X

U

[

a

,

b

]

.

{\displaystyle X \sim U[a, b].}

上述函数中的区间

[

a

,

b

]

{\displaystyle [a, b]}

可以改为任何有限区间,即该区间的测度(长度)为有限值

l

{\displaystyle l}

,在该区间内随机变量的密度函数值为

1

l

.

{\displaystyle \dfrac{1}{l}.}

均匀分布的概率分布函数是

F

(

x

)

=

x

f

(

t

)

d

t

=

{

0

,

x

a

,

x

a

b

a

,

a

<

x

b

,

1

,

x

>

b

.

{\displaystyle F(x) = \int_{-\infty}^x f(t) \mathrm{d}t = \begin{cases}

0 , & x \leqslant a, \\

\dfrac{x-a}{b-a}, & a < x \leqslant b, \\

1 , & x > b.

\end{cases}}

这个模型是几何概型一维直线情形下的严格定义。

数字特征[]

X

U

[

a

,

b

]

{\displaystyle X \sim U[a,b]}

的数学期望和方差分别为

E

(

X

)

=

a

+

b

2

,

D

(

X

)

=

(

a

b

)

2

12

.

{\displaystyle E(X) = \dfrac{a+b}{2}, D(X) = \dfrac{(a-b)^2}{12}.}

这是因为

E

(

X

)

=

a

b

x

b

a

d

x

=

a

+

b

2

.

D

(

X

)

=

a

b

1

b

a

(

x

a

+

b

2

)

2

d

x

=

1

3

(

b

a

)

(

x

a

+

b

2

)

3

|

a

b

=

(

a

b

)

2

12

.

{\displaystyle \begin{align}

E(X) & = \int_a^b \dfrac{x}{b-a} \mathrm{d}x = \dfrac{a+b}{2}. \\

D(X) & = \int_a^b \dfrac{1}{b-a} \cdot \left( x - \dfrac{a+b}{2} \right)^2 \mathrm{d}x \\

& = \dfrac{1}{3(b-a)} \left. \left( x - \dfrac{a+b}{2} \right)^3 \right|_a^b = \dfrac{(a-b)^2}{12}.

\end{align}}

它的特征函数是

e

b

i

t

e

a

i

t

i

t

(

b

a

)

.

{\displaystyle \dfrac{\text{e}^{b\text{i}t}-\text{e}^{a\text{i}t}}{\text{i}t(b-a)}.}

有限维情形[]

可以将上述分布模型推广到有限维情形,设集合

S

R

d

{\displaystyle S \in \R^d}

是 Lebesgue 可测的,有一随机向量

X

=

(

X

1

,

X

2

,

,

X

d

)

{\displaystyle \boldsymbol{X} = (X_1, X_2, \cdots, X_d)}

,且它的联合概率密度函数是

f

(

x

)

=

{

1

m

(

S

)

,

x

S

,

0

,

x

S

.

{\displaystyle f(\boldsymbol{x}) = \begin{cases}

\dfrac{1}{m(S)}, & \boldsymbol{x} \in S, \\

0 , & \boldsymbol{x} \notin S.

\end{cases}}

其中,有限数

m

(

S

)

{\displaystyle m(S)}

S

{\displaystyle S}

的测度(二维下为其面积,三维下为其体积),我们就说随机向量

X

{\displaystyle \boldsymbol{X}}

服从

d

{\displaystyle d}

维均匀分布。这是几何概型的有限维情形下的严格定义。

应用[]

均匀分布在统计中常用来检验某随机变量是否服从某种特定分布,设有服从分布函数

F

(

x

)

{\displaystyle F(x)}

的随机变量

X

{\displaystyle X}

,那么

F

(

x

)

{\displaystyle F(x)}

存在严格递增的反函数

F

1

(

x

)

{\displaystyle F^{-1} (x)}

,若

Y

=

F

(

X

)

{\displaystyle Y = F(X)}

,则

Y

{\displaystyle Y}

的分布函数

F

Y

(

y

)

=

P

{

F

(

X

)

<

y

}

=

{

0

,

y

0

,

P

{

X

<

F

1

(

y

)

}

=

F

(

F

1

(

y

)

)

=

y

,

y

(

0

,

1

)

,

1

,

y

1

,

{\displaystyle F_Y (y) = P \{ F(X) < y \} = \begin{cases}

0, & y \leqslant 0, \\

P \{ X < F^{-1} (y) \} = F(F^{-1} (y)) = y, & y \in (0, 1), \\

1, & y \geqslant 1,

\end{cases}}

显然,

Y

U

[

0

,

1

]

{\displaystyle Y \sim U[0, 1]}

如果将上述过程倒过来,就可以用均匀分布的随机变量生成服从某种特定分布的随机变量,设由严格单调递增定义在

R

{\displaystyle \R}

上的函数

F

(

x

)

{\displaystyle F(x)}

,满足

lim

x

F

(

x

)

=

0

,

lim

x

+

F

(

x

)

=

1

{\displaystyle \lim_{x \to -\infty} F(x) = 0, \lim_{x \to +\infty} F(x) = 1}

,显然它可以作为某个随机变量的分布函数,

F

(

x

)

{\displaystyle F(x)}

存在严格递增的反函数

F

1

(

x

)

{\displaystyle F^{-1} (x)}

,设有服从均匀分布的随机变量

Y

U

[

0

,

1

]

{\displaystyle Y \sim U[0, 1]}

,若

Y

=

F

(

X

)

{\displaystyle Y = F(X)}

,则

X

{\displaystyle X}

的分布函数

F

X

(

x

)

=

P

{

F

1

(

Y

)

<

x

}

=

P

{

Y

<

F

(

x

)

}

=

F

(

x

)

.

{\displaystyle F_X (x) = P \{ F^{-1} (Y) < x \} = P \{ Y < F(x) \} = F(x).}

这说明,经过函数作用的新随机数

X

=

F

1

(

Y

)

{\displaystyle X = F^{-1} (Y)}

服从分布函数为

F

(

X

)

{\displaystyle F(X)}

的概率分布。

统计特性[]

指数分布族

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

0

,

θ

)

{\displaystyle U(0, \theta)}

的支集依赖于参数

θ

{\displaystyle \theta}

,因此不是指数分布族。

充分完备统计量

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

0

,

θ

)

{\displaystyle U(0, \theta)}

是完备的,且它的一个充分完备统计量是

T

=

max

1

k

n

X

k

=

X

(

n

)

.

{\displaystyle T = \max_{1 \leqslant k \leqslant n} X_k = X_{(n)}.}

参数空间

Θ

=

{

θ

:

θ

R

}

{\displaystyle \varTheta = \{\theta: \theta \in \R \}}

上的均匀分布族

U

(

θ

0.5

,

θ

+

0.5

)

{\displaystyle U(\theta-0.5, \theta+0.5)}

的一个充分统计量是

(

X

(

1

)

,

X

(

n

)

)

{\displaystyle (X_{(1)}, X_{(n)})}

,但它不是完备的。

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

θ

/

2

,

θ

/

2

)

{\displaystyle U(-\theta/2, \theta/2)}

的一个充分统计量是

(

X

(

1

)

,

X

(

n

)

)

{\displaystyle (X_{(1)}, X_{(n)})}

,但它不是完备的。

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

θ

,

2

θ

)

{\displaystyle U(\theta, 2\theta)}

的一个充分统计量是

(

X

(

1

)

,

X

(

n

)

)

{\displaystyle (X_{(1)}, X_{(n)})}

,但它不是完备的。

点估计

参数空间

Θ

=

{

(

θ

1

,

θ

2

)

:

θ

1

,

θ

2

R

,

θ

1

<

θ

2

}

{\displaystyle \varTheta = \{(\theta_1, \theta_2): \theta_1, \theta_2 \in \R, \theta_1 < \theta_2 \}}

上的均匀分布族

U

(

θ

1

,

θ

2

)

{\displaystyle U(\theta_1, \theta_2)}

的矩估计是

θ

^

1

=

X

¯

3

S

n

,

θ

^

2

=

X

¯

+

3

S

n

{\displaystyle \hat{\theta}_1 = \overline{X} - \sqrt{3}S_n, \hat{\theta}_2 = \overline{X} + \sqrt{3}S_n}

,其中

S

n

{\displaystyle S_n}

是样本标准差。

参数空间

Θ

=

{

(

θ

1

,

θ

2

)

:

θ

1

,

θ

2

R

,

θ

1

<

θ

2

}

{\displaystyle \varTheta = \{(\theta_1, \theta_2): \theta_1, \theta_2 \in \R, \theta_1 < \theta_2 \}}

上的均匀分布族

U

(

θ

1

,

θ

2

)

{\displaystyle U(\theta_1, \theta_2)}

的极大似然估计是

θ

^

1

=

X

(

1

)

,

θ

^

2

=

X

(

n

)

{\displaystyle \hat{\theta}_1 = X_{(1)}, \hat{\theta}_2 = X_{(n)}}

,它们不是无偏的,修正后的无偏估计是

θ

^

1

=

n

X

(

1

)

X

(

n

)

n

1

,

θ

^

2

=

n

X

(

n

)

X

(

1

)

n

1

.

{\displaystyle \hat{\theta}_1^* = \dfrac{nX_{(1)} - X_{(n)}}{n-1}, \hat{\theta}_2^* = \dfrac{nX_{(n)} - X_{(1)}}{n-1}.}

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

0

,

θ

)

{\displaystyle U(0, \theta)}

的极大似然估计是

θ

^

=

X

(

n

)

{\displaystyle \hat{\theta} = X_{(n)}}

,它不是无偏的,但是弱相合的,修正后的无偏估计是

n

+

1

n

X

(

n

)

{\displaystyle \dfrac{n+1}{n} X_{(n)}}

,同时它也是一致最小方差无偏估计。而参数的函数

1

θ

{\displaystyle \dfrac{1}{\theta}}

没有无偏估计。

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

θ

/

2

,

θ

/

2

)

{\displaystyle U(-\theta/2, \theta/2)}

关于参数

θ

{\displaystyle \theta}

的无偏估计有

X

(

1

)

+

X

(

n

)

2

,

X

¯

{\displaystyle \dfrac{X_{(1)}+X_{(n)}}{2}, \overline{X}}

,前者更有效。

区间估计

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

0

,

θ

)

{\displaystyle U(0, \theta)}

,关于参数

θ

{\displaystyle \theta}

的置信水平为

1

α

(

0

,

1

)

{\displaystyle 1-\alpha \in (0, 1)}

的置信区间是

[

X

(

n

)

,

X

(

n

)

/

α

n

]

.

{\displaystyle [X_{(n)}, X_{(n)}/\sqrt[n]{\alpha}].}

参数空间

Θ

=

{

(

θ

1

,

θ

2

)

:

θ

1

,

θ

2

R

,

θ

1

<

θ

2

}

{\displaystyle \varTheta = \{(\theta_1, \theta_2): \theta_1, \theta_2 \in \R, \theta_1 < \theta_2 \}}

上的均匀分布族

U

(

θ

1

,

θ

2

)

{\displaystyle U(\theta_1, \theta_2)}

变程

θ

2

θ

1

{\displaystyle \theta_2 - \theta_1}

的置信水平为

1

α

{\displaystyle 1-\alpha}

的近似置信区间是

[

X

(

n

)

X

(

1

)

Be

n

1

,

2

(

α

/

2

)

,

X

(

n

)

X

(

1

)

Be

n

1

,

2

(

1

α

/

2

)

]

{\displaystyle \left[ \dfrac{X_{(n)} - X_{(1)}}{\text{Be}_{n-1,2}(\alpha/2)}, \dfrac{X_{(n)} - X_{(1)}}{\text{Be}_{n-1,2}(1-\alpha/2)} \right]}

(枢轴量为

1

X

(

n

)

X

(

1

)

θ

2

θ

1

Be

(

n

1

,

2

)

{\displaystyle 1 - \dfrac{X_{(n)} - X_{(1)}}{\theta_2-\theta_1} \sim \text{Be}(n-1,2)}

β 分布);

中点

θ

1

+

θ

2

2

{\displaystyle \dfrac{\theta_1+\theta_2}{2}}

的置信水平为

1

α

{\displaystyle 1-\alpha}

的近似置信区间是

[

X

(

n

)

+

X

(

1

)

2

(

α

1

n

1

1

)

X

(

n

)

X

(

1

)

2

,

X

(

n

)

+

X

(

1

)

2

+

(

α

1

n

1

1

)

X

(

n

)

X

(

1

)

2

]

.

{\displaystyle \left[ \dfrac{X_{(n)} + X_{(1)}}{2} - (\alpha^{-\frac{1}{n-1}} - 1) \dfrac{X_{(n)} - X_{(1)}}{2}, \dfrac{X_{(n)} + X_{(1)}}{2} + (\alpha^{-\frac{1}{n-1}} - 1) \dfrac{X_{(n)} - X_{(1)}}{2} \right].}

(枢轴量为

X

(

n

)

+

X

(

1

)

(

θ

1

+

θ

2

)

X

(

n

)

X

(

1

)

{\displaystyle \dfrac{X_{(n)} + X_{(1)} - (\theta_1+\theta_2)}{X_{(n)} - X_{(1)}}}

,其密度函数是

f

(

x

)

=

n

1

2

(

1

+

|

x

|

)

n

{\displaystyle f(x) = \dfrac{n-1}{2(1+|x|)^n}}

)。

参数空间

Θ

=

{

θ

:

θ

R

}

{\displaystyle \varTheta = \{\theta: \theta \in \R \}}

上的均匀分布族

U

(

θ

0.5

,

θ

+

0.5

)

{\displaystyle U(\theta-0.5, \theta+0.5)}

,关于参数

θ

{\displaystyle \theta}

置信水平为

1

α

{\displaystyle 1-\alpha}

的置信区间是

[

X

(

n

)

+

X

(

1

)

2

1

α

1

/

n

2

,

X

(

n

)

+

X

(

1

)

2

+

1

α

1

/

n

2

]

.

{\displaystyle \left[ \dfrac{X_{(n)} + X_{(1)}}{2} - \dfrac{1-\alpha^{1/n}}{2}, \dfrac{X_{(n)} + X_{(1)}}{2} + \dfrac{1-\alpha^{1/n}}{2} \right].}

其中枢轴量为

X

(

n

)

+

X

(

1

)

2

θ

{\displaystyle \dfrac{X_{(n)} + X_{(1)}}{2} - \theta}

,它的密度函数是

f

(

x

)

=

n

(

1

|

2

x

|

)

n

1

I

[

0.5

,

0.5

]

.

{\displaystyle f(x) = n(1-|2x|)^{n-1} I_{[-0.5,0.5]}.}

假设

X

1

,

X

2

,

,

X

m

U

(

0

,

θ

1

)

,

Y

1

,

Y

2

,

,

Y

n

U

(

0

,

θ

2

)

{\displaystyle X_1, X_2, \cdots, X_m \sim U(0, \theta_1), Y_1, Y_2, \cdots, Y_n \sim U(0, \theta_2)}

且相互独立,其中

θ

1

,

θ

2

{\displaystyle \theta_1, \theta_2}

是参数,那么

θ

1

/

θ

2

{\displaystyle \theta_1/\theta_2}

置信水平为

1

α

{\displaystyle 1-\alpha}

的近似置信区间是

[

X

(

m

)

Y

(

n

)

(

m

+

n

m

α

2

)

1

n

,

X

(

m

)

Y

(

n

)

(

m

+

n

n

α

2

)

1

m

]

.

{\displaystyle \left[ \dfrac{X_{(m)}}{Y_{(n)}} \left( \dfrac{m+n}{m} \dfrac{\alpha}{2} \right)^\frac{1}{n}, \dfrac{X_{(m)}}{Y_{(n)}} \left( \dfrac{m+n}{n} \dfrac{\alpha}{2} \right)^{-\frac{1}{m}} \right].}

枢轴量是

Y

(

n

)

X

(

m

)

θ

1

θ

2

{\displaystyle \dfrac{Y_{(n)}}{X_{(m)}}\dfrac{\theta_1}{\theta_2}}

的密度函数是

f

(

x

)

=

{

m

n

m

+

n

x

m

1

,

x

1

,

m

n

m

+

n

x

n

1

,

x

<

1.

{\displaystyle f(x) = \begin{cases}

\dfrac{mn}{m+n} x^{-m-1}, & x \geqslant 1, \\

\dfrac{mn}{m+n} x^{n-1}, & x < 1.

\end{cases}}

参数假设检验

参数空间

Θ

=

{

θ

:

θ

>

0

}

{\displaystyle \varTheta = \{\theta: \theta > 0 \}}

上的均匀分布族

U

(

0

,

θ

)

{\displaystyle U(0, \theta)}

,给定

θ

0

>

0

{\displaystyle \theta_0 > 0}

,那么检验水平为

α

{\displaystyle \alpha}

的如下检验问题

H

0

:

θ

θ

0

H

1

:

θ

>

θ

0

{\displaystyle H_0: \theta \leqslant \theta_0 \longleftrightarrow H_1: \theta > \theta_0}

的似然比检验和一致最优检验的拒绝域都是

W

=

{

X

(

n

)

>

θ

0

1

α

n

}

.

{\displaystyle W = \{ X_{(n)} > \theta_0 \sqrt[n]{1-\alpha} \}.}

上下节[]

上一节:指数分布

下一节:正态分布

参考资料李贤平, 《概率论基础(第3版)》, 高等教育出版社, 北京, 2010-04, ISBN 978-7-0402-8890-2.

概率分布(学科代码:1106420,GB/T 13745—2009)

概率公理化

随机事件 ▪ 样本空间 ▪ De Morgan 定理 ▪ 概率空间 ▪ 古典概型 ▪ 几何概型 ▪ 条件概率 ▪ 事件独立性 ▪ 独立重复试验 ▪ Bernoulli 概型

随机变量

离散型随机变量 ▪ 连续型随机变量 ▪ 随机变量的函数 ▪ 随机向量 ▪ 边缘分布 ▪ 条件分布 ▪ 随机变量的独立性 ▪ 随机向量的函数 ▪ 极差分布

随机变量的特征

数学期望 ▪ 方差 ▪ 协方差 ▪ 相关系数 ▪ 矩 ▪ 母函数 ▪ 矩量母函数 ▪ 特征函数 ▪ 示性函数 ▪ 中位数 ▪ 众数 ▪ 峰度 ▪ 偏度

离散概率分布

二项分布 ▪ 几何分布 ▪ Pascal 分布 ▪ Poisson 分布 ▪ 超几何分布 ▪ 对数分布 ▪ 负二项分布 ▪ 多项分布 ▪ 多元超几何分布

连续概率分布

正态分布 ▪ 均匀分布 ▪ 指数分布 ▪ 对数正态分布 ▪ Γ 分布 ▪ χ 分布 ▪ β 分布 ▪ Rayleigh 分布 ▪ Cauchy 分布 ▪ Pareto 分布 ▪ Laplace 分布 ▪ Weibull 分布 ▪ Maxwell 分布律 ▪ 二元正态分布 ▪ 多元正态分布

统计三大分布

χ² 分布 ▪ F 分布 ▪ t 分布 ▪ 非中心 χ² 分布 ▪ 非中心 F 分布 ▪ 非中心 t 分布

所在位置:数学(110)→ 概率论(11064)→ 概率分布(1106420)

相关推荐

专题:车险买了多久生效
365betvip5

专题:车险买了多久生效

📅 07-25 👁️ 5461
yy语音怎么改按键说话声音(键盘上的一个按键即可快速实现)
新车临牌可以申请几次,最长多久?一文读懂
find7原装手机电池
365娱乐官网官方网站

find7原装手机电池

📅 08-03 👁️ 9246
淘手游简介 淘手游怎么样 淘手游安全吗→MAIGOO百科
如何打开mobile365

淘手游简介 淘手游怎么样 淘手游安全吗→MAIGOO百科

📅 07-23 👁️ 403
peixiaofeng
如何打开mobile365

peixiaofeng

📅 08-20 👁️ 1881