在概率论中,均匀分布(uniform distribution)是最简单的连续型随机变量所服从的概率分布。它可以推广到有限维随机向量上去,即得到几何概型的概率分布。
目录
1 模型
2 数字特征
3 有限维情形
4 应用
5 统计特性
6 上下节
7 参考资料
模型[]
设
a
>
b
{\displaystyle a > b}
为有限数,如果一个连续型随机变量
X
{\displaystyle X}
的概率密度函数是如下形式
f
(
x
)
=
{
1
b
−
a
,
a
⩽
x
⩽
b
,
0
,
otherwise
.
{\displaystyle f(x) = \begin{cases}
\dfrac{1}{b-a}, & a \leqslant x \leqslant b, \\
0 , & \text{otherwise}.
\end{cases}}
我们就称随机变量
X
{\displaystyle X}
服从均匀分布,记作
X
∼
U
[
a
,
b
]
.
{\displaystyle X \sim U[a, b].}
上述函数中的区间
[
a
,
b
]
{\displaystyle [a, b]}
可以改为任何有限区间,即该区间的测度(长度)为有限值
l
{\displaystyle l}
,在该区间内随机变量的密度函数值为
1
l
.
{\displaystyle \dfrac{1}{l}.}
均匀分布的概率分布函数是
F
(
x
)
=
∫
−
∞
x
f
(
t
)
d
t
=
{
0
,
x
⩽
a
,
x
−
a
b
−
a
,
a
<
x
⩽
b
,
1
,
x
>
b
.
{\displaystyle F(x) = \int_{-\infty}^x f(t) \mathrm{d}t = \begin{cases}
0 , & x \leqslant a, \\
\dfrac{x-a}{b-a}, & a < x \leqslant b, \\
1 , & x > b.
\end{cases}}
这个模型是几何概型一维直线情形下的严格定义。
数字特征[]
X
∼
U
[
a
,
b
]
{\displaystyle X \sim U[a,b]}
的数学期望和方差分别为
E
(
X
)
=
a
+
b
2
,
D
(
X
)
=
(
a
−
b
)
2
12
.
{\displaystyle E(X) = \dfrac{a+b}{2}, D(X) = \dfrac{(a-b)^2}{12}.}
这是因为
E
(
X
)
=
∫
a
b
x
b
−
a
d
x
=
a
+
b
2
.
D
(
X
)
=
∫
a
b
1
b
−
a
⋅
(
x
−
a
+
b
2
)
2
d
x
=
1
3
(
b
−
a
)
(
x
−
a
+
b
2
)
3
|
a
b
=
(
a
−
b
)
2
12
.
{\displaystyle \begin{align}
E(X) & = \int_a^b \dfrac{x}{b-a} \mathrm{d}x = \dfrac{a+b}{2}. \\
D(X) & = \int_a^b \dfrac{1}{b-a} \cdot \left( x - \dfrac{a+b}{2} \right)^2 \mathrm{d}x \\
& = \dfrac{1}{3(b-a)} \left. \left( x - \dfrac{a+b}{2} \right)^3 \right|_a^b = \dfrac{(a-b)^2}{12}.
\end{align}}
它的特征函数是
e
b
i
t
−
e
a
i
t
i
t
(
b
−
a
)
.
{\displaystyle \dfrac{\text{e}^{b\text{i}t}-\text{e}^{a\text{i}t}}{\text{i}t(b-a)}.}
有限维情形[]
可以将上述分布模型推广到有限维情形,设集合
S
∈
R
d
{\displaystyle S \in \R^d}
是 Lebesgue 可测的,有一随机向量
X
=
(
X
1
,
X
2
,
⋯
,
X
d
)
{\displaystyle \boldsymbol{X} = (X_1, X_2, \cdots, X_d)}
,且它的联合概率密度函数是
f
(
x
)
=
{
1
m
(
S
)
,
x
∈
S
,
0
,
x
∉
S
.
{\displaystyle f(\boldsymbol{x}) = \begin{cases}
\dfrac{1}{m(S)}, & \boldsymbol{x} \in S, \\
0 , & \boldsymbol{x} \notin S.
\end{cases}}
其中,有限数
m
(
S
)
{\displaystyle m(S)}
是
S
{\displaystyle S}
的测度(二维下为其面积,三维下为其体积),我们就说随机向量
X
{\displaystyle \boldsymbol{X}}
服从
d
{\displaystyle d}
维均匀分布。这是几何概型的有限维情形下的严格定义。
应用[]
均匀分布在统计中常用来检验某随机变量是否服从某种特定分布,设有服从分布函数
F
(
x
)
{\displaystyle F(x)}
的随机变量
X
{\displaystyle X}
,那么
F
(
x
)
{\displaystyle F(x)}
存在严格递增的反函数
F
−
1
(
x
)
{\displaystyle F^{-1} (x)}
,若
Y
=
F
(
X
)
{\displaystyle Y = F(X)}
,则
Y
{\displaystyle Y}
的分布函数
F
Y
(
y
)
=
P
{
F
(
X
)
<
y
}
=
{
0
,
y
⩽
0
,
P
{
X
<
F
−
1
(
y
)
}
=
F
(
F
−
1
(
y
)
)
=
y
,
y
∈
(
0
,
1
)
,
1
,
y
⩾
1
,
{\displaystyle F_Y (y) = P \{ F(X) < y \} = \begin{cases}
0, & y \leqslant 0, \\
P \{ X < F^{-1} (y) \} = F(F^{-1} (y)) = y, & y \in (0, 1), \\
1, & y \geqslant 1,
\end{cases}}
显然,
Y
∼
U
[
0
,
1
]
{\displaystyle Y \sim U[0, 1]}
。
如果将上述过程倒过来,就可以用均匀分布的随机变量生成服从某种特定分布的随机变量,设由严格单调递增定义在
R
{\displaystyle \R}
上的函数
F
(
x
)
{\displaystyle F(x)}
,满足
lim
x
→
−
∞
F
(
x
)
=
0
,
lim
x
→
+
∞
F
(
x
)
=
1
{\displaystyle \lim_{x \to -\infty} F(x) = 0, \lim_{x \to +\infty} F(x) = 1}
,显然它可以作为某个随机变量的分布函数,
F
(
x
)
{\displaystyle F(x)}
存在严格递增的反函数
F
−
1
(
x
)
{\displaystyle F^{-1} (x)}
,设有服从均匀分布的随机变量
Y
∼
U
[
0
,
1
]
{\displaystyle Y \sim U[0, 1]}
,若
Y
=
F
(
X
)
{\displaystyle Y = F(X)}
,则
X
{\displaystyle X}
的分布函数
F
X
(
x
)
=
P
{
F
−
1
(
Y
)
<
x
}
=
P
{
Y
<
F
(
x
)
}
=
F
(
x
)
.
{\displaystyle F_X (x) = P \{ F^{-1} (Y) < x \} = P \{ Y < F(x) \} = F(x).}
这说明,经过函数作用的新随机数
X
=
F
−
1
(
Y
)
{\displaystyle X = F^{-1} (Y)}
服从分布函数为
F
(
X
)
{\displaystyle F(X)}
的概率分布。
统计特性[]
指数分布族
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
0
,
θ
)
{\displaystyle U(0, \theta)}
的支集依赖于参数
θ
{\displaystyle \theta}
,因此不是指数分布族。
充分完备统计量
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
0
,
θ
)
{\displaystyle U(0, \theta)}
是完备的,且它的一个充分完备统计量是
T
=
max
1
⩽
k
⩽
n
X
k
=
X
(
n
)
.
{\displaystyle T = \max_{1 \leqslant k \leqslant n} X_k = X_{(n)}.}
参数空间
Θ
=
{
θ
:
θ
∈
R
}
{\displaystyle \varTheta = \{\theta: \theta \in \R \}}
上的均匀分布族
U
(
θ
−
0.5
,
θ
+
0.5
)
{\displaystyle U(\theta-0.5, \theta+0.5)}
的一个充分统计量是
(
X
(
1
)
,
X
(
n
)
)
{\displaystyle (X_{(1)}, X_{(n)})}
,但它不是完备的。
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
−
θ
/
2
,
θ
/
2
)
{\displaystyle U(-\theta/2, \theta/2)}
的一个充分统计量是
(
X
(
1
)
,
X
(
n
)
)
{\displaystyle (X_{(1)}, X_{(n)})}
,但它不是完备的。
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
θ
,
2
θ
)
{\displaystyle U(\theta, 2\theta)}
的一个充分统计量是
(
X
(
1
)
,
X
(
n
)
)
{\displaystyle (X_{(1)}, X_{(n)})}
,但它不是完备的。
点估计
参数空间
Θ
=
{
(
θ
1
,
θ
2
)
:
θ
1
,
θ
2
∈
R
,
θ
1
<
θ
2
}
{\displaystyle \varTheta = \{(\theta_1, \theta_2): \theta_1, \theta_2 \in \R, \theta_1 < \theta_2 \}}
上的均匀分布族
U
(
θ
1
,
θ
2
)
{\displaystyle U(\theta_1, \theta_2)}
的矩估计是
θ
^
1
=
X
¯
−
3
S
n
,
θ
^
2
=
X
¯
+
3
S
n
{\displaystyle \hat{\theta}_1 = \overline{X} - \sqrt{3}S_n, \hat{\theta}_2 = \overline{X} + \sqrt{3}S_n}
,其中
S
n
{\displaystyle S_n}
是样本标准差。
参数空间
Θ
=
{
(
θ
1
,
θ
2
)
:
θ
1
,
θ
2
∈
R
,
θ
1
<
θ
2
}
{\displaystyle \varTheta = \{(\theta_1, \theta_2): \theta_1, \theta_2 \in \R, \theta_1 < \theta_2 \}}
上的均匀分布族
U
(
θ
1
,
θ
2
)
{\displaystyle U(\theta_1, \theta_2)}
的极大似然估计是
θ
^
1
=
X
(
1
)
,
θ
^
2
=
X
(
n
)
{\displaystyle \hat{\theta}_1 = X_{(1)}, \hat{\theta}_2 = X_{(n)}}
,它们不是无偏的,修正后的无偏估计是
θ
^
1
∗
=
n
X
(
1
)
−
X
(
n
)
n
−
1
,
θ
^
2
∗
=
n
X
(
n
)
−
X
(
1
)
n
−
1
.
{\displaystyle \hat{\theta}_1^* = \dfrac{nX_{(1)} - X_{(n)}}{n-1}, \hat{\theta}_2^* = \dfrac{nX_{(n)} - X_{(1)}}{n-1}.}
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
0
,
θ
)
{\displaystyle U(0, \theta)}
的极大似然估计是
θ
^
=
X
(
n
)
{\displaystyle \hat{\theta} = X_{(n)}}
,它不是无偏的,但是弱相合的,修正后的无偏估计是
n
+
1
n
X
(
n
)
{\displaystyle \dfrac{n+1}{n} X_{(n)}}
,同时它也是一致最小方差无偏估计。而参数的函数
1
θ
{\displaystyle \dfrac{1}{\theta}}
没有无偏估计。
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
−
θ
/
2
,
θ
/
2
)
{\displaystyle U(-\theta/2, \theta/2)}
关于参数
θ
{\displaystyle \theta}
的无偏估计有
X
(
1
)
+
X
(
n
)
2
,
X
¯
{\displaystyle \dfrac{X_{(1)}+X_{(n)}}{2}, \overline{X}}
,前者更有效。
区间估计
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
0
,
θ
)
{\displaystyle U(0, \theta)}
,关于参数
θ
{\displaystyle \theta}
的置信水平为
1
−
α
∈
(
0
,
1
)
{\displaystyle 1-\alpha \in (0, 1)}
的置信区间是
[
X
(
n
)
,
X
(
n
)
/
α
n
]
.
{\displaystyle [X_{(n)}, X_{(n)}/\sqrt[n]{\alpha}].}
参数空间
Θ
=
{
(
θ
1
,
θ
2
)
:
θ
1
,
θ
2
∈
R
,
θ
1
<
θ
2
}
{\displaystyle \varTheta = \{(\theta_1, \theta_2): \theta_1, \theta_2 \in \R, \theta_1 < \theta_2 \}}
上的均匀分布族
U
(
θ
1
,
θ
2
)
{\displaystyle U(\theta_1, \theta_2)}
变程
θ
2
−
θ
1
{\displaystyle \theta_2 - \theta_1}
的置信水平为
1
−
α
{\displaystyle 1-\alpha}
的近似置信区间是
[
X
(
n
)
−
X
(
1
)
Be
n
−
1
,
2
(
α
/
2
)
,
X
(
n
)
−
X
(
1
)
Be
n
−
1
,
2
(
1
−
α
/
2
)
]
{\displaystyle \left[ \dfrac{X_{(n)} - X_{(1)}}{\text{Be}_{n-1,2}(\alpha/2)}, \dfrac{X_{(n)} - X_{(1)}}{\text{Be}_{n-1,2}(1-\alpha/2)} \right]}
(枢轴量为
1
−
X
(
n
)
−
X
(
1
)
θ
2
−
θ
1
∼
Be
(
n
−
1
,
2
)
{\displaystyle 1 - \dfrac{X_{(n)} - X_{(1)}}{\theta_2-\theta_1} \sim \text{Be}(n-1,2)}
β 分布);
中点
θ
1
+
θ
2
2
{\displaystyle \dfrac{\theta_1+\theta_2}{2}}
的置信水平为
1
−
α
{\displaystyle 1-\alpha}
的近似置信区间是
[
X
(
n
)
+
X
(
1
)
2
−
(
α
−
1
n
−
1
−
1
)
X
(
n
)
−
X
(
1
)
2
,
X
(
n
)
+
X
(
1
)
2
+
(
α
−
1
n
−
1
−
1
)
X
(
n
)
−
X
(
1
)
2
]
.
{\displaystyle \left[ \dfrac{X_{(n)} + X_{(1)}}{2} - (\alpha^{-\frac{1}{n-1}} - 1) \dfrac{X_{(n)} - X_{(1)}}{2}, \dfrac{X_{(n)} + X_{(1)}}{2} + (\alpha^{-\frac{1}{n-1}} - 1) \dfrac{X_{(n)} - X_{(1)}}{2} \right].}
(枢轴量为
X
(
n
)
+
X
(
1
)
−
(
θ
1
+
θ
2
)
X
(
n
)
−
X
(
1
)
{\displaystyle \dfrac{X_{(n)} + X_{(1)} - (\theta_1+\theta_2)}{X_{(n)} - X_{(1)}}}
,其密度函数是
f
(
x
)
=
n
−
1
2
(
1
+
|
x
|
)
n
{\displaystyle f(x) = \dfrac{n-1}{2(1+|x|)^n}}
)。
参数空间
Θ
=
{
θ
:
θ
∈
R
}
{\displaystyle \varTheta = \{\theta: \theta \in \R \}}
上的均匀分布族
U
(
θ
−
0.5
,
θ
+
0.5
)
{\displaystyle U(\theta-0.5, \theta+0.5)}
,关于参数
θ
{\displaystyle \theta}
置信水平为
1
−
α
{\displaystyle 1-\alpha}
的置信区间是
[
X
(
n
)
+
X
(
1
)
2
−
1
−
α
1
/
n
2
,
X
(
n
)
+
X
(
1
)
2
+
1
−
α
1
/
n
2
]
.
{\displaystyle \left[ \dfrac{X_{(n)} + X_{(1)}}{2} - \dfrac{1-\alpha^{1/n}}{2}, \dfrac{X_{(n)} + X_{(1)}}{2} + \dfrac{1-\alpha^{1/n}}{2} \right].}
其中枢轴量为
X
(
n
)
+
X
(
1
)
2
−
θ
{\displaystyle \dfrac{X_{(n)} + X_{(1)}}{2} - \theta}
,它的密度函数是
f
(
x
)
=
n
(
1
−
|
2
x
|
)
n
−
1
I
[
−
0.5
,
0.5
]
.
{\displaystyle f(x) = n(1-|2x|)^{n-1} I_{[-0.5,0.5]}.}
假设
X
1
,
X
2
,
⋯
,
X
m
∼
U
(
0
,
θ
1
)
,
Y
1
,
Y
2
,
⋯
,
Y
n
∼
U
(
0
,
θ
2
)
{\displaystyle X_1, X_2, \cdots, X_m \sim U(0, \theta_1), Y_1, Y_2, \cdots, Y_n \sim U(0, \theta_2)}
且相互独立,其中
θ
1
,
θ
2
{\displaystyle \theta_1, \theta_2}
是参数,那么
θ
1
/
θ
2
{\displaystyle \theta_1/\theta_2}
置信水平为
1
−
α
{\displaystyle 1-\alpha}
的近似置信区间是
[
X
(
m
)
Y
(
n
)
(
m
+
n
m
α
2
)
1
n
,
X
(
m
)
Y
(
n
)
(
m
+
n
n
α
2
)
−
1
m
]
.
{\displaystyle \left[ \dfrac{X_{(m)}}{Y_{(n)}} \left( \dfrac{m+n}{m} \dfrac{\alpha}{2} \right)^\frac{1}{n}, \dfrac{X_{(m)}}{Y_{(n)}} \left( \dfrac{m+n}{n} \dfrac{\alpha}{2} \right)^{-\frac{1}{m}} \right].}
枢轴量是
Y
(
n
)
X
(
m
)
θ
1
θ
2
{\displaystyle \dfrac{Y_{(n)}}{X_{(m)}}\dfrac{\theta_1}{\theta_2}}
的密度函数是
f
(
x
)
=
{
m
n
m
+
n
x
−
m
−
1
,
x
⩾
1
,
m
n
m
+
n
x
n
−
1
,
x
<
1.
{\displaystyle f(x) = \begin{cases}
\dfrac{mn}{m+n} x^{-m-1}, & x \geqslant 1, \\
\dfrac{mn}{m+n} x^{n-1}, & x < 1.
\end{cases}}
参数假设检验
参数空间
Θ
=
{
θ
:
θ
>
0
}
{\displaystyle \varTheta = \{\theta: \theta > 0 \}}
上的均匀分布族
U
(
0
,
θ
)
{\displaystyle U(0, \theta)}
,给定
θ
0
>
0
{\displaystyle \theta_0 > 0}
,那么检验水平为
α
{\displaystyle \alpha}
的如下检验问题
H
0
:
θ
⩽
θ
0
⟷
H
1
:
θ
>
θ
0
{\displaystyle H_0: \theta \leqslant \theta_0 \longleftrightarrow H_1: \theta > \theta_0}
的似然比检验和一致最优检验的拒绝域都是
W
=
{
X
(
n
)
>
θ
0
1
−
α
n
}
.
{\displaystyle W = \{ X_{(n)} > \theta_0 \sqrt[n]{1-\alpha} \}.}
上下节[]
上一节:指数分布
下一节:正态分布
参考资料李贤平, 《概率论基础(第3版)》, 高等教育出版社, 北京, 2010-04, ISBN 978-7-0402-8890-2.
概率分布(学科代码:1106420,GB/T 13745—2009)
概率公理化
随机事件 ▪ 样本空间 ▪ De Morgan 定理 ▪ 概率空间 ▪ 古典概型 ▪ 几何概型 ▪ 条件概率 ▪ 事件独立性 ▪ 独立重复试验 ▪ Bernoulli 概型
随机变量
离散型随机变量 ▪ 连续型随机变量 ▪ 随机变量的函数 ▪ 随机向量 ▪ 边缘分布 ▪ 条件分布 ▪ 随机变量的独立性 ▪ 随机向量的函数 ▪ 极差分布
随机变量的特征
数学期望 ▪ 方差 ▪ 协方差 ▪ 相关系数 ▪ 矩 ▪ 母函数 ▪ 矩量母函数 ▪ 特征函数 ▪ 示性函数 ▪ 中位数 ▪ 众数 ▪ 峰度 ▪ 偏度
离散概率分布
二项分布 ▪ 几何分布 ▪ Pascal 分布 ▪ Poisson 分布 ▪ 超几何分布 ▪ 对数分布 ▪ 负二项分布 ▪ 多项分布 ▪ 多元超几何分布
连续概率分布
正态分布 ▪ 均匀分布 ▪ 指数分布 ▪ 对数正态分布 ▪ Γ 分布 ▪ χ 分布 ▪ β 分布 ▪ Rayleigh 分布 ▪ Cauchy 分布 ▪ Pareto 分布 ▪ Laplace 分布 ▪ Weibull 分布 ▪ Maxwell 分布律 ▪ 二元正态分布 ▪ 多元正态分布
统计三大分布
χ² 分布 ▪ F 分布 ▪ t 分布 ▪ 非中心 χ² 分布 ▪ 非中心 F 分布 ▪ 非中心 t 分布
所在位置:数学(110)→ 概率论(11064)→ 概率分布(1106420)