文章

各种统计量

各种统计量

参考: 橙子牛奶糖

$\beta$, OR, SE, $p$-value, zscore

OR

odds ratio, 风险比, 事件A与B的关联强度

\[\textrm{OR}=\frac{\frac{N(A\vert B)}{N(\neg A\vert B)}}{\frac{N(A\vert\neg B)}{N(\neg A\vert\neg B)}}\]

例子:

 $A$not $A$
$B$34
not $B$56
\[\textrm{OR}=\frac{3/4}{5/6}=0.9\]

$\beta$

逻辑回归

逻辑回归函数 $p(x)=\dfrac{1}{1+e^{-(\beta_0+\beta_1x)}}$ 中的参数, 用 $p_k=p(x_k)$ 拟合观测量 ${x_k, y_k}$ ($y_k$ 取 $(0,1)$).
对于伯努利分布 \(f(y_k; p_k)= \begin{cases} p_k,& \text{if } y_k=1\\ 1-p_k, & \text{if } y_k=0 \end{cases}\), 观测量 $\{x_k, y_k\}$,
似然函数 ${L=\prod_{k:y_k=1}p_k\prod_{k:y_k=0}(1-p_k)}$. 当对数似然函数 $\ell$ 取极值时,
要求 ${0=\frac{\partial\ell}{\partial\beta_0}=\sum_{k=1}^N(y_k-p_k)}$, ${0=\frac{\partial\ell}{\partial\beta_1}=\sum_{k=1}^N(y_k-p_k)x_k}$, 从而得到 $\beta_0, \beta_1$.

线性回归

与OR的关联

对于 $x_k=(0,1)$, 可以解得

\[e^\beta=\frac{P(Y=1\vert X=1)/P(Y=0\vert X=1)}{P(Y=1\vert X=0)/P(Y=0\vert X=0)}=\textrm{OR}\]

zscore, $p$-value

$p$-值表示在某个(正态)分布中(假设 $H_0$ 为真), 观测到某些极端值($x$)的概率 $p=P(X\geq x\vert H_0)$, 若 two-sided test 需要乘以 2.

在正态分布中, z-score, standard score $z=\dfrac{x-\mu}{\sigma}$.

当极端值为 $x$, 双尾检测, \(p=\begin{cases}2[1-\Phi(\frac{x-\mu}{\sigma})]=2[1-\Phi(z)],& z>0\\2\Phi(z),& z<0\end{cases}\) .

\[{\displaystyle z=\pm\Phi^{-1}\left(1-\frac{p}{2}\right)}\]

SE

to be continued

CI

本文由作者按照 CC BY 4.0 进行授权