各种统计量
参考: 橙子牛奶糖
$\beta$, OR, SE, $p$-value, zscore
OR
odds ratio, 风险比, 事件A与B的关联强度
\[\textrm{OR}=\frac{\frac{N(A\vert B)}{N(\neg A\vert B)}}{\frac{N(A\vert\neg B)}{N(\neg A\vert\neg B)}}\]例子:
| $A$ | not $A$ | |
|---|---|---|
| $B$ | 3 | 4 | 
| not $B$ | 5 | 6 | 
$\beta$
逻辑回归
逻辑回归函数 $p(x)=\dfrac{1}{1+e^{-(\beta_0+\beta_1x)}}$ 中的参数, 用 $p_k=p(x_k)$ 拟合观测量 ${x_k, y_k}$ ($y_k$ 取 $(0,1)$).
 对于伯努利分布 \(f(y_k; p_k)= \begin{cases} p_k,& \text{if } y_k=1\\ 1-p_k, & \text{if } y_k=0 \end{cases}\), 观测量 $\{x_k, y_k\}$,
 似然函数 ${L=\prod_{k:y_k=1}p_k\prod_{k:y_k=0}(1-p_k)}$. 当对数似然函数 $\ell$ 取极值时, 
 要求 ${0=\frac{\partial\ell}{\partial\beta_0}=\sum_{k=1}^N(y_k-p_k)}$, ${0=\frac{\partial\ell}{\partial\beta_1}=\sum_{k=1}^N(y_k-p_k)x_k}$, 从而得到 $\beta_0, \beta_1$.
线性回归
与OR的关联
对于 $x_k=(0,1)$, 可以解得
\[e^\beta=\frac{P(Y=1\vert X=1)/P(Y=0\vert X=1)}{P(Y=1\vert X=0)/P(Y=0\vert X=0)}=\textrm{OR}\]zscore, $p$-value
$p$-值表示在某个(正态)分布中(假设 $H_0$ 为真), 观测到某些极端值($x$)的概率 $p=P(X\geq x\vert H_0)$, 若 two-sided test 需要乘以 2.
在正态分布中, z-score, standard score $z=\dfrac{x-\mu}{\sigma}$.
当极端值为 $x$, 双尾检测, \(p=\begin{cases}2[1-\Phi(\frac{x-\mu}{\sigma})]=2[1-\Phi(z)],& z>0\\2\Phi(z),& z<0\end{cases}\) .
\[{\displaystyle z=\pm\Phi^{-1}\left(1-\frac{p}{2}\right)}\]SE
to be continued