\documentclass[uebung]{lecture}

\title{Wtheo 0: Übungsblatt 5}
\author{Josua Kugler, Christian Merten}
\usepackage[]{bbm}

\begin{document}

\punkte[17]

\begin{aufgabe}
    Beh.: $\varphi = \mathbbm{1}_{A_k}$ mit $ k \in \R^{+}$ ist bester Test
    zum Niveau $\mathbb{P}_0(A_k) \in [0,1]$.
    \begin{proof}
        Sei $\tilde{\varphi} = \mathbbm{1}_{\tilde{A}}$ ein Test zum Niveau $\mathbb{P}_0(A_k)$, d.h.
        $\mathbb{P}_0(\tilde{\varphi} = 1) = \mathbb{P}_0(\tilde{A}) \le \mathbb{P}_{0}(A_k) =
        \mathbb{P}_0(\varphi = 1)$ $(**)$.

        Z.z.: $\mathbb{P}_1(\tilde{\varphi} = 0) = \mathbb{P}_1(\tilde{A}^{c}) \ge \mathbb{P}_1(A_k^{c}) =
        \mathbb{P}_1(\varphi = 0)$.

        Es ist $x \in A_{k} \iff \mathbbm{f}_1(x) - k \mathbbm{f}_0(x) \ge 0$, also
        $x \in A_k^{c} \iff \mathbbm{f}_1(x) - k \mathbbm{f}_0(x) < 0$ $(*)$. Damit folgt
        \begin{salign*}
            \mathbb{P}_1(A_k) - k \mathbb{P}_0(A_k) &= \int_{A_k}^{} \left[ \mathbbm{f}_1(x) - k \mathbbm{f}_0(x) \right]  \d{x} \\
            &\ge \int_{A_k \cap \tilde{A}}^{} \left[ \mathbbm{f}_1(x) - k \mathbbm{f}_0(x) \right]  \d{x} \\
            &\ge \int_{A_k \cap \tilde{A}}^{} \left[ \mathbbm{f}_1(x) - k \mathbbm{f}_0(x) \right]  \d{x} 
            + \int_{A_k^{c} \cap \tilde{A}}^{} \underbrace{\left[ \mathbbm{f}_1(x) - k \mathbbm{f}_0(x) \right]  }_{< 0 \; (*)}\d{x} \\
            &= \int_{\tilde{A}}^{} \left[ \mathbbm{f}_1(x) - k \mathbbm{f}_0(x) \right]  \d{x} \\
            &= \mathbb{P}_1(\tilde{A}) - k \mathbb{P}_0(\tilde{A})
        .\end{salign*}
        Also folgt
        \[
        \mathbb{P}_1(A_k) - \mathbb{P}_1(\tilde{A}) \ge k (\mathbb{P}_0(A_k) - \mathbb{P}_0(\tilde{A}))
        \stackrel{\text{(**)}}{\ge } 0
    .\] Es ist also $\mathbb{P}_1(A_k) \ge \mathbb{P}_1(\tilde{A})$, insgesamt
    \[
        \mathbb{P}_1(A_k^{c}) = 1 - \mathbb{P}_1(A_k) \le 1 - \mathbb{P}_1(\tilde{A})
        = \mathbb{P}_1(\tilde{A}^{c})
    .\] Also Fehler $2$. Art minimiert und damit $\varphi$ bester Test zum Niveau $\mathbb{P}_0(A_k)$.
    \end{proof}
\end{aufgabe}

\begin{aufgabe}[]
    \begin{enumerate}[(a)]
        \item Der Neyman-Pearson-Test $\varphi \colon \R \to \{1,0\}$ ist gegeben durch $\mathbbm{1}_{A_{k_\alpha}}$ mit 
        \[
            A_{k_\alpha} = \{x \in \R | \mathbbm{f}_1(x) \geq k_\alpha \mathbbm{f}_0(x)\} = \{x \in \R | \mathbbm{f}_1(x) / \mathbbm{f}_0(x) \geq k_\alpha\},
        \] wobei wir zeigen werden, dass ein $k_\alpha$ existiert mit $\mathbbm{P}_0(A_{k_\alpha}) = \alpha$.
        Dabei ist der Likelihoodquotient $L(x) = \frac{\mathbbm{f}_1(x)}{\mathbbm{f}_0(x)} = \frac{\lambda_0}{\lambda_1} e^{\left(\frac{1}{\lambda_0} - \frac{1}{\lambda_1}\right) x}$ stetig und wegen $\lambda_0 < \lambda_1 \implies \frac{1}{\lambda_0} > \frac{1}{\lambda_1}$ auch monoton wachsend. Insbesondere existiert zu jedem $k_\alpha$ genau ein $c_\alpha$ mit
        \[
            A_{k_\alpha} = [c_\alpha, \infty). 
        \]
        Dann gilt
        \[
            \alpha \overset{!}{=} \mathbbm{P}_0(A_{k_\alpha}) = \int_{A_{k_\alpha}} \mathbbm{f}_0(x) \d{x} = \int_{c_\alpha}^\infty \frac{1}{\lambda_0}e^{- \frac{1}{\lambda_0} x} \d{x} = e^{- \frac{1}{\lambda_0} c_\alpha}
        \]
        Daher gilt $c_\alpha = -\lambda_0 \log(\alpha)$ und damit $\varphi = \mathbbm{1}_{[-\lambda_0\log(\alpha), \infty)}$
        \item Offensichtlich ist also $\varphi$ unabhängig von $\lambda_1$.
        Sei $\lambda < \lambda_0$. Dann gilt
        \[
            \mathbbm{P}_\lambda(A_{k_\alpha}) = \int_{-\lambda_0\log(\alpha)}^\infty \frac{1}{\lambda}e^{-\frac{1}{\lambda}x} \d{x} = e^{\frac{\lambda_0}{\lambda}\log(\alpha)} = \alpha^{\frac{\lambda_0}{\lambda}} < \alpha,
        \]
        da $\alpha < 1$. 
        Damit hält $\varphi$ für $H_0: \lambda \le \lambda_0$ das Signifikanzniveau $\alpha$ ein und ist folglich gleichmäßig bester Test mit $H_1: \lambda > \lambda_0$, da für alle $\lambda_1 > \lambda_0$ nach dem Neyman-Pearson-Lemma $\varphi$ ein bester Test ist.
        \item Die Forscher liegen falsch, wenn die Nullhypothese $\lambda \leq \lambda_0$ wahr ist und sie diese ablehnen. Das ist also gerade ein Fehler erster Art und wir erhalten $\alpha = 0.05$. Damit ist $\varphi = \mathbbm{1}_{[- \lambda_0 \log(\alpha), \infty)} = \mathbbm{1}_{[15,7917, \infty]}$. Wegen $\varphi(X) = \varphi(13) = 0$ publizieren sie ihre Ergebnisse nicht.
        \item Es gilt $\mathcal{R}_\lambda = \mathcal F_\lambda^c = (0,\lambda)^c = [\lambda, \infty)$. Die assoziierte Familie von Partitionen ist 
        \[ 
            \mathscr H_\lambda^0 \coloneqq \{\tilde \lambda \in \R^+ \colon \lambda \in \mathcal R_{\tilde \lambda}\} 
            = \{\tilde \lambda \in \R^+ \colon \lambda \geq \tilde \lambda\} = (-\infty, \tilde \lambda]
        \] und analog
        \[ 
            \mathscr H_\lambda^1 \coloneqq \{\tilde \lambda \in \R^+ \colon \lambda \in \mathcal F_{\tilde \lambda}\} 
            = \{\tilde \lambda \in \R^+ \colon \lambda < \tilde \lambda\} = (\tilde \lambda, \infty).
        \]
        Nach Aufgabe $b$ wissen wir, dass $\varphi_\lambda = \mathbbm{1}_{[-\lambda \log(\alpha)]}$ ein gleichmäßig bester Test zum Niveau $\alpha$ mit Nullhypothese $\mathscr H_\lambda^0$ gegen die Alternative $\mathscr H_\lambda^1$ ist. Nach Satz 12.33 muss damit die assoziierte Bereichsschätzfunktion $B$ ein gleichmäßig bester $(1-\alpha)$-Konfidenzbereich sein. Die assoziierte Bereichsschätzfunktion ist gegeben durch
        \begin{align*}
            B(x) &= \{\lambda \in \R^+ \colon \varphi_\lambda(x) = 0\}\\
            &= \{\lambda \in \R^+\colon \mathbbm{1}_{[-\lambda\log(\alpha), \infty)} = 0\}\\
            &= \{\lambda \in \R^+\colon x  < -\lambda\log(\alpha)\}
            \intertext{$\log(\alpha) < 0$}
            &= \{\lambda \in \R^+\colon -x/\log(\alpha)  < \lambda\}\\
            &= \left(-\frac{x}{\log(\alpha)}, \infty\right)
        \end{align*}
    \end{enumerate}
\end{aufgabe}
\begin{aufgabe}[]
    \begin{enumerate}[(a)]
        \item Beh.: $\hat{\theta}_n(x) = (\overline{x}_n, \frac{1}{n} \sum_{i=1}^{n} (x_i - \overline{x}_n)^2)$.
            \begin{proof}
                Betrachte für $\sigma^2 > 0$:
                \begin{salign*}
                    L(x, \mu, \sigma^2) &= (2 \pi \sigma^2)^{-\frac{n}{2}} \exp\left( -\frac{1}{2\sigma^2}
                    \sum_{i=1}^{n} (x_i - \mu)^2\right) \\
                    l(x, \mu, \sigma^2) &= \log L \\
                                        &= -\frac{1}{2 \sigma^2} \sum_{i=1}^{n} (x_i - \mu)^2
                                        - \frac{n}{2} \log(2 \pi \sigma^2)
                    \intertext{Es genügt die Maxima von $l = \log L$ zu betrachten, da der Logarithmus
                    streng monoton wachsend ist. Betrachte den Gradienten bezüglich $\mu$ und $\sigma^2$:}
                    \nabla l(x, \mu, \sigma^2) &= \begin{pmatrix} 
                        \frac{1}{2 \sigma^2} \sum_{i=1}^{n} 2 (x_i - \mu) \\
                        \frac{1}{2 \sigma ^{4}} \sum_{i=1}^{n} (x_i - \mu)^2 - \frac{n}{2} \frac{1}{\sigma^2}
                    \end{pmatrix} 
                        \stackrel{!}{=} 0
                .\end{salign*}
                Damit folgt
                \[
                    \frac{1}{\sigma ^{4}} \sum_{i=1}^{n} (x_i - \mu)^2 = \frac{n}{\sigma^2}
                    \implies \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \mu)^2
                .\] Eingesetzt in die zweite Gleichung ergibt:
                \[
                    n \frac{\sum_{i=1}^{n} (x_i - \mu)}{\sum_{i=1}^{n} (x_i - \mu)^2} = 0
                    \implies \sum_{i=1}^{n} (x_i - \mu) = 0
                    \implies \sum_{i=1}^{n} x_i = n \mu \implies \mu = \overline{x}_n
                .\] Damit folgt
                \[
                    \sigma^2 = \frac{1}{n} \sum_{i=1}^{n} (x_i - \overline{x}_n)^2
                .\]
                Die Determinante der Hessematrix von $l$ bezüglich $\mu$ und $\sigma^2$
                ausgewertet bei $\mu = \overline{x}_n$ ist
                $\forall \sigma^2 > 0$:
                \begin{salign*}
                    \text{det}\left[\begin{pmatrix} -\frac{n}{\sigma^2} & -\frac{1}{\sigma ^{4}} \sum_{i=1}^{n} (x_i - \mu) \\
                        - \frac{1}{\sigma ^{4}} \sum_{i=1}^{n} (x_i - \mu) &
                        - \frac{1}{\sigma ^{6}} \sum_{i=1}^{n} (x_i - \mu)^2 + \frac{n}{2} \frac{1}{\sigma ^{4}}
                    \end{pmatrix}\Big|_{\mu = \overline{x}_n} \right]
                    &= \text{det} \left[\begin{pmatrix}
                        - \frac{n}{\sigma ^2} & 0 \\
                        0 & \frac{n}{2 \sigma ^{4}}
                \end{pmatrix} \right] \\
                          &= - \underbrace{\frac{n^2}{2 \sigma ^{6}}}_{> 0} < 0
                .\end{salign*}
                Es liegt also ein (lokales) Maximum bei
                $\theta = (\overline{x}_n, \frac{1}{n} \sum_{i=1}^{n} (x_i - \overline{x}_n)^2)$ vor.
                Damit folgt die Behauptung.
            \end{proof}
        \item Beh.: $\hat{\theta}_n(x) = \frac{\overline{x}_n}{m}$.
            \begin{proof}
                Sei $m \in \N$ fest. Betrachte wieder den Logarithmus der Likelihoodfunktion:
                \begin{salign*}
                    L(x, p) &= \prod_{i=1}^{n} p^{x_i} (1 - p)^{m - x_i} \\
                    &= p^{n \overline{x}_n} (1-p)^{nm - n \overline{x}_n} \\
                    l(x, p) &= n \overline{x}_n \log(p) + n(m - \overline{x}_n) \log(1-p)
                    \intertext{Dann folgt}
                    \frac{\partial l}{\partial p} &= \frac{n \overline{x}_n}{p} - \frac{n(m - \overline{x}_n)}{1-p} \stackrel{!}{=} 0\\
                    \intertext{Damit folgt direkt}
                    p &= \frac{\overline{x}_n}{m}
                    \intertext{Dieses ist auch lokales Maximum da wegen $0 \le x_i \le m$ $\forall i \in \N$
                    auch $0 \le \overline{x_n} \le m$ gilt und damit}
                    \frac{\partial l^2}{\partial p^2} \Big|_{p = \frac{\overline{x}_n}{m}}
                    &= - \frac{n \overline{x}_n}{p^2} - \frac{n(m - \overline{x}_n)}{(1-p)^2}
                    \Big|_{p = \frac{\overline{x}_n}{m}} = - n \frac{m^2}{\overline{x}_n}
                    - \frac{n(\overbrace{m - \overline{x}_n}^{\ge 0})}{\left( 1 - \frac{\overline{x}_n}{m} \right)^2} < 0
                .\end{salign*}
                Da $\frac{\overline{x}_n}{m}$ einzige Nullstelle von $\frac{\partial l}{\partial p}$, ist
                dieses auch globales Maximum. Damit folgt die Behauptung.
            \end{proof}
    \end{enumerate}
\end{aufgabe}
\begin{aufgabe}
    \begin{enumerate}[(a)]
        \item Für die Zähldichte $\mathbbm p_{X_i}$ gilt
        \[
            \mathbbm p_{X_i} = \begin{cases}
                \mathbbm p_{\text{Poi}_\lambda}(0) &| X_i = 0\\
                \sum_{i = 1}^{\infty} \mathbbm p_{\text{Poi}_\lambda}(i) &| X_i = 1
            \end{cases}  = \begin{cases}
                e^{-\lambda} & |X_i = 0\\
                1 - e^{-\lambda} & | X_i = 1
            \end{cases}
        \]
        Für die Produktzähldichte erhalten wir daher
        \[
            \prod_{i=1}^n \mathbbm p_{X_i} = (1 - e^{-\lambda})^{\sum_{i = 1}^{n} X_i} (e^{-\lambda})^{n - \sum_{i = 1}^{n} X_i}
            = (1 - e^{-\lambda})^{n \overline{X_n}} (e^{-\lambda})^{n - n \overline{X_n}}
            %(1 - e^{-\lambda})^{\sum_{i = 1}^{n} X_i} \cdot e^{-n\lambda} \cdot e^{\lambda \sum_{i = 1}^{n} X_i} = (e^{\lambda} - 1)^{\sum_{i = 1}^{n} X_i} \cdot e^{-n\lambda}
        \]
        Daraus ergibt sich die Likelihoodfunktion
        \[
            L(X, \lambda) = (1 - e^{-\lambda})^{n \overline{X_n}} e^{-n\lambda} e^{n \lambda \overline{X_n}} = (e^{\lambda} - 1)^{n \overline{X_n}} \cdot e^{-n\lambda},
        \]
        die log-Likelihoodfunktion
        \[
            l(X,\lambda) = n \overline{X_n} \log(e^\lambda - 1) - n\lambda,
        \]  
        sowie deren Ableitung
        \[
            \frac{\partial}{\partial \lambda}  l(X, \lambda) = n \overline{X_n} \frac{e^\lambda}{e^\lambda - 1} - n \overset{!}{=} 0,
        \]
        von der wir direkt die Nullstellen berechnen um Extremstellen in $L(X, \lambda)$ zu finden.
        Daraus folgern wir
        \begin{align*}
            \overline{X_n} e^{\hat \lambda_n} &= e^{\hat \lambda_n} - 1\\
            1 - \overline{X_n}  &= e^{-\hat \lambda_n}\\
            \hat \lambda_n &= -\log(1 - \overline{X_n}).
        \end{align*}
        \item Der Schätzer $ \hat \lambda_n$ existiert genau dann nicht, wenn $\overline{X_n} = 1 \Leftrightarrow X_i = 1 \forall 1\le i\le n$. Es gilt 
        \[ 
            \mathbbm P(X_1 = \dots = X_n = 1) = \prod_{i=1}^n \mathbbm P_i(X_i = 1) = \prod_{i=1}^n (1 - e^{-\lambda}) = e^{-n\lambda} > 0.
        \]
    \end{enumerate}
\end{aufgabe}
\end{document}