You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

1435 lines
64 KiB

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

\documentclass[11pt]{scrartcl}
\usepackage[utf8]{inputenc}
\usepackage[ngerman]{babel}
\usepackage{amsmath}
\usepackage{amssymb}
\usepackage{eurosym}
\usepackage{enumerate}
\usepackage{multicol}
%\usepackage{booktabs}
%\usepackage{pstricks}
%\usepackage{pst-node}
\usepackage[paper=a4paper,left=30mm,right=20mm,top=20mm,bottom =25mm]{geometry}
\usepackage[
pdftitle={Wahrscheinlichkeitstheorie und Statistik},
pdfsubject={Mitschrift der Vorlesung "Wahrscheinlichkeitstheorie und Statistik" an der HTW-Aalen, bei Herrn Fischer.},
pdfauthor={Thomas Battermann},
pdfkeywords={Wahrscheinlichkeitstheorie und Statistik},
pdfborder={0 0 0}
]{hyperref}
%TEST
\usepackage{framed}
\usepackage{amsthm}
\newtheorem{mdef}[equation]{Definition}
\newenvironment{mydef}
{\begin{leftbar}\begin{mdef}}
{\end{mdef}\end{leftbar}}
%TEST ENDE
\usepackage{tabularx}
\usepackage{graphicx}
\usepackage[usenames,dvipsnames]{color}
\usepackage[table]{xcolor}
\usepackage{lastpage}
\usepackage{fancyhdr}
\setlength{\parindent}{0ex}
\setlength{\parskip}{2ex}
\setcounter{secnumdepth}{4}
\setcounter{tocdepth}{4}
\definecolor{darkgreen}{rgb}{0,0.5,0}
\definecolor{darkblue}{rgb}{0,0,0.5}
\definecolor{lightgrey}{rgb}{0.9,0.9,0.9}
\definecolor{lightgreen}{rgb}{0.9,1,0.9}
\pagestyle{fancy} %eigener Seitenstil
\fancyhf{} %alle Kopf- und Fußzeilenfelder bereinigen
\fancyhead[L]{Wahrscheinlichkeitstheorie und Statistik} %Kopfzeile links
\fancyhead[C]{Semester 3} %zentrierte Kopfzeile
\fancyhead[R]{WS 2011/2012} %Kopfzeile rechts
\renewcommand{\headrulewidth}{0.4pt} %obere Trennlinie
\fancyfoot[C]{Seite \thepage\ von \pageref{LastPage}}
\renewcommand{\footrulewidth}{0.4pt} %untere Trennlinie
\newcommand{\spa}{\hspace*{4mm}}
\newcommand{\defin}{\textcolor{darkgreen}{\textbf{Def.: }}}
\newcommand{\bsp}{\textcolor{darkblue}{\textbf{\underline{Bsp.}: }}}
\newcommand{\rrfloor}{\right\rfloor}
\newcommand{\llfloor}{\left\lfloor}
\newcommand{\cunder}[2]{{\color{#1}\underline{\color{Black}#2}}}
\title{Wahrscheinlichkeitstheorie und Statistik}
\author{Mitschrift von Thomas Battermann}
\date{3. Semester}
\begin{document}
\pagestyle{empty}
\maketitle\thispagestyle{empty}
\tableofcontents\thispagestyle{empty}
\newpage
\pagestyle{fancy}
\setcounter{page}{1}
Statistik:
\begin{itemize}
\item beschreibende Statistik\\
\(\to\) Erfassung, Auswertung von Daten.\\
(z.\,B. über Mittelwerte)
\begin{itemize}
\item oftmals keine Gesamterhebung (z.\,B. Wahl)
\item sondern Stichproben (z.\,B. Hochrechnung, Umfragen vorab)\\
Auswahl:
\begin{itemize}
\item Zufällig\\
Qualitätstests
\item gezielt (Repräsentative Stichprobe)\\
z.\,B. Hochrechnung der Wahl
\end{itemize}
\end{itemize}
\item beurteilende Statistik
\begin{itemize}
\item Rückschlüsse von Stichproben auf die Gesamtheit
\item Tests \( \to \)
\item[\(\to\)] Zufallseffekte
\item[\(\to\)] Wahrscheinlichkeitsrechnung als Hilfsmittel
\end{itemize}
\end{itemize}
\section{Grundbegriffe}
\subsection{Zufallsexperimente}
\begin{itemize}
\item Mehrere mögliche Ergebnisse\\
{\color{Orange}\bsp Würfeln \(\to\) 1,2,3,4,5,6}
\item prinzipiell beliebig oft wiederholbar
\item für die Ergebnisse lassen sich Wahrscheinlichkeiten angeben\\
{\color{Orange}\(\to\) jeweils \(\frac 1 6\)}
\end{itemize}
Überprüfung von Wahrscheinlichkeiten mit Hilfe häufiger Wiederholungen des Experiments. {\color{Orange}\bsp 1000 maliges Würfeln \(\to\) 160mal 1, 168mal 2, …}\\
{\color{Orange}Schätzwert für die W.: \(\frac{160}{1000} = 0,16 = \) relative Häufigkeit}\\
{\color{Orange}absolute Häufigkeit der 1 = 160}
Man erhält W. aus den relativen Häufigkeiten, wenn die Anzahl der Wiederholungen gegen \(\infty\) geht.\\
{\color{Orange}W. für die 1 = \(0.1\overline{6}\)}
\subsection{Begriffe, Bezeichnungen:}
\underline{Ergebnisse} \( \omega_1, \omega_2, \omega_3, …\)
\underline{Ergebnismenge:} \( \Omega = \{ \omega_1, \omega_2, \omega_3, … \} \) {\color{Orange} \( \Omega = \{1,2,3,4,5,6\}\)}
\underline{Ereignisse:} \( A,B,C,… \) sind Teilmengen von \(\Omega\)\\
\spa meist zunächst verbal formuliert\\
\spa {\color{Orange}A: Es wird eine gerade Zahl gewürfelt.}\\
\spa {\color{Orange}\(\to A= \{2,4,6\} \) }
\underline{Wahrscheinlichkeiten} für die Ergebnisse und die Ereignisse.\\
\spa \(P(\omega_1), P(\omega_2), …\) und \(P(A), P(B), …\) (\(P\) für probalby)\\
\spa {\color{Orange} \(P(1)=P(2)=P(3)=P(4)=P(5)=P(6)=\frac{1}{6} \)} (Lauter gleiche W. (Gleichverteilung))\\
\spa {\color{Orange} \( P(a) = \frac 3 6 = \frac 1 2 = 0,5 = 50\% \)}
\bsp 2maliges Würfeln\\
A: im 1. Wurf kommt 5\\
B: Summe der Augen ist 7\\
gesucht: \(\Omega, P(A), P(B) \)
\( \Omega = \{ 11,12,,21,13,31,…,66\} \) W. jeweils \( \frac 1 36 \)\\
\( A = \{ 51,52,53,54,55,56 \} \)\\
\( B = \{ 16,25,34,43,52,61 \} \)\\
\( P(A) = \frac 1 6 \)\\
\( P(B) = \frac 1 6 \)
C: Summe der Augenzahlen ist 12\\
\( C = \{ 66 \} \) \( P(C) = \frac 1 {36} \)
\bsp 3-maliger Münzwurf\\
Mit welcher w.\\
(a) tritt keinmal Wappen auf?\\
(b) tritt genau zweimal Wappen auf?
\(\Omega = \{ ZZZ, ZZW, ZWZ, WZZ, ZWW, WZW, ZWW, WWW \} \)\\
\( P(A) = \{ ZZZ \} = \frac 1 8 \)\\
\( P(B) = \{ ZWW, WZW, WWZ \} = \frac 3 8 \)
\subsection{Eigenschaften, Rechenregeln für W.}
\( P(\Omega) = 1 \), \( P(\emptyset) = 0\), für jedes Ereignis A: \( 0 \le P(A) \le 1 \)
Ereignis A \(\to\) Gegenereignis (Komplement) von A: \(\overline{A} = A^C\) mit \( P(\overline{A}) = 1-P(A) \)
Schnitt von Ereignissen A und B: \( A \cap B \)
Vereinigung von Ereignissen A und B: \( A \cup B \)\\
\( P(A\cup B) = P(A) + P(B) - P(A\cap B) \)\\
Wenn A und B \underline{disjunkt} sind, dann ist \( P(A\cup B) = P(A)+P(B) \)
P(\underline{entweder} A oder B) ) \( P(A) + P(B) - 2 \cdot P(A\cap B)\) \(( = P( (A\cap \overline{B}) \cup (\overline{A}\cap B) ))\)
Allgemeiner:\\
\begin{align*}
P(A \cup B \cup C) = &P(A) + P(B) + P(C) \\
&+ P(A\cap B\cap C) \\
&- P(A\cap B) - P(A\cap C) - P(B\cap C)
\end{align*}
Allgemein (Siebformel oder Inklusions-Exklusions-Methode):
\begin{align*}
&P(A_1 \cup A_2 \cup\cup A_n)\\
= &P(A_1) + P(A_2) + … + P(A_n)\\
&-P(A_1 \cap A_2) - P(A_1 \cap A_2) -\\
&+ P(A_1 \cap A_2 \cap A_3) + …\\
&\\
&+(-1)^{n+1} \cdot P(A_1 \cap A_2 \cap\cap A_n )
\end{align*}
\bsp 100 maliges Würfeln. Mit welcher Wahrscheinlichkeit tritt {\color{Orange}\(\to 6^{100} \) mögliche Ergebnisse}\\
\begin{itemize}
\item[(a)] 100 mal 5 auf? { \color{Orange}\( \frac 1 {6^{100}} \) }
\item[(b)] keine 5 auf? { \color{Orange} \( \left( \frac 5 6 \right)^{100} \) }
\item[(c)] mindestens eine 5 auf? { \color{Orange} \( 1- \left( \frac 5 6 \right)^{100} \) } \( \to \) Über Gegenereignis (b).
\item[(d)] genau eine 5 auf? { \color{Orange} \( \frac 1 6 \cdot \left( \frac 5 6 \right)^{99} \cdot 100 \) }
\end{itemize}
\section{Berechnung von Wahrscheinlichkeiten mit der Kombinatorik}
Für ein Ereignis A, das Teilmenge von \(\Omega\) ist.\\
\( P(A) = \frac{\left|A\right|}{\left|\Omega\right|}= \frac{\text{günstige Fälle}}{\text{mögliche Fälle}} \) {\color{Orange}Elemente von \(\Omega\) = Anzahl aller möglichen Ergebnisse}\\
Nur wenn alle Ergebnisse aus \(\Omega\) \underline{gleich} Wahrscheinlich sind.
{\color{Orange}ansonsten: \( P(A) = \sum\limits_{\omega \in A} P(\omega) \)}
Berechnung von \(\left|A\right|\) und \( \left|\Omega\right| \) mit der Kombinatorik.\\
Kombinatorik:\\
k-maliges Ziehen aus n Kugeln.\\
Ziehen mit oder ohne Zurücklegen.\\
mit/ohne Berücksichtigung der Reihenfolge.
\bsp Lotto \( k = 6\) aus \(n = 49\). Ziehen ohne Zurücklegen, ohne Reihenfolge.
4 Fälle:
\begin{enumerate}
\item
Fall: Ziehen mit Zurücklegen, mit Reihenfolge:\\
\( n^k \) Möglichkeiten {\color{Orange}gesamt: \(\left|\Omega\right| = n^k\) Möglichkeiten}
\item
Fall: Ziehen ohne Zurücklegen, mit Reihenfolge:\\
\( \frac{n!}{(n-k)!} = n^{\underline{k}} \)
\end{enumerate}
\bsp Ein 5 stelliger Code wird zufällig zufällig gewählt, bestehend aus Ziffern \( 1,2,…,9 \).\\
{\color{Orange} \( k=5; n=9 \) Gesamt: \( n^k = 9^6 \) Möglichkeiten}\\
Mit welcher Wahrscheinlichkeit
\begin{enumerate}[(a)]
\item tritt die Kombination \(13758\) auf?\\
{\color{Orange} \( \frac{1}{9^5} \)}
\item enthält der Code lauter gleiche Zahlen?\\
{\color{Orange} \( \frac{9}{9^5} = \frac{1}{9^4} \)}
\item enthält der Code lauter verschiedene Zahlen?\\
{\color{Orange} \( \frac{9!}{4! * 9^5} \) }
\item beginnt der Code mit 3?\\
{\color{Orange} \( \frac{1 * 9^4}{9^5} = \frac 1 9 \)}
\item enthält der Code genau eine 3?\\
{\color{Orange} \( \frac 1 9 * \left(\frac 8 9\right)^4 * 5 = \frac{ 5 * 8^4 }{ 9^5 } \)}
\item enthält der Code genau zwei 3er?\\
{\color{Orange} \( \left(\frac{1}{9}\right)^2 * \left(\frac{8}{9}\right)^3 * 2 * 5 = \frac{10 * 8^3}{9^5} \)}
\end{enumerate}
%
\begin{itemize}
\item[3.] Fall: Ziehen ohne Zurücklegen, ohne Reihenfolge.\\
\(\to\) Aus n Kugeln werden k \cunder{Yellow}{ausgewählt}.\\
Vergleich mit 2. Fall: Ziehen ohne Zurücklegen, mit Reihenfolge\\
\spa \(\to n^{\underline{k}} = \frac{n!}{(n-k)!}\) Möglichkeiten\\
Es gibt \(k!\) Möglichkeiten, \(k\) Kugeln zu Vertauschen (auf \(k\) Plätzen).\\
im 3. Fall:\\
gesamt: \( \frac{n!}{(n-k)! * k!} = \binom{n}{k} \) Möglichkeiten.\\
im Beispiel von Oben (f).\\
\spa Mögl. aus 5 Plätzen 2 Stück für die 3er \cunder{Yellow}{auszuwählen}:\\
\spa \( \binom 5 2 = \frac{5!}{2! * (5-2)!} = \frac{5 * 4 * \not 3 * \not 2 * \not 1}{2 * 1 * \not 3 * \not 2 * \not 1} = 10\)\\
\bsp Mit welcher Wahrscheinlichkeit tritt bei 100 maligem Würfeln genau 20 mal die 4 auf?\\
\( W = \frac{ \binom{100}{20} * 5^{80} }{ 6^{100} } \)\\
\end{itemize}
\bsp Lotto 6 aus 49\\
Berechne die Wahrscheinlichkeiten für
\begin{enumerate}[(a)]
\item 6 Richtige\\
\( \frac{1}{\binom{49}{6}} = \frac{1}{13.983.816} \) ~ 14 Mio. Möglichkeiten
\item 4 Richtige\\
\( \frac{ \binom{6}{4} * \binom{43}{2} }{ \binom{6}{49} } = \frac{645}{665896} \approx 0.096861972440140803\%\)
\item 3 Richtige\\
\( \frac{ \binom{6}{3} * \binom{43}{3} }{ \binom{6}{49} } = \frac{8815}{499422} \approx 1.765040386687010184\%\)
\end{enumerate}
\bsp Kiste mit 4 blauen, 3 roten, 8 gelben Laptops\\
Wir wählen zufällig 8 aus.
\begin{enumerate}[(a)]
\item Mit welcher Wahrscheinlichkeit sind 3 blau und 5 gelb?\\
\( \frac{ \binom{4}{3} * \binom{3}{0} * \binom{8}{5} }{\binom{15}{8}} = \frac{224}{6435} \)
\item Mit welcher Wahrscheinlichkeit sind 6 gelb\\
\( \frac{ \binom{8}{6} * \binom{7}{2} }{ \binom{15}{8} } = \frac{196}{2145} \)
\end{enumerate}
\bsp Kiste wie in vorigem Beispiel. Wir stellen 2 Pakete mit jeweils 4 Laptops zusammen (zufällig).\\
Mit welcher Wahrscheinlichkeit {\color{Orange} \(\to \binom{15}{4} * \binom{11}{4} \)}\\
\begin{enumerate}[(a)]
\item enthält das 1. Paket 1 blauen und das 2. Paket 2 blaue Laptops?
\item enthält das 1. Paket 1 blauen Laptop?
\item enthält das 2. Paket 1 blauen Laptop?
\item enthält das 1. oder 2. Paket 1 blauen Laptop?
\item Mit welcher Wahrscheinlichkeit enthält das 2. Paket 1 blauen Laptop, wenn man weiß, das im 1. Paket 2 blaue Laptops sind?
\end{enumerate}
Lösung:\\
\begin{enumerate}[(a)]
\item \( \frac{ \binom{4}{1}*\binom{11}{3} * \binom{3}{2} * \binom{8}{2} }{\binom{15}{4}*\binom{11}{4}} \approx 0.12307692307692307692\)
\item \( \frac{ \binom{4}{1}*\binom{11}{3} * \binom{11}{4} }{ \binom{15}{4}*\binom{11}{4} } \)
\item \( \frac{ \binom{4}{1}*\binom{11}{3} * \binom{11}{4} }{ \binom{15}{4}*\binom{11}{4} } \)
\item
Ereignis A: 1. Paket enthält 1 blauen Laptop\\
Ereignis B: 2. Paket enthält 1 blauen Laptop\\
gesucht: \( A \cup B = P(A) + P(B) - P(A \cap B) \)\\
\( 2 * \frac{ \binom{4}{1} * \binom{11}{3} }{ \binom{15}{4} } - \frac{ \binom{4}{1} * \binom{11}{3} * \binom{3}{1} * \binom{8}{3} }{ \binom{15}{4} * \binom{11}{4}} \)\\
{\color{Orange} Man sieht hier: \(P(A \cap B) \not= P(A) * P(B) \)}
\item \( \frac{ \binom{2}{1} * \binom{9}{3} }{ \binom{11}{4} } \)
\end{enumerate}
\begin{itemize}
\item[4.] Fall: Ziehen mit Zurücklegen, ohne Reihenfolge.\\
{\color{Orange} \(\to\) ungeeignet für Wahrscheinlichkeitsrechnungen.}\\
\bsp 2 maliges Würfeln\\
Mit welcher Wahrscheinlichkeit tritt keine 5 auf?\\
im 4. Fall: \( \Omega = \{ (1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,2), (2,3), … (6,6) \}; \quad \left|\Omega\right| = 21\)\\
Formal für die Anzahl der Ergebnisse in \(\Omega\):\\
\( \Omega = \binom{n+k-1}{k} = \binom{6+2-1}{2} = \binom{7}{2} = \frac{7!}{6!} = \frac{7 * 6}{2} = 21 \)
{\color{Orange} Problem:} Ergebnisse sind nicht gleich Wahrscheinlich\\
\(\to\) 4. Fall: blöd!\\
\(\to\) statt dem 4. Fall wird der 1. Fall betrachtet: Ziehen mit Zurücklegen und mit Reihenfolge \(\to \left|\Omega\right| = n^k \)\\
im \bsp \( P(\text{keine 5}) = \frac{5^2}{6^2} = \frac{25}{36}\)
\end{itemize}
\bsp $k = 40$ Personen\\
Mit welcher Wahrscheinlichkeit haben mindestens 2 am gleichen Tag Geburtstag?\\
$n = 365$ Kugeln; $k = 40$ maliges Ziehen\\
Ziehen mit Zurücklegen, mit Reihenfolge \( \to \) 1. Fall: \( \left| \Omega \right| = n^k = 365^{40} \)\\
\(P(\text{mindestens 2 haben am gleichen Tag Geburtstag})\)\\
\(= 1 - P(\text{alle haben an verschiedenen Tagen Geburtstag})\)\\
\( = 1 * \frac{ 365^{\underline{40}} }{365^{40}} \approx 89.123\% \)
\underline{Binomialkoeffizient/Multinomialkoeffizient}
Anzahl der Möglichkeiten, aus $n$ Elementen $k$ auszuwählen: \(\binom{n}{k} = \frac{n!}{k! * (n-k)!} \)\\
Allgemeiner:\\
Anzahl der Möglichkeiten, aus $n$ Elementen $k_1$ auszuwählen, aus den restlichen dann $k_2, …, k_l$\\
\( \binom{n}{k_1} * \binom{n-k_1}{k_2} * \binom{n-k_1-k_2}{k_3} ** \binom{k_l}{k_l} \)\\[4mm]
\( = \frac{n!}{k_1! * (n-k_1)!} * \frac{(n-k_1)!}{k_2! * (n-k_1-k_2)!} * \frac{(n-k_1-k_2)!}{}** \frac{k_l!}{k_l! * 0!} \)\\[4mm]
\( = \underbrace{\frac{n!}{k_1! * k_2! ** k_l!}}_\text{Multinomialkoeffizient} \)\\[4mm]
{\color{Orange} wobei $k_1 + k_2 ++ k_l = n $ }
$n!$ = Anzahl der Möglichkeiten, $n$ verschiedene Elemente zu vertauschen\\[4mm]
\( \frac{n!}{k_1! * k_2! ** k_l! } = \) Anzahl der Möglichkeiten, $n$ Elemente zu vertauschen, bei denen $k_1$ von der Sorte 1 sind, $k_2$ von der Sorte 2, …, $k_l$ von der Sorte $l$.
\bsp MISSISSIPPI \(\to\) Wie viele verschiedene Wörter erhält man durch vertauschen?\\
\spa\( \frac{11!}{1! * 4! * 4! * 2!} \)
Sorte 1: M: $k_1 = 1$\\
Sorte 2: I: $k_2 = 4$\\
Sorte 3: S: $k_3 = 4$\\
Sorte 4: P: $k_4 = 2$
\section{Bedingte Wahrscheinlichkeit und Unabhängigkeit}
\bsp 2 rote Bälle und ein gelber Ball. Wir ziehen 2 Bälle ohne Zurücklegen, mit Reihenfolge.\\
Mit welcher Wahrscheinlichkeit
\begin{enumerate}[(a)]
\item ist der 1. Ball rot?\\
\( \frac 2 3 \)
\item ist der 2. Ball rot?\\
\( \frac 2 3 \)
\item sind beide Bälle rot?\\
\( \frac 2 3 * \frac 1 2 = \frac 1 3 \)
\item ist der 2. Ball rot, wenn man weiß, dass der 1. Ball rot ist?\\
\( \frac 1 2 \)
\end{enumerate}
mit Ereignissen formuliert:
\begin{itemize}
\item[A:] 1. Ball ist rot
\item[B:] 2. Ball ist rot
\item[(a)]\( P(A) = \frac 2 3 \)
\item[(b)] \( P(B) = \frac 2 3 \)
\item[(c)] \( P(A \cap B) = \frac 2 4 * \frac 1 3 \)\\
Man sieht: \( P(A\cap B) \not= P(A) * P(B) \), denn A und B sind abhängig.\\
\( P(A \cap B) = \frac 2 3 * \frac 1 2 = P(A) * P(B \mid A) \)
\item[(d)] bedingte Wahrscheinlichkeit \( P(B \mid A) = \frac 1 2 \not= P(B) \), denn A und B sind abhängig.
\end{itemize}
\begin{mydef}
Für 2 Ereignisse A und B ist die \underline{bedingte Wahrscheinlichkeit von B unter der Bedingung A}\\
\spa \( P(B\mid A) = \frac{P(A \cap B)}{P(A)}\) (wenn \(P(A) \not= 0\))
\end{mydef}
\begin{mydef}
umgestellt zur Berechnung von \(P(A\cap B)\):\\
\spa \( P(A\cap B) = P(A) * P(B\mid A) = P(B) * P(A\mid B) \) {\color{Orange}\(\to\) gilt immer}
\end{mydef}
\begin{mydef}
2 Ereignisse A und B sind \underline{unabhängig}, wenn \( P(A\cap B) = P(A) * P(B) \).\\
bzw. wenn \(P(B\mid A) = P(A) \)\\
bzw. wenn \(P(A\mid B) = P(B) \)\\
{\color{Orange} \(\to\) nur bei unabhängigen Ereignissen.}
\end{mydef}
\subsection{Satz von der totalen Wahrscheinlichkeit}
{\color{Orange}wenn \(P(A\mid B)\) und \(P(A\mid \overline{B})\) bekannt sind.}\\
\( P(A) = P(A\mid B) * P(B) + P(A\mid \overline{B}) * P(\overline{B}) \)
Anwendung des Satzes für (b):\\
\( P(\underbrace{B}_{\text{2. Ball rot}}) = \underbrace{P(B\mid A)}_{\frac 1 2} * \underbrace{P(A)}_{\frac 2 3} + \underbrace{P(B\mid \overline{A})}_{1} * \underbrace{P(\overline{A})}_{\frac 1 3} \)
\underline{Satz von der totalen Wahrscheinlichkeit Allgemeiner:}
Ist \( \omega = B_1 \cup B_2 \cup\cup B_K\) Zerlegung von \( \omega\) in \cunder{Yellow}{disjunkte} B, d.\,h. \( B_i \cap B_j = \emptyset \)\\
dann gilt: \( P(A) = P(A\mid B_1) * P(B_1) + P(A\mid B_2) * P(B_2) + … P(A\mid B_K) * P(B_K) \)
\bsp Datenübertragung über 2 Kanäle (alternativ).\\
\spa 95\% der Daten, die über Kanal 1 übertragen werden, kommen korrekt an.\\
\spa 90\% der Daten, die über Kanal 2 übertragen werden, kommen korrekt an.\\
\spa 40\% der Daten werden über Kanal 1 übertragen, 60\% über Kanal 2.
\begin{enumerate}[(a)]
\item Wie viel Prozent der Daten werden über Kanal 1 übertragen und kommen korrekt an?\\
Formulierung mit Ereignissen:\\
A: Daten werden über Kanal 1 übertragen\\
B: Daten kommen korrekt an.\\
gegeben: \(P(A) = 0,40; P(B\mid A) = 0,95; P(B\mid \overline{A}) = 0.90 \)\\
Gegenteile: \( P(\overline{A}) = 0,60; P(\overline{B} \mid A) = 0.05; P(\overline{B}\mid \overline{A}) = 0.10 \)\\
gesucht: \( \underbrace{P(A)}_{0,4} * \underbrace{P(B\mid A)}_{0,95} = 0,38 = 38\% \)
\item Wie viel Prozent der Daten werden über Kanal 1 übertragen und kommen nicht korrekt an?\\
\( P(A \cap B) = \underbrace{P(\overline{B}\mid A}_{=0,05} * \underbrace{P(A)}_{0,4} = 0,02 = 2\% \)
\item Wie viel Prozent der Daten kommen korrekt an?\\
\( P(B) = \underbrace{P(B\mid A)}_{0,95} * \underbrace{P(A)}_{0,4} + \underbrace{P(B|\overline{A})}_{0,9} * \underbrace{P(\overline{A})}_{0,6} = 0,92 = 92\% \)
\item Wie viel Prozent der Daten kommen nicht korrekt an, wenn man weiß, dass sie über Kanal 1 übertragen wurden?\\
\( P(\overline{B}\mid A) = 0,05 = 5\% \)
\item Wie viel Prozent der Daten kommen korrekt an oder werden über Kanal 1 Übertragen?\\
\( P(B\cup A) = P(B) + P(A) - P(A\cap B) \overset{(c)(a)}{=} 0,92 + 0,4 - 0,38 = 0,94 = 94\% \)
\item Wie viel Prozent der Daten, die korrekt ankommen, wurden über Kanal 1 übertragen?\\
\( P(A\mid B) = \frac{P(A\cap B)}{P(B)} \overset{(a)}{\underset{(c)}{=}} \frac{0,38}{0,92} = 0,413 = 41,3\% \)
\end{enumerate}
Im vorigen Beispiel:\\
A und B sind abhängig, da \( \underbrace{P(B\mid A)}_{0,95} \not= \underbrace{P(B\mid\overline{A})}_{0,9} \)
\bsp Datenübertragung:\\
\spa 1\% der gesendeten 1en kommt als 0 an.\\
\spa 2\% der gesendeten 0en kommt als 1 an.\\
\spa 30\% der gesendeten Daten sin 0en.
\begin{enumerate}[(a)]
\item Wie viel Prozent der Daten sind 0en, die als 1 ankommen?\\
\( P(A \cap \overline{B}) = P(\overline{B}\mid A) * P(A) = 0,02 * 0,3 = 0,006 = 0,6\% \)
\item Wie viel Prozent der ankommenden 0en sind 1en, die gesendet wurden?\\
\( P(\overline{A}\mid B) = \frac{P(\overline{A} \cap B)}{P(B)} = \frac{P(B\mid\overline{A}) * P(\overline{A})}{P(B)} \)
\item Wie viel Prozent der Daten werden Fehlerhaft übertragen?\\
\( \underbrace{P(A\cap \overline{B})}_{=0,6\%} + \underbrace{P(\overline{A} \cap B)}_{=0,7\%} = 1,3\% \)
\end{enumerate}
Ereignisse:
\begin{enumerate}[A:]
\item 0 wird gesendet
\item 0 kommt an
\end{enumerate}
Gegeben: \( P(B\mid\overline{A}) = 1\%; P(\overline{B}\mid A) = 2\%; P(A) = 30\% \)\\
\bsp (zu bedingten Wahrscheinlichkeiten).\\
2 maliges Würfeln\\
Ereignisse:
\begin{enumerate}[A:]
\item 1. Wurf ergibt 4
\item Summe der Augenzahlen ist 12
\item Summe der Augenzahlen ist 7
\item 2. Wurf ergibt 3
\end{enumerate}
Sind A und B bzw. A und C bzw. A und D bzw. A C und D unabhängig?\\
\textcolor{Orange}{A und B sind Unabhängig, wenn \( P(A \cap B) = P(A) * P(B) \) }
\( P(A) = \frac 1 6 \)\\
\( P(B) = \frac{1}{36} \)\\
\( P(C) = \frac 1 6 \)\\
\( P(D) = \frac 1 6 \)
\( P(A \cap B) = 0 \not= \frac{1}{216} = P(A) * P(B) \)\\
A und B sind abhängig.
\( A\cap C = \{ 43 \} \)\\
\( P(A\cap C) = \frac{1}{36} = \frac 1 6 * \frac 1 6 = P(A) * P(C) \)\\
A und C und unabhängig
\( A\cap D = \{ 43 \} \)\\
\( P(A\cap D)= \frac{1}{36} = \frac 1 6 * \frac 1 6 * P(A) * P(D) \)
A und D und unabhängig
\( A\cap D=\{43\} \)\\
\( P(A\cap D) = \frac{1}{36} = \frac 1 6 * \frac 1 6 = P(A) * P(D) \)\\
\( A\cap C\cap D = \{ 43 \} \)\\
\( P(A\cap C\cap D) = \frac{1}{36} \not= \frac 1 6 * \frac 1 6 * \frac 1 6 = P(A) * P(C) * P(D) \)\\
A, C und D sind abhängig
Zusatzfragen:\\
\begin{enumerate}[(a)]
\item
Wie groß ist die Wahrscheinlichkeit, \cunder{Yellow}{das der 1. Wurf 3 ist} \textcolor{Yellow}{A},\\
\cunder{Orange}{wenn die Summe der Augenzahlen 6 ist} \textcolor{Orange}{B}?
\item
Wie groß ist die Wahrscheinlichkeit, \cunder{Yellow}{dass (mindestens) einer der Würfe 3 ist} \textcolor{Yellow}{C},\\
\cunder{Orange}{wenn die Summe der Augenzahlen 6 ist} \textcolor{Orange}{B}?
\end{enumerate}
\( B = \{ 15,24,33,42,51 \} \)
\(P(A) = \frac 1 6 \)\\
\(P(B) = \frac{5}{36} \)\\
\(P(C) = \)
\begin{enumerate}[(a)]
\item
\( P(A \mid B) = \frac{P(A\cap B)}{P(B)} = \frac{ \frac{1}{36} }{ \frac{5}{36} } = \frac 1 5 \)
\item
\( P(A \mid C) = \frac{P(A\cap C)}{P(B)} = \frac{ \frac{1}{36} }{ \frac{5}{36} } = \frac 1 5 \)\\
\end{enumerate}
Oder direkt:
\begin{enumerate}
\item
\( P(A\mid B) = \frac 1 5 \)\\
Bedingung \( B = \{ 15, 24, \underline{3}3, 42, 51 \} \)
\item
\( P(C\mid B) = \frac 1 5 \)\\
Bedingung: \( B = \{ 15, 24, \underline{33}, 42, 51 \} \)
\end{enumerate}
\subsection*{Formeln}
\(P(A\mid B) = \frac{P(A\cap B)}{P(B)}\)\\
\(\to\)
\( P(A\cap B) = P(A\mid B) * P(B) = P(B\mid A) * P(A) \) \textcolor{Orange}{gilt immer}\\
\( P(A\cap B) = P(A) * P(B) \) \textcolor{Orange}{nur wenn A und B unabhängig}
Totale Wahrscheinlichkeit: \( P(A) = P(A\mid B) * P(B) + P(A\mid \overline{B}) * P(\overline{B}) \)
Gegenteile: \( P(\overline{A}) = 1 - P(A) ; P(\overline{A}\mid B) = 1-P(A\mid B) \)
Unabhängigkeit von Ereignissen:\\
A und B sind unabhängig, wenn \( P(A\cap B) = P(A) * P(B) \) oder wenn \( P(A\mid B) = P(A) \) oder wenn \( P(B\mid A) = P(B) \)
A, B und C sind unabhängig, wenn \( P(A\cap B\cap C) = P(A) * P(B) * P(C)\) \cunder{Yellow}{und} \( P(A\cap B) = P(A)*P(B) \), \( P(A\cap C) = P(A) * P(C) \), \( P(B\cap C) = P(B)*P(C) \)
\bsp bei 100 Mengen zu prüfen:\\
\( \binom{100}{1} + \binom{100}{3} ++ \binom{100}{99} + \binom{100}{100} = 2^{100} - \binom{100}{1} - \binom{100}{0} \)
\bsp 2 maliges Würfeln
\begin{enumerate}[A:]
\item 1. Wurf ist 3. \( P(A) = \frac 1 6 \)
\item Summe der Augenzahlen ist 12. \( P(B) = \frac{1}{36} \)
\item 2. Wurf ist 7. \( P(C) = 0 \)
\end{enumerate}
\( \underbrace{P(A\cap B\cap C)}_{_0} = \underbrace{P(A) * P(B) * P(C)}_{=0} \)\\[2mm]
\( \underbrace{P(a\cap B)}_{=0} \not= \underbrace{ P(A) }_{\frac 1 6} * \underbrace{P(B)}_{\frac{1}{36}} \)\\
\(\to\) A, B und C sind abhängig
\section{Zufallsvariablen}
\begin{mydef}
Eine Zufallsvariable $X$ ist eine Funktion.\\
\(X: \Omega \to \mathbb R \) (jedem Ergebnis aus \(\Omega\) wird eine reelle Zahl zugeordnet)
\end{mydef}
\bsp 2 maliger Münzwurf\\
Wird 2 mal Wappen geworfen, so gewinnen wir \EUR{2}\\
Wird 2 mal Zahl geworfen, so gewinnen wir \EUR{3}\\
sonst verlieren wir \EUR{2,40}.
\( \Omega = \{ \underbrace{WW}_{3}, \underbrace{ZZ}_{2}, \underbrace{WZ}_{-2,40}, \underbrace{ZW}_{-2,40} \} \) Wahrscheinlichkeit jeweils \( \frac 1 4\)\\
Zufallsvariable $X$: Gewinn (in \EUR{})
\begin{mydef}
Die \underline{Verteilung} (Wahrscheinlichkeitsverteilung) einer Zufallsvariable gibt an, mit welchen Wahrscheinlichkeiten die Zufallsvariable ihre möglichen Werte annimmt.
\end{mydef}
Im \bsp Verteilung von $X$:\\
\( P(X=3) = \frac 1 4 \)\\
\( P(X=2) = \frac 1 4 \)\\
\( P(X=-2,40) = \frac 2 4 = \frac 1 2 \)
Anderes \bsp 2 maliges Würfeln:\\
Wir gewinnen \EUR{2}, wenn zuerst eine 6 gewürfelt wird.\\
Wir gewinnen \EUR{5}, wenn keine 6 gewürfelt wird.\\
Wir verlieren sonst den Betrag $B$.
Zufallsvariable $X$: unser Gewinn\\
gesucht:Verteilung von $X$
Verteilung von $X$:\\
\( P(X=2) = \frac 1 6 \)\\
\( P(X=5) = \frac 5 6 * \frac 5 6 = \frac{25}{36} \)\\
\( P(X=-B) = 1 - \left( \frac 1 6 + \frac{25}{36} \right) = 1 - \frac{31}{36} = \frac{5}{36} \)
Für welches B ist das Spiel Fair? (\(\mu = 0 \))\\
\( B = \frac{ 2 * \frac{1}{6} + 5 * \frac{25}{36} }{\frac{5}{36}} = \) \EUR{27,40}
\( \sigma^2 = 4 * \frac 1 6 + 25 * \frac{25}{36} + 750.76 * \frac{5}{36} = 122.3 \)\\
\( \sigma = \sqrt{\sigma^2} = \sqrt{122.3} = 11.06 \)
\subsection{Diskrete Zufallsvariable}
Diskret: $X$ nimmt nur einzelne Werte mit bestimmten Wahrscheinlichkeiten an.
Im \bsp 2 maliger Münzwurf:\\
Durchschnittsgewinn \( \mu = 2 * \frac 1 4 + 3 * \frac 1 4 - 2,4 * \frac 1 2 = 0,05 \Rightarrow \) Spiel lohnt sich für uns\\
(gewichtet mit Wahrscheinlichkeit Durchschnittsgewinn pro Spiel)
Allgemein:\\
\begin{mydef}
Der \underline{Erwartungswert} (Mittelwert) einer Zufallsvariable $X$, die Werte $x_i$ mit den Werten $p_i$ annimmt \((i=1,2,3,…)\)\\
\textcolor{Orange}{(\(\to\) endlich viele oder abzählbar viele Werte \(x_i\)) }\\
ist \(\mu = E(X)=\sum\limits_i x_i*p_i \)
\end{mydef}
\underline{Maß für die Streuung (Schwankung)}
\begin{mydef}
Die \underline{Varianz} einer Zufallsvariablen $X$ (wie in der Definition von \(\mu\)) ist \(\sigma^2 = V(X) = Var(X) = \sum\limits_i {\color{Orange} (x_i-\mu)^2 } * p_i \) \textcolor{Orange}{quadratischen Abstände der Werte $x_i$ von $\mu$}\\
\(\to\) mittlerer Quadratischer Abstand
Die \underline{Standardabweichung} \(\sigma\) ist \(\sigma = \sqrt{\sigma^2}\)
\end{mydef}
Weshalb \underline{quadratische} Abstände?\\
z.\,B. kleiner Abstand 2 \(\to\) 2 \textcolor{Orange}{verdoppelt}\\
großer Abstand 10 \(\to\) 100 \textcolor{Orange}{verzehnfacht}
\(\rightarrow\) große Abstände fließen verstärkt ein in die Varianz.\\
Kleine Abstände sind oftmals nur Toleranzen, Messfehler, Ungenauigkeiten.
Anwendung im Finanzbereich:\\
z.\,B. \(\mu = \) mittlere Rendite\\
\spa \(\sigma = \) Maß für Streuung = Maß für das Risiko
\underline{Wenn \( \sigma = 0\)} wäre, dann gibt es nur einen Wert $x = \mu$ mit Wahrscheinlichkeit 1.
Vereinfachung der Formel für \(\sigma^2\):\\
\( \sigma^2 = \sum\limits_i (x_i-\mu)^2 * p_i = \sum\limits_i (x_i^2 - 2*x_i*\mu + \mu^2) *p_i = \sum\limits_i x_i^2*p_i - \sum\limits_i 2*x_i*\mu*p_i + \sum\limits_i \mu^2*p_i\)\\
\( = \sum\limits_i x_i^2 * p_i - 2\mu * \underbrace{\sum\limits_i x_i*p_i}_{=\mu} + \mu^2 * \underbrace{\sum\limits_i p_i}_{=1} \)\\
\( = \sum\limits_i x_i^2 * p_i - 2 \mu^2 + \mu^2 \)\\
\textcolor{Red}{\( \sigma^2 = \sum\limits_i x_i^2 * p_i - \mu^2 \) \underline{einfache Formel} für \(\sigma^2\)}
Im \bsp von oben:
\(\mu = 0,05\)\\
\( \sigma^2 = 4 * \frac 1 4 + 9 * \frac 1 4 + 5,76 * \frac 1 2 - 0,05^2 = 6.1275 \)\\
\( \sigma = \sqrt{6.1275} \approx 2.4754 \) \(\to\) Maß für die Streuung, also für die Mittlere Abweichung von \(\mu\).
Also pro Spiel: im \(\varnothing\): Gewinn von \(\mu = \)\EUR{0,05}.\\
aber wir haben eine Streuung um \(\mu\) von \textcolor{Orange}{\EUR{2,47} noch in Relation zu \(\mu \to\) Spiel mit hohem Risiko}
Man muss \(\sigma\) in Relation zu \(\mu\) sehen.\\
\(\to\) Variationskoeffizient \( \frac{\sigma}{\mu} = \frac{2,47}{0,05} = 49,4 = 4940\% \)
\subsection{Verteilung und Verteilungsfunktion von Zufallsvariablen}
Im \bsp 2 maliges Würfeln von vorhin:\\
\underline{Verteilung von $X$}: \( P(X=2) = \frac 1 6, P(X=5) = \frac{25}{36}, P(X=-27.4) = \frac{5}{36} \)
\begin{mydef}
Die Verteilungsfunktion einer Zufallsvariable $X$.\\
\(\to\) Funktion \(F: \mathbb R \to [0,1] \) mit \(F(x) = P(X\le x) \) \textcolor{Orange}{bei der Verteilung \(P(X=x)\)}
\end{mydef}
\( F(-27.4) = P(X\le -27.4) = \frac{5}{36} \)\\
\( F(2) = P(X\le 2) = P(X=-27.4) + P(X=2) = \frac{5}{36}+\frac{1}{6} = \frac{11}{36} \)\\
Bei einer diskreten Verteilung ist die Verteilungsfunktion eine Treppenfunktion, die von 0 nach 1 Wächst und an den Stellen $x_i$ treten Sprünge auf, mit Sprunghöhe $p_i$
Allgemein (nicht nur für diskrete Verteilungen) hat eine \underline{Verteilungsfunktion} \(F(x)\) die \underline{Eigenschaften}:
\begin{itemize}
\item
\( \lim\limits_{x\to -\infty} F(x) = 0 \) und \( \lim\limits_{x\to \infty} F(x) = 1 \)
\item
\( F(x) \) ist monoton wachsend \textcolor{Orange}{nicht unbedingt \underline{streng} wachsend}
\item
\(F(x)\) ist rechtsseitig stetig \textcolor{Orange}{\(\to\) aus der Definition: \(F(x) = P(X{\color{Red}\le}c) \) }
\end{itemize}
\bsp $X$: Anzahl an Wappen bei 2maligem Münzwurf. Skizziere die Verteilungsfunktion \(F(x)\)
\( F(x) = \begin{cases} 0, & x<0 \\ \frac 1 4, & 0\le x < 1 \\ \frac 3 4, & 1 \le x < 2 \\ 1, & 2\le x \end{cases} \)
\bsp \( F(x) = \begin{cases} a, & x < 0 \\ b*x+0.75, & 0 \le x < 1 \\ c, & x \ge 1 \end{cases} \)
Für welche \(a,b,c \in \mathbb R\) ist \(F(x)\) eine Verteilungsfunktion?
\(a = 0, 0\le x \le 2.25, c=1 \)
\bsp (zu Verteilungsfunktion)\\
\( F(x) = \begin{cases} e^x * \frac 1 2, & x < 0 \\ b, & 0 \le x < 2 \\ c, & x\ge 2 \end{cases} \)
\begin{enumerate}[(a)]
\item
Wie groß müssen $b$ und $c$ sein, damit $F(x)$ eine Verteilungsfunktion ist?
\item
Sei \( b=0.8, c=1 \).\\
Berechne:\\
\(P(X=0), P(X=-1), P(X\le -1), P(X>-1), P(X\le 2), P(X>2), P(X\ge3) \)
\end{enumerate}
\begin{enumerate}[(a)]
\item
\( e^0 * \frac 1 2 = 0.5 \)\\
\( \frac 1 2 \le b \le c = 1 \)\\
Eigenschaften der Verteilungsfunktion:
\begin{itemize}
\item \( \lim\limits_{x\to-\infty} \underbrace{F(x)}_{e^x*\frac 1 2} = 0 \), \( \lim\limits_{x\to-\infty} \underbrace{F(x)}_c = 1 \Rightarrow c=1 \)
\item \(F(x)\) rechtsseitig stetig
\item \(F(x)\) monoton wachsend
\end{itemize}
\item
\(P(X=0) = 0.3 (=0.8-0.5) \)\\
\(P(X=-1) = 0\) (Kein Sprung)\\
\(P(X\le-1) = F(-1) = \frac{e^{-1}}{2} \approx 0.18394 \)\\
\(P(X>-1) = 1-F(-1) = 1- \frac{e^{-1}}{2} \approx 0.81606 \)\\
\(P(X\le 2) = F(2) = 1\)\\
\(P(X>2) = 1-P(X\le 2) = 0 \)\\
\(P(X<2) = P(X\le 2) - P(X=2) = F(2) - 0.2 = 0.8\)\\
\(P(X\ge 3) = 1-P(X<3) = 0\)
\end{enumerate}
Meist ist die Verteilungsfunktion
\begin{itemize}
\item eine Treppenfunktion \(\to\) bei diskreten Verteilungen
\item eine durchgehend stetige Funktion \(\to\) keine Sprünge
\end{itemize}
\bsp\\
\( F(x) = \begin{cases}0, & x<1 \\ 0.2, & 1\le x<2 \\ \frac 1 8 *x^2, & x\le x<2.5 \\ 1, & x\ge 2.5 \end{cases}\)\\
Berechne:\\
\( P(X=-10) = 0\) (Kein Sprung)\\
\( P(X=2) = 0.3\) (Sprunghöhe bei \(x=2\))\\
\( P(X\le 2) = F(2) = \frac 1 8 * 2^2 = 0.5\)\\
\( P(X\ge 2) = 1 - P(X<2) = 1 - 0.2 = 0.8 \)\\
\( P(X\ge 2.2) = 1 - P(X<2.2) = 1 - P(X\le 2.2) = 1 - \frac{121}{200} = \frac{79}{200} \approx 0.395 \) (Kein Sprung!)
\( P(x\le X < 2) = P(X<2) - P(X<1) = 0.2 - 0 = 0.2 \)\\
\( P(2< X < 2.2) = P(X< 2.2) - P(X\le 2) = \frac{121}{200} - 0.5 = \frac{21}{200} \approx 0.105 \)
\subsection{Stetige Verteilung}
\(\to\) stetige Funktion \(F(x)\)\\
\(\to\) \(P(X=x) = 0\) \(\forall x \in \mathbb R\) (\(\to\) keine Sprünge)
\bsp Zufallszahlen (reelle Zahlen) im Intervall \( [100,500] \), und zwar gleich verteilt.\\
\( P(240\le X \le 260) = \frac{260-240}{500-100} = \frac{20}{400} = \frac{1}{20} = 0.05 \)
Stetige Verteilungsfunktionen besitzen eine \underline{Dichtefunktion} \(f(x)\) mit \( f(x) = F'(x) \).\\
\textcolor{Orange}{bis auf einzelne Stellen, an denen man nicht ableiten kann}\\
bzw. \(F(x) = \int\limits_{-\infty}^x f(t) dt \) \textcolor{Orange}{(\(=P(X\le x)\))}
\textcolor{Orange}{\(\to\) Bedeutung:} Die Dichtefunktion bei stetigen Verteilungen ist der Ersatz für die Einzelwahrscheinlichkeiten bei diskreten Verteilungen.
Im \bsp Fläche \( \underbrace{\frac{1}{400}}_{\text{Höhe}} * \underbrace{400}_{\text{Breite}} = 1 = \) Gesamtwahrscheinlichkeit
\textbf{Eigenschaften einer Dichtefunktion \(f(x)\):}
\(f: \mathbb R \to \left[0,\infty\right) \), \textcolor{Orange}{d.\,h. \( f(x) \ge 0 \quad \forall x \in \mathbb R \)}\\
und \( \int\limits_{-\infty}^{\infty} f(x) dx = 1 \) \textcolor{Orange}{\(\leftarrow\) Gesamtwahrscheinlichkeit}
\bsp\\
\( f(x) = \begin{cases} 0, & x < 0 \\ \frac 1 2 x, & 0 \le x < 1 \\ a * x^2, & 1 \le x < x \\ 0, & x \ge 2 \end{cases} \)
\begin{enumerate}[(a)]
\item
Für welches \( a \in \mathbb R \) ist \(f(x)\) eine Dichtefunktion?
\item Berechne für das $a$ aus (a) die zugehörige Verteilungsfunktion \(F(x)\)
\end{enumerate}
\begin{enumerate}[(a)]
\item
\( \int\limits_{-\infty}^{\infty} f(x) dx = 1 \to \) auflösen nach a\\
\( \int\limits_{-\infty}^{\infty} f(x) dx = \int\limits_0^1 \frac 1 2 x dx + \int\limits_1^2 a * x^2 dx \)\\
\( = \left[ \frac 1 4 x^2 \right]_0^1 + \left[ \frac a 3 * x^3 \right]_1^2 \)\\
\( = \frac14 - 0 + \frac83 - \frac13 a = \frac14+\frac73a=1 \)\\
\( \frac73a=\frac34 \Rightarrow a = \frac{9}{28} \)\\
\( f(x) = \begin{cases} 0, & x<0\\\frac12*x,&0\le x<1\\\frac{9}{28} * x^2, & 1 \le x < x \\ 0, & x \ge 2 \end{cases} \)
\item
\( F'(x) = f(x) \Rightarrow F(x) = \int f(x) dx \)\\
\( F(x) = \begin{cases} c_1,&x<0\\\frac14 x^2+c_2,&0\le x<1\\\frac{3}{28} x^3+c_3, & 1 \le x < x \\ c_4, & x \ge 2 \end{cases} \)\\
Bestimmung der Konstanten:\\
\( c_1 = 0 \), \textcolor{Orange}{da \(\lim\limits_{x\to-\infty}F(x)=0\)}\\
\( c_4 = 0 \), \textcolor{Orange}{da \(\lim\limits_{x\to\infty}F(x)=1\)}\\
\cunder{Orange}{Stetigkeit} an den Nahtstellen \(0,1,2\)\\
\(x=0: c_1 = \frac14*0^2 + c_2 \Rightarrow c_2 = 0 \)\\
\(x=1: \frac12*1^2 + c_2 = \frac{3}{28}*1^2+c_3 \Rightarrow c_3 = \frac14 -\frac{3}{28} = \frac{4}{28} = \frac17 \)\\
Zur Kontrolle:\\
\( x2: \frac{3}{28}*2^3+\frac17 = 1 = c_4 \Rightarrow\) stimmt
\end{enumerate}
\bsp \( f(x) = \begin{cases} c_1*e^{-2x}, & x\ge 0 \\ c_2, & x<0 \end{cases} \)\\
Bestimme \( c_1,c_2 \in \mathbb R\) so, dass \(f(x)\) eine Dichtefunktion ist.\\
Berechne dann \(F(x)\).
\( x=0: c_2=0 \)\\
Damit die Fläche für \(x<0\) nicht \(\infty\) groß ist, muss \(c_2=0\) sein.\\
\( 1 = \int\limits_{-\infty}^\infty f(x) dx = \int\limits_{-\infty}^0 c_2 dx + \int\limits_{0}^\infty c_1*e^{-2x} dx = \int\limits_{0}^\infty c_1*e^{-2x} dx = \left[ -\frac12 * c_1 * e^{-2x}\right]_0^\infty\)\\
\( = -\frac12*c_1*e^{-\infty} - (-\frac12*c_1*e^0) = \frac12 * c_1 \Rightarrow c_1 = 2 \)\\
\( f(x) = \begin{cases} 2*e^{-2x}, & x\ge 0\\0,&x<0\end{cases} \)\\
\( F(x) = \begin{cases} -e^{-2x} + d_1, & x\ge 0\\d_2,&x<0\end{cases} \)\\
Berechnung von \(d_1,d_2\):\\
\(d_2 = 0\), da \( \lim\limits_{x\to-\infty} F(x) = 0\) Stetigkeit an der Nahtstelle \(x=0\).\\
\(-e^{-2*0} + d_1 = d_2 \Rightarrow -1 + d_1 = 0 \Rightarrow d_1 = 1 \)
\( F(x) = \begin{cases} -e^{-2x} + 1,& x\ge 0 \\ 0,&x<0 \end{cases} \)
Berechne \( P(X\le-1), P(X>0.5), P(1<X\le2), P(X=0.5), P(Xy0.5) \)
\( P(X\le-1) = F(-1) = 0\)\\
\( P(X>0.5) = 1-P(X\le 0.5) = 1-F(0.5) = e^{-1} \approx 0.36788\)\\
\( P(1<X\le2) = P(X\le2) - P(x\le1) = F(2) - F(1) = e^{-2}-e^{-4} \approx 0.11702\)\\
\( P(X=0.5) = 0\)\\
\( P(X<0.5) = 1-P(X\le0.5) = 1-F(0.5) = 1-e^{-1} \approx 0.63212)\)
Allgemein: Berechnung von Wahrscheinlichkeiten bei \cunder{Orange}{stetigen} Verteilungen:\\
\( P(X=a) = 0\)\\
\(P(X\le a) = P(X<a) = F(a)\)\\
\(P(X\ge a) = P(X>a) = 1-F(a), P(a\le x\le b) = P(a<x<b) = F(b)-F(a) \)
Oder mit Hilfe der Dichtefunktion \(f(x)\):\\
\( P(X\le a) = \int\limits_{-\infty}^a f(x) dx \)\\
\( P(a \le a \le b) = \int\limits_a^b f(x) dx \)
\subsection{Wichtige Beispiele für Verteilungen}
\subsubsection{Diskrete Verteilung}
\begin{itemize}
\item \underline{Gleichverteilung}\\
Die Zufallsvariable $X$ nimmt Werte \( x_1,x_2,…,x_n \) mit gleicher Wahrscheinlichkeit \(\frac1n\) an.\\
\(\to P(X=x_1) = P(X=x_2) == P(X=x_n) = \frac1n\) \\
\item \underline{Binomialverteilung}
Ein Zufallsexperiment wird $n$-mal unabhängig voneinander wiederholt.\\
\textcolor{Orange}{\bsp 100 maliges würfeln (\(n=100\))}\\
A: Ereignis bei 1-maliger Durchführung des Experiments\\
\textcolor{Orange}{Im \bsp A: es wird 5 gewürfelt}\\
\(\to\) Zufallsvariable X: Anzahl, wie oft A eintritt bei der $n$-maligen Wiederholung des Experiments.\\
\textcolor{Orange}{im \bsp X: Anzahl der 5en beim 100-maligen Würfeln}\\
\(\to\) $X$ ist binomialverteilt mit Parametern $n$ und \(p=P(A)\), d.\,h. \(P(X=k)= \binom{n}{k} * p^k * (1-p)^{n-k} \) für \( k=0..n \)\\
\textcolor{Orange}{
\( P(X=0) = P(\text{keine }5) = \frac{5^{100}}{6^{100}} \) \\
\( P( X=1) = P(\text{eine }5) = \frac{100 * 5^{99}}{6^{100}} \) \\
\( P(X=10) = P(10 \text{ 5en}) = \frac{\binom{100}{10} * 5^{90}}{6^{100}} \) }
\end{itemize}
\bsp Datenübertragung von 5000 Bits.\\
Wahrscheinlichkeit, dass ein Bit Fehlerhaft übertragen wird, ist 1\%.\\
Mit welcher Wahrscheinlichkeit werden
\begin{enumerate}[(a)]
\item genau 20 Bits fehlerhaft übertragen?\\
\textcolor{Orange}{ \( \binom{5000}{20} * 0.01^{20} * 0.99^{4980} \) }
\item mehr als 2 Bits fehlerhaft übertragen?\\
\textcolor{Orange}{ \( P(X>2) \underset{\text{Gegenteil}}{=} 1-P(X\le 2) = 1-\left(P(X=2) + P(X=1) + P(X=0)\right) \)\\
\( = 1-\left( \binom{5000}{2}*0.01^2*0.99^{4998}+\binom{5000}{1}*0.01*0.99^{4999}+\binom{5000}{0}*0.01^0*0.99^{5000} \right)\) }
\end{enumerate}
\subsubsection{Geometrische Verteilung}
\bsp Wir schießen so lange, bis wir den anderen Treffen.\\
Wahrscheinlichkeit, bei einem Schuss zu treffen, ist 30\%.\\
\(X\) Anzahl der Schüsse bis zum Treffer\\
\(\to\) mögliche Werte von $X: 1,2,3,…$
\( P(X=k) = 0.7^{k-1} * 0.3 \)
Allgemein: Ein Zufallsexperiment wird beliebig oft (unabhängig voneinander) wiederholt.\\
Die Wahrscheinlichkeit, dass ein Ereignis $A$ bei einmaliger Durchführung auftritt, ist $p$.
$X:$ Anzahl der Wiederholungen, bis zum ersten mal $A$ eintritt.\\
$\to X$ ist geometrisch verteilt mit Parameter $p$, d.\,h.\\
\( P(X=k) = (1-p)^{k-1} * p \) für \( k=1,2,3,…\)
\bsp Mit welcher Wahrscheinlichkeit
\begin{enumerate}[(a)]
\item tritt beim zweiten oder dritten Wurf beim Würfeln die \cunder{Orange}{erste} 2 auf?\\
\textcolor{Orange}{\( P(X=2)+P(X=3) = \left(\frac56\right)^2*\frac16 + \left(\frac56\right)^3*\frac16 \)}
\item tritt beim zehnten Wurf die \cunder{Orange}{zweite} 2 auf?\\
\textcolor{Orange}{\( 9*\frac16*(\frac56)^8*\frac16 \)}
\item Mit welcher Wahrscheinlichkeit treten bei zehn Würfen zwei zweier auf?\\
\textcolor{Orange}{\( \binom{10}{2} * \left(\frac16\right)^2 * \left(\frac56\right)^8 \)}
\item Mit welcher Wahrscheinlichkeit tritt beim 100. Wurf die fünfte zwei auf?\\
\textcolor{Orange}{\( \binom{100}{4}*\left(\frac16\right)^4*\left(\frac56\right)^{95}\)}
\end{enumerate}
\bsp Russisches Roulette, 6er Trommel, mit einer Patrone. Wir spielen allein.\\
$X:$ Anzahl der Versuche, bis wir tot sind.
\begin{align*}
P(X=1) &= \frac16 &= \frac16\\
P(X=2) &= \frac56*\frac15 &= \frac16\\
P(X=3) &= \frac56*\frac45*\frac14&=\frac16\\
P(X=4) &= \frac56*\frac45*\frac34*\frac13&=\frac16\\
P(X=5) &= \frac56*\frac45*\frac34*\frac23*\frac12&=\frac16\\
P(X=6) &= \frac56*\frac45*\frac34*\frac23*\frac12*\frac11&=\frac16\\
\end{align*}
\textcolor{Orange}{Keine geometrische Verteilung, da keine \underline{Unabhängigkeit} der Versuche}
Gleiches Beispiel, aber nach jedem Versuch wird die Trommel zufällig gedreht \(\to\) geometrische Verteilung.
\begin{align*}
P(X=1) &= \frac16\\
P(X=2) &= \frac56*\frac16\\
P(X=3) &= \left(\frac56\right)^2 * \frac16
\end{align*}
Berechnung von \(\mu\) und \(\sigma^2\):
Bei der \underline{geometrischen Verteilung}:\\
$ P(X=k) = \left(1-p\right)^{k-1} * p $, $k=1,2,3$\\
\begin{align*}
\mu &= \sum\limits_{k=1}^\infty k*(1-p)^{k-1} * p\\
&= p * \sum\limits_{k=1}^\infty l*(1-p)^{k-1} \\
&= p*\frac{1}{p^2}\\
&= \frac1p\\
\sigma^2 &= \sum\limits_{k=1}^\infty k^2 * \left(1-p\right)^{k-1} * p - \left(\frac1p\right)^2\\
&= ?
\end{align*}
\textcolor{Orange}{geometrische Reihe:
\begin{align*}
\sum\limits_{k=0}^\infty x^k &= \frac{1}{1-x} &\text{für }\left|x\right| < 1\\
\sum\limits_{k=1}^\infty k*x^{k-1} &= \frac{1}{(1-x)^2}
\end{align*}}
Bei der \underline{Binomialverteilung}:
\begin{align*}
P(X=k) &= \binom{n}{k}*p^k*(1-p)^{n-k}\\
\mu &= \sum\limits_{k=0}^n k * \binom{n}{k} * p^k * \left(1-p\right)^{n-k}\\
&= … = n*p\\
\sigma^2 &= … = n*p*(1-p)
\end{align*}
\underline{Skizze} der Verteilungen:
\underline{geometrische} Verteilung:
% TODO
\underline{Binomialverteilt}
% TODO
für $p=0.5$ ist die Verteilung Symmetrisch
\underline{stetige Verteilung}
\begin{itemize}
\item
stetige Gleichverteilung auf einem Intervall \([a,b]\)\\
\\% TODO
\begin{align*}
f(x) &= \begin{cases} \frac{1}{b-a}, & a\le x\le b\\ 0, &\text{sonst} \end{cases}\\
F(x) &= \begin{cases}
c_1 \textcolor{Orange}{=0}, & x\le a \\
\frac{1}{b-a} * x + c_2, & a \le x \le b \\
c_3\textcolor{Orange}{=1} , & x \ge b
\end{cases}
\end{align*}
$F(x)$ muss an der Stelle $a$ stetig sein:\\
\( 0 = \frac{1}{b-a}*a + c_2 \Rightarrow c_2 = -\frac{a}{b-a} \)
\item Exponentialverteilung\\
Dichtefunktion \( f(x) = \begin{cases} 0, & x<0 \\ c*e^{-\lambda*x}, & 0 \le x \end{cases} \)\\
Bestimmen von $c$, so dass die Dichtefunktion passt:
\begin{align*}
\int\limits_{-\infty}^{\infty} f(x) dx &= \underbrace{\int\limits_{-\infty}^{0} 0 dx}_{=0} + \int\limits_{0}^{\infty} f(x) dx\\
&= \left[-\frac c\lambda * e^{-\lambda*x}\right]_0^\infty = 1\\
\underbrace{(-\frac{c}{\lambda}*e^{-\lambda*\infty})}_{=0} - ((-\frac{c}{\lambda}*e^{-\lambda*o})) &= 1\\
\frac{c}{\lambda} &=1 &| *\lambda\\
c &= \lambda\\
\Rightarrow f(x) &= \begin{cases} 0, & x < 0\\ \lambda*e^{-\lambda*x}, & 0\le x \end{cases}\\
F(x) &= \begin{cases} 0, &x<0 \\ -e^{-\lambda*x} + c_2, & 0 \le x \end{cases}\\
\Rightarrow F(x) &= \begin{cases} 0, &x<0 \\ -e^{-\lambda*x} + 1, & 0 \le x \end{cases}
\end{align*}
\end{itemize}
Anwendung: auf Wartezeiten-/Warteschlangenproblem\\
\(\to\) kurze Wartezeit mit hoher Wahrscheinlichkeit\\
\(\to\) größeres \(\lambda\): kürzere Wartezeiten mit höherer Wahrscheinlichkeit.
\underline{(Gaußsche Normalverteilung)}
Anwendung: wenn es einen Sollwert gibt und durch Zufallseffekte (Toleranzen, Messungenauigkeit, natürliche Abweichungen, …) Abweichungen nach oben und unten auftreten.
\begin{mydef}
Die Dichtefunktion der Normalverteilung mit Parametern \(\mu\) und \(\sigma\) (\(N(\mu,\sigma)\)-Verteilung) ist
\begin{align*}
f(x) &= \frac{1}{\sqrt{2\pi} * \sigma} * e^{-\frac12 * \left(\frac{x-\mu}{\sigma} \right)^2 }
\end{align*}
\end{mydef}
\( \Rightarrow f(x) = \frac{1}{\sqrt{2\pi}*\sigma} * \underbrace{e ^{-\frac12 * 0^2}}_{=0} = \frac{1}{\sqrt{2\pi}*\sigma} \)
Veränderung von \(\mu \to\) Verschiebung in $x$ Richtung\\
Veränderung von \(\sigma \to\) Stauchung/Dehnung in der Breite/Höhe
speziell: Standardnormalverteilung: \(N(0,1): f(x) = \frac{1}{\sqrt{2\pi}} * e^{-\frac12 x^2} \)\\
Problem: Verteilungsfunktion \(F(x)\) lässt sich nicht angeben/berechnen \(\to\) nur Tabellenwerte für die Standartnormalverteilung
\subsubsection{Erwartungswert und Varianz stetiger Verteilung}
\underline{diskret}:\\
\begin{align*}
\mu &= \sum\limits_i x_i*p_i\\
\sigma^2 &= \sum\limits_i x_i^2 * p_i - \mu^2
\end{align*}
\underline{stetig}:\\
\begin{align*}
\mu &= \int\limits_{-\infty}^{\infty} x*f(x) dx\\
\sigma^2 &= \int\limits_{-\infty}^{\infty} x^2 * f(x) dx - \mu^2
\end{align*}
\bsp \(f(x) = \begin{cases} 0, & x<0 \\ x, &0\le x <1 \\ a * x^2, & 1\le x\le 2 \\ 0, & x>2 \end{cases} \)\\
Bestimme $a$ so, dass $f(x)$ eine Dichtefunktion ist und bestimme dann \(\mu\).
\begin{align*}
\text{Bestimmung von }a:\\
1 &= \int\limits_{-\infty}^\infty f(x) dx\\
&= \int\limits_0^1 x dx + \int\limits_1^2 a*x^2 dx\\
&= \left[ \frac12 x^2 \right]_0^1 + \left[ a * \frac13 x^3 \right]_1^2\\
&= \frac12*1^2 - \frac12 *0^2+a*\frac13*8-a*\frac13*1\\
&= \frac12 + \frac73a = 1\\
\Rightarrow \frac73a &= \frac12\\
\Rightarrow a &= \frac{3}{14}\\[1cm]
%
\Rightarrow f(x) &= \begin{cases}
0,&x<0\\
x,&0\le x<1\\
\frac{3}{14}x^2,&1\le x<2\\
0,&x>2
\end{cases}\\
\mu &= \int\limits_{-\infty}^{\infty} x*f(x) dx\\
&= \int\limits_0^1 x*x dx + \int\limits_1^2 x * \frac{3}{14} x^2 dx\\
&= \left[ \frac13*x^3 \right]_0^1 + \left[ \frac{3}{56} x^4 \right]_1^2\\
&= \frac13 * 1 - \frac13 * 0 + \frac{3}{56} * 2^4 - \frac{3}{56} * 1\\
&= \frac13 -0 + \frac{48}{56}-\frac{3}{56} = \frac{191}{168}\\[5mm]
\sigma^2 &= \int\limits_{-\infty}^\infty x^2 * f(x) dx - \mu^2\\
&= \int\limits_0^1 x^2 * x dx + \int\limits_1^2 x^2 * \frac{3}{14} * x^2 dx - \left(\frac{191}{168}\right)^2\\
\end{align*}
\bsp Exponentialverteilung: \( f(x) = \begin{cases} \lambda*e^{-\lambda*x}, & x \ge 0 \\ 0, & x<0 \end{cases} \)
\begin{align*}
\mu &= \int\limits_{-\infty}^\infty x * f(x) dx = \int\limits_0^\infty x*\lambda*e^{-\lambda * x} dx\\
&= \lambda * \int\limits_0^\infty \underbrace{x}_{u} * \underbrace{e^{-\lambda*x}}_{v'} dx\\
&= \lambda * \left( \left[ -\frac{x}{\lambda} * e^{-\lambda*x} \right]_0^\infty - \int\limits_0^\infty -\frac1\lambda*e^{-\lambda*x}\, dx \right)\\
&= \lambda * \left( 0 - \left[ \frac{e^{-\lambda*x}}{\lambda^2} \right]_0^\infty\right)\\
&= \lambda * \left( - \left( \frac{e^{-\infty}}{\lambda^2} - \frac{e^0}{\lambda^2} \right) \right)\\
&= \lambda * \frac{1}{\lambda^2}\\
&= \frac1\lambda
\end{align*}
\bsp Gleichverteilung: \( f(x) = \begin{cases} \frac{1}{b-a} , & a\le x\le b \\ 0, & \text{sonst} \end{cases} \)
\begin{align*}
\mu &= \int\limits_{-\infty}^\infty x * f(x) \, dx = \int\limits_a^b x * \frac{1}{b-a} \, dx \\
&= \left[ \frac{x^2}{2} * \frac{1}{b-a} \right]_a^b\\
&= \frac{b^2}{2(b-a)} - \frac{a^2}{2(b-a)}\\
&= \frac{b^2-a^2}{2(b-a)}\\
&= \frac{(b-a)*(b+a)}{2 * (b-a)}\\
&= \frac{a+b}{2}
\end{align*}
\section{Normalverteilung}
\begin{mydef}
$X$ ist $N(\mu,\sigma)$ verteilt, wenn $X$ die Dichtefunktion \(f(x) = \frac{1}{\sqrt{2\pi}*\sigma} * e^{-\frac12 * \left(\frac{x-\mu}{\sigma}\right)^2}\) besitzt.\\
Es gilt: \(E(X)=\mu, Var(X) = \sigma^2\)\\
\(\rightarrow X\) heißt \underline{standardnormalverteilt}, wenn \(\mu=0,\sigma=1 \rightarrow f(x) = \frac{1}{\sqrt{2\pi}} * e^{-\frac12 x^2}\)\\
Zugehörige Verteilungsfunktion \(F(x) = \phi(x) = \phi_{0,1}(x) \rightarrow\) hierfür: \underline{Tabellenwerte}
\end{mydef}
\includegraphics{bilder/1-6_dichtefunktion.pdf}
Aus der Tabelle:\\
\bsp \(\phi(1.27) = 0.89796 \)\\
\( \phi(0) = \phi(0.00) = 0.5 \)\\
\( \phi(-1.27) = 1- \phi(1.27) = 1-0.89796 \)
Berechnung von \(\phi(-x)\):\\
\( \phi(-x) = 1 -\phi(x) \)
Wenn $X$ $N(0,1)$ verteilt ist, dann ist \( P(X\le b) = \phi(b), P(x\ge a) = 1-\phi(a), P(a\le x\le b) = \phi(b)-\phi(a), P(X=a)=0\)
Wenn $X$ $N(\mu,0)$ verteilt ist, dann ist…\\
\includegraphics{bilder/1-6_dichtefunktion_2.pdf}\\
\( \frac{X-\mu}{\rho} \) \( N(0,1)\) verteilt. Standardverteilung \(\to\) Tabelle Anwendbar.
\bsp Bauteile aus der Produktion $\to$ \underline{Länge des Bauteils} ist Normalverteilt. Mit \( \mu = 10cm\) (Normalverteilt), \( \sigma = 0.2cm \) (Streuung $\to$ Maß für die mittlere Abweichung von $\mu$)\\
$\to 10cm\pm 0.2cm$
Ausschuss liegt vor, wenn die Länge unter $9.5cm$ liegt.\\
Gesucht: Auschussanteil\\
\begin{align*}
\to P(X\le 9.5) &= P(\frac{x-\mu}{\sigma} \le \frac{0.9-\mu}{\sigma})\\
&= P(\underbrace{\frac{x-\mu}{\sigma}}_{\text{ist }N(0,1)\text{ verteilt}} \le \frac{9.5-10}{0.2})\\
&= P(\frac{x-\mu}{\sigma} \le -2.5) = \phi(-2.5)\\
&= 1-\phi(2.5) = 1-0.99379\\
&= 0.00621
\end{align*}
Wie viel \% der Bauteile nimmt uns ein Kunde ab, wenn er eine Länge zwischen $9.7$ und $10.25$ benötigt?
\begin{align*}
P(9.7\le X<10.25) &= P\left( \frac{9.7-\mu}{\sigma} \le \frac{x-\mu}{\sigma} < \frac{10.25-\mu}{\sigma}\right)\\
&= P\left(\frac{-0.3}{0.2}\le \frac{x-\mu}{\sigma}<\frac{0.25}{0.2}\right)\\
&= \phi(\frac{0.25}{0.2}) - \phi(\frac{-0.3}{0.2})\\
&= \phi(1.25) - \phi(-1.5) = \phi(1.25) - (1-\phi(1.5)) \\
&= 0.89435 - (1-0.93319)\\
&= 0.89435 - 0.06681\\
&= 0.82754 = \underline{\underline{82.754\%}}
\end{align*}
Berechne die Wahrscheinlichkeit, dass ein Bauteil länger als $10.7cm$ ist.
\begin{align*}
P(X>10.7) &= 1 - P(X<10.7)\\
&= 1-P(\frac{x-\mu}{\sigma} < \frac{10.7-\mu}{\sigma})\\
&= 1-P(\frac{x-\mu}{\sigma} < \frac{0.7}{0.2})\\
&= 1-P(\frac{x-\mu}{\sigma} < 3.5)\\
&= 1 - \phi(3.5) = 1-0.99977\\
&= 0.00023 = \underline{\underline{0.023\%}}
\end{align*}
\section{Schätzungen und Tests}
Test z.\,B. Liefert die Maschine im Mittel die geforderten $10cm$ Länge?\\
\(\to\) mit einer Stichprobe.
\subsection{Stichproben}
Stichprobenumfang $n$, Stichprobenwerte \(x_1,x_2,…,x_n\).\\
$\to$ arithmetisches Mittel (Durchschnitt)
\( \overline{x} = \frac1n * (x_1+x_2++x_n) = \frac1n \sum\limits_{i=1}^n x_i \)\\
\( \to\) Schätzung für $\mu$
Stichprobenvarianz
\begin{align*}
s_{\color{Orange}n}^2 &= \frac{1}{\color{Orange}n} * \left( (x_1-\overline{x})^2 + (x_2-\overline{x})^2+ … + (x_n-\overline{x})^2 \right) \\
&= \frac1n * \left( x_1^2 + x_2^2 + … + x_n^2 \right) - \overline{x}^2\\
s^2 = s_{\color{Orange}n-1}^2 &= \frac{1}{\color{Orange}n-1} + \left( (x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + … + (x_n - \overline{x})^2 \right)\\
&= \frac{1}{n-1} * (x_1^2 + … + x_n^2) - \frac{n}{n-1} * \overline{x}^2
\end{align*}
% Datum: 2011-12-21
\begin{align*}
\overline{x} &= \frac1n * \left( x_1+x_2+…+x_n \right) & \textcolor{Orange}{\to \text{ Schätzwert für }\mu}\\
s^2 = s_{n-1}^2 &= \frac{1}{n-1} \left( x_1^2 + x_2^2 + … + x_n^2 \right) - \frac{n}{n-1}*\overline{x}^2\\
s = s_{n-1} &= \sqrt{s_{n-1}^2} & \textcolor{Orange}{\to \text{ Schätzwert für }\sigma}
\end{align*}
\bsp Stichprobe mit 100 Bauteilen aus der Produktion\\
$\to$ gemessene Lösungen: 50 mal 10cm, 20 mal 10.1cm, 10 mal 10.2cm, 20 mal 9.9cm.
\begin{align*}
\overline{x} &= \frac{1}{100} * (50*10 + 20*10.1 + 10*10.2 + 20*9.9)\\
&= 10.02 \\
s^2 &= \frac{1}{99} * (50*10^2 + 20*10.1^2 + 10*10.2^2 + 20*9.9^2) - \frac{100}{99} * 10.02^2\\
&= \frac{19}{2475} \approx 0.007677\\
s &= \sqrt{\frac{19}{2475}} = \frac{\sqrt{209}}{165} \approx 0.08762
\end{align*}
\textcolor{Green}{Maß für die Streuung: $0.0876cm$\\($\to\ 10.02\pm 0.08762cm$)}
\subsection{Zentraler Grenzwertsatz}\label{sec:zentraler_grenzwertsatz}
Wenn die Zufallsvariablen $X_i\ , i=1,2,3,…$ unabhängig ($X_1,X_2$ sind unabhängig, wenn $P(X_1=a \land X_2=b) = P(X_1=a)*P(X_2=b)$) und identisch Verteilt (alle $X_i$ besitzen die gleiche Verteilungsfunktion) sind mit Erwartungswert \(\mu=E(X_i)\) und Varianz \(\sigma^2 = Var(X_i) \), dann gilt für die Zufallsvariable \(\overline{X}=\frac1n*\left(X_1+X_2++X_n\right)\):\\
\( \frac{\overline{X}-\mu}{\sigma} * \sqrt{n} \) ist für große $n$ näherungsweise $N(0,1)$ verteilt.\\
(und: Konvergenz für \(n\to\infty\))
\includegraphics{bilder/1-6_dichtefunktion_3.pdf}
\subsection{Tests (Erwartungswerttests)}
\underline{Nullhypothese} $\to$ soll getestet werden beim Erwartungswerttest:\\
\(H_0: \mu = \mu_0 \) z.\,B. Sollwert der Bauteillängen\\
\(\to\) Zweiseitiger Test\\
oder \(H_0: \mu\le\mu_0\) oder \(H_0: \mu\ge\mu_0 \)\\
\(\to\) Einseitige Tests
Testgröße \(T=\frac{\overline{X}-\mu_0}{\sigma} * \sqrt{n} \)\\
i\(\to\) ist für große $n$ näherungsweise $N(0,1)$ verteilt (siehe \ref{sec:zentraler_grenzwertsatz}) wenn $H_0$ stimmt.
\includegraphics{bilder/1-6_dichtefunktion_4.pdf}
Man muss sich eine \underline{Irrtumswahrscheinlichkeit} $\alpha$ vorgeben (z.\,B. \(\alpha = 1\%, 2\% \text{ oder } 5\%\))\\
Testentscheidung: $H_0$ wird \( \begin{cases} \text{angenommen}, &\text{wenn } -c\le T\le c\\ \text{abgelehnt}, &\text{wenn } T> c \text{ oder } T< -c \end{cases} \)
Bestimmung von $c$:
\begin{align*}
\phi(c) &= 1-\frac{\alpha}{2}\\
c &= \phi^{-1}(1-\frac{\alpha}{2}) & \text{in der Tabelle: rückwärts}
\end{align*}
\underline{Vorgehensweise beim Test}\\
\begin{itemize}
\item aus den vorgegebenen $\alpha$ wird $c$ bestimmt: \(\phi(c) = 1-\frac{\alpha}{2} \to \)\underline{$c$ aus der Tabelle}
\item in der Stichprobe wird $\overline{x}$ (und evtl. $s$) bestimmt\\
\(\to\) Testgröße \(T=\frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} \) ($\sigma$ kann durch $s$ angenähert werden)
\item Testentscheidung: $H_0$ wird \( \begin{cases} \text{angenommen}, &\text{wenn } -c\le T\le c\\ \text{abgelehnt}, &\text{wenn } T> c \text{ oder } T< -c \end{cases} \)
\end{itemize}
\bsp aus \ref{sec:zentraler_grenzwertsatz}:\\
zusätzliche Angaben: Sollwert: $10cm$ ($\mu_0$); Irrtumswahrscheinlichkeit: $2\%$ ($\alpha$)
\begin{multicols}{2}
\begin{align*}
c &= \phi^{-1}\left(1-\frac{\alpha}{2}\right)\\
&= \phi^{-1}\left( 1- \frac{0.02}{2}\right)\\
&= \phi^{-1}( 1- 0.01 )\\
&= \phi^{-1}( 0.99) \\
&= 2.33
\end{align*}
\begin{align*}
T &= \frac{10.02-10}{0.08762} * \sqrt{100}\\
&= \frac{0.02}{0.08762} * 10 = \frac{0.2}{0.08762}\\
&= 2.28258
\end{align*}
\end{multicols}
Testentscheidung: \(\underbrace{-c}_{-2.33}\le \underbrace{T}_{2.283}\le \underbrace{c}_{2.33}\)\\
\(\Rightarrow H_0\) annehmen, d.\,h. es spricht nichts dagegen, dass die Maschine im Mittel den Sollwert produziert.\\
\textcolor{Orange}{Nullhypothese: $\mu=\mu_0=10$}
Bisher: zweiseitiger Test: \(H_0: \mu=\mu0\)\\
Jetzt: \underline{einseitige} Tests:\\
\(H_0: \mu\le\mu_0\) (vorgegebener Maximalwert)
\includegraphics{bilder/1-6_dichtefunktion_5.pdf}
Testentscheidung:\\
$H_0$ wird \(\begin{cases}\text{angenommen},&\text{wenn } T\le c\\\text{abgelehnt},&\text{wenn }T>c\end{cases}\)
im \bsp wenn die Bauteile \underline{maximal $10cm$} lang sein dürfen.\\
\(\to H_0: \mu \le \underbrace{\mu_0}_{=10} \)
\(T=2.283\) (wie beim zweiseitigen Test)\\
für $\alpha = 2\%$:
\( \phi(c) = 1-\alpha = 1-0.02 = 0.98 \Rightarrow c=2.06 \)
Testentscheidung:\\
\( \underbrace{T}_{2.283} > \underbrace{c}_{2.06} \to H_0\) ablehnen $\to$ die Maschine liefert zu lange Teile (wahrscheinlich)
einseitig umgekehrt: $H_0 \mu \ge \mu_0$\\
\includegraphics{bilder/1-6_dichtefunktion_6.pdf}\\
$\hookrightarrow$ mit der Tabelle: $c = -\phi^{-1} (1-\alpha)$\\
Testentscheidung: $ T \ge c \to H_0 $ annehmen\\
$T<c \to H_0 ablehnen$
(Unterschied zum einseitigen Test $H_0: \mu \le \mu_0$)
\bsp Haltbarkeit von Birnen\\
gefordert: mindestens 10 Tage (durchschnittlich) $\to H_0: \mu\ge 10$\\
Stichprobe: 1000 Birnen $\to$ Haltbarkeit: bei 800 Birnen 10 Tage, bei 100 Birnen 11 Tage, bei 100 Birnen 8 Tage\\
Irrtumswahrscheinlichkeit: $\alpha = 2\%$\\
Spricht die Stichprobe gegen die Aussage, das die Haltbarkeit mindestens 10 Tage beträgt?
Bestimmung von $T$:\\
$n=1000$\\
$\overline{x} = \frac1n * (x_1+x_2++x_n)$\\
$\sigma = s = \sqrt{s^2}$\\
($\sigma$ bisher unbekannt $\to$ aus der Stichprobe)\\
mit $s^2 = s_{n-1}^2 = \frac{1}{n-1} * (x_1^2,x_2^2++x_n^2) - \frac{n}{n-1} * \overline{x}^2$
$\overline{x} = \frac{1}{1000} * (800 * 10 + 100 * 11 + 100 * 8) = 9.9$\\
$s^2 = \frac{1}{999} * (800 * 10^2 + 100 * 11^2 + 100 * 8^2 ) - \frac{1000}{999} * 9.9^2 = \frac{490}{999} = 0.\overline{490}$\\
$s = \sqrt{\frac{490}{999}} = \frac{7*\sqrt{1110}}{333} \approx 0.7$
$T = \frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} = \frac{9.9-10}{0.7} * \sqrt{1000} = \frac{-10*\sqrt{10}}{7} \approx -4.5175$
Bestimmung von $c$:\\
$ c = -\phi^{-1} (1-\alpha) = -\phi^{-1}(0.98) = -2.05 $ (Rückwärts in Tabelle)
Testentscheidung:\\
\( \underbrace{T}_{-4.5175} < \underbrace{c}_{-2.05} \to H_0\) ablehnen $\to$ Man davon ausgehen, dass die Haltbarkeit (im Schnitt) \underline{unter} 10 Tagen liegt.
Im Überblick:\\
\begin{tabular}{c|c|c|c|c}
& Testgröße & Grenze $c$ & $H_0$ annehmen, wenn & $\mu_0$\\\hline
$H_0: \mu = \mu_0$ &
immer gleich &
$c = \phi^{-1}(1-\frac \alpha 2)$ &
$-c \le T \le c$ & Sollwert\\
$H_0: \mu = \mu_0$ &
$T = \frac{\overline{x}-\mu_0}{\color{Orange}\sigma} * \sqrt{n}$ &
$c = \phi^{-1}(1-\alpha)$ &
$T\le c$ & Höchstens\\
$H_0: \mu = \mu_0$ &
\textcolor{Orange}{evtl. $s$ aus der Stichprobe} &
$c = -\phi^{-1}(1-\alpha)$ &
$T\ge c$ & Mindestens
\end{tabular}
\subsection{Fehler 1. Art, Fehler 2. Art}
Vorgeben muss man $\alpha = $ Fehler 1. Art $ = P( H_0 \text{ ablehnen } \mid H_0 \text{ stimmt} )$\\
es ergibt sich $\beta = $ Fehler 2. Art $ = P( H_0 \text{ annehmen } \mid H_0 \text{ stimmt nicht})$
Problem: je kleiner man $\alpha$ wählt, umso größer ist $\beta$.
\includegraphics{bilder/1-6_dichtefunktion_7.pdf}
\textbf{Gütefunktion eines Tests:}
beim zweiseitigen Test: $H_0: \mu = \mu_0$\\
wenn $H_0$ nicht stimmt, dann ist das wahre $\mu = \mu_1$
\includegraphics{bilder/1-6_guetefunktion.pdf}
Berechnung von $\beta$ im \bsp von vorhin:\\
$H_0: \mu \ge 10 ; \alpha ? 2\% \to c = -2.05 $, $H_0$ annehmen, wenn $T\ge c$\\
wenn das wahre $\mu$ z.\,B. gleich $0.8$ ist \textcolor{Orange}{$\to H_0$ stimmt nicht}
$\beta = P(H_0 \text{ annehmen} \mid \mu = 9.8 ) = P(T \ge -2.05 \mid \mu = 9.8)$\\
$= P(\frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} \ge -2.05 \mid \mu = 9.8) $
\begin{align*}
&= P( \frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} \ge -2.05 \mid \mu = 9.8 )\\
&= P( \frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} + \frac{\mu_1-\mu_0}{\sigma} * \sqrt{n} \ge -2.05 \mid \mu = 9.8 )\\
&= P( \frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} \ge -2.05 - \frac{\overbrace{\mu_1}^{9.8} - \overbrace{\mu_0}^{10} }{\sigma} * \sqrt{n} \mid u = 9.8 )\\
&= P( \frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} \ge 6.99 \mid \mu = 9.8 ) = 1-P(\frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} \ge 6.99) = 1 - \overbrace{\phi(6.99)}^{\approx 1} \approx 0
\end{align*}
ideal, das Praktisch kein Fehler 2. Art
Berechnung von $\beta$ für $\mu = 9.99 \to$ nah an $\mu_0 = 10$
\[ = -2.05 - \frac{9.99-10}{0.7} * \sqrt{1000} = -1.6 \]
\[ \to \beta = 1-\underbrace{\phi(-1.6)}_{1-\phi(1.6)} = 1 - ( 1- \phi(1.6)) = \phi(1.6) = 0.9452 = 94.52\% \]
$\to$ extrem hoch, blöd
Mit 94.52\% Wahrscheinlichkeit wird die Hypothese angenommen, obwohl sie nicht stimmt.
\subsection{Tests bei Binomialverteilung}
\label{Tests bei Binomialverteilung}
$X_i = \begin{cases} 0, & \text{mit Wahrscheinlichkeit } 1-p \\ 1, & \text{mit Wahrscheinlichkeit } p \end{cases}$ $\to$ ist $B(\underbrace{n}_{=1},p)$-verteilt
$\mu = E(X_i) = 0 * (1-p) + 1 * p = p$\\
$\sigma^2 = Var(X_i) = 0^2 * (1-p) + 1^2 * p - p^2 = p-p^2 = p*(1-p)$\\
$\sigma = \sqrt{p*(1-p)}$\\
mit einem Test $H_0: \mu = \mu_0 \to p = p_0$ können Wahrscheinlichkeiten getestet werden; z.\.B. für Fehlerraten $H_0: p\le p_0$ ($P_0$ = max. Fehlerrate).
\bsp Es soll getestet werden, ob ein Würfel gezinkt ist, anhand der Anzahl an Zweiern.\\
$H_0: p = \frac16$, Stichprobe: 3600 maliges Würfeln $\to$ liefert 580 Zweier.\\
Kann man mit Irrtumswahrscheinlichkeit von 3\% sagen, dass der Würfel gezinkt ist?
Testgröße $T = \frac{\overline{x}-p_0}{\sqrt{p_0*(1-p_0)}} * \sqrt{n} = \frac{-2 * \sqrt{5}}{5} \approx -0.8944$
Bestimmung von $c: \phi(c) = 1-\frac\alpha2 = 1-\frac{0.03}{2} = 0.985 \Rightarrow 2.17$\\
\textcolor{Orange}{für Zweiseitigen Test: $H_0: \mu = \mu_0$}\\
Testentscheidung:\\
Annehmen, wenn $-c \le T \le c \Rightarrow -2.17 \le -0.8944 \le 2.17$\\
$\Rightarrow$ Wird angenommen $\Rightarrow$ Nicht gezinkt.
\bsp Datenübertragung\\
Gefordert: maximale Fehlerrate von 1\% aller übertragenen Bits. Nachricht mit 10000 Bits wird übertragen.\\
\(\to\) es treten 105 Fehler auf.
Kann man bei einer Irrtumswahrscheinlichkeit von 2\% davon ausgehen, dass die Fehlerrate max. 1\% beträgt?
$p_0 = 0.01; \overline{x} = \frac{105}{10000} = 0.0105; n = 10000 $
Testgröße $T = \frac{\overline{x}-p_0}{\sqrt{p_0*(1-p_0)}} * \sqrt{n} = \frac{0.0105 - 0.01}{\sqrt{0.01*(1-0.01)}} * \sqrt{10000} = \frac{5*\sqrt{11}}{33} \approx 0.5025 $
Bestimmung von $c: \phi(c) = 1-\alpha = 1 - 0.02 = 0.98 \Rightarrow 2.05$
Testentscheidung: Annehmen, wenn $T\le c \Rightarrow 0.5025 \le 2.05$\\
$\Rightarrow$ Es ist davon auszugehen, dass die Fehlerrate max. 1\% beträgt.
\subsection{Konfidenzintervall}
Konfidenzintervall (Vertrauensintervall) für den Erwartungswert $\mu$
$\to$ Intervall, das um den Stichproben-Schätzwert $\overline{x}$ herumliegt, in dem $\mu$ mit Wahrscheinlichkeit \cunder{Yellow}{$1-\alpha$} liegt.\\
\textcolor{Orange}{$\to$ $1-\alpha$ Konfidenzintervall}
Analog zu den Tests (zweiseitig): $P(-c \le T \le c) = 1-\alpha$\\
$\to \underbrace{P\Big(-\phi^{-1}(1-\frac\alpha2) \le \underbrace{T}_{ \frac{\overline{x}-\mu}{\sigma} * \sqrt{n} } \le \phi^{-1}(1-\frac\alpha2) \Big) }_{\color{Orange}\text{Umformen, so dass } \mu \text{ in der Mitte steht}}$\\
$\to P\Big( \overline{x}-\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}} \le \mu \le \overline{x}+\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}}\Big)$\\
$\to$ Formel für das $(1-\alpha)$ Konfidenzintervall:\\
$ \Big[ \overline{x}-\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}}, \overline{x}+\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}} \Big] $ \textcolor{Orange}{$\leftarrow$ da drin liegt $\mu$ mit Wahrscheinlichkeit $1-\alpha$}
\includegraphics{bilder/1-6_konfidenz.pdf}
\bsp Länge von Bauteilen aus der Produktion.\\
Stichprobe von 100 Bauteilen mit $\overline{x} = 8.8, s=0.2$\\
gesucht: 95\% Konfidenzintervall für $\mu$
$ \Big[ \overline{x}-\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}}, \overline{x}+\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma} {\sqrt{n}} \Big] $\\
$= \Big[ 8.8 - 1.96 * \frac{0.2}{\sqrt{100}} , 8.8 + 1.96 * \frac{0.2}{\sqrt{100}} \Big] $\\
$= \Big[ \frac{10951}{1250} , \frac{11049}{1250} \Big] = \Big[ 8.7608, 8.8392 \Big]$
\textcolor{Orange}{In diesem Intervall liegt mit 95\% Wahrscheinlichkeit die $\varnothing$-Länge der Bauteile, die die Maschine Produziert.\\
Wird $1-\alpha$ größer gewählt, so wird das Intervall größer.\\
Für größeres $n$ wird das Intervall kleiner.
}
\subsection{Näherungen durch die Normalverteilung}
$\to$ Wie groß muss $n$ sein, damit die Näherung erlaubt ist?\\
Bei der Binomialverteilung (zum Schätzen von Wahrscheinlichkeit) ist die Näherung erlaubt, wenn $n*p*(1-p) \ge 9$ ist.
Im \bsp aus \ref{Tests bei Binomialverteilung}: maximale Fehlerrate 1\%, $p=0.01 ; n = 10000$\\
$ n * p * (1-p) = 10000 * 0.01 * (1-0.01) = 99 \ge 9 \to$ Näherung passt gut.\\
$n$ sollte $ \ge \frac{9}{p*(1-p)} = \frac{9}{0.01*0.99} = 910$ sein.
\section{Kovarianz und Korrelation}
Zur Messung von Zusammenhängen, hier: lineare Zusammenhänge, zwischen 2 Zufallsvariablen $X,Y$.
\begin{mydef}
\underline{Kovarianz} von $X$ und $Y$: $Cov(X,Y) = E\big( (X-\mu_X) * (Y-\mu_Y) \big) = E(X*Y) - \mu_X * \mu_Y$\\
\textcolor{Orange}{$( \to Var(X) = E((X-\mu_X)^2 = Cov(X,X) = E(X^2) - \mu_X^2 )$}
\end{mydef}
\begin{mydef}
\underline{Korrelationskoeffizient}:\\
$ \rho (X,Y) = \frac{Cov(X,Y)}{\sigma_X*\sigma_Y} $\\
\textcolor{Orange}{$\to -1 \le \rho(X,Y) \le 1$ }
\end{mydef}
\includegraphics{bilder/1-7_korrelation.pdf}
\begin{tabular}{lcl}
$\rho(X,Y)$ & $=0$ & $\to$ kein Zusammenhang zwischen X und Y (unkorreliert)\\
& $>0$ & $\to$ wachsender Zusammenhang (positiv korreliert)\\
& $=1$ & $\to$ exakt auf einer Gerade mit positiver Steigung
\end{tabular}
\bsp Zweimaliger Münzwurf\\
$X: $ Anzahl an Wappen im 1. Wurf\\
$Y: $ Gesamtzahl an Wappen
\begin{align*}
P(X=0,Y=0) &\overset{ZZ}{=} \frac14\\
P(X=0,Y=1) &\overset{ZW}{=} \frac14\\
P(X=1,Y=1) &\overset{WZ}{=} \frac14\\
P(X=1,Y=2) &\overset{WW}{=} \frac14\\
\\
Cov(X,Y) &= E(X+Y) - \mu_X*\mu_Y\\
&= 0 * 0 * \frac14 + 0 * 1 * \frac14 + 1 * 1 * \frac14 + 1 * 2 * \frac14 - 0.5 * 1\\
&= \frac 14 = 0.25 > 0
\end{align*}
\newpage
\section*{Standardnormalverteilung}
\addcontentsline{toc}{section}{Standardnormalverteilung}
\input{snv.tex}
\end{document}