|
|
\documentclass[11pt]{scrartcl}
|
|
|
\usepackage[utf8]{inputenc}
|
|
|
\usepackage[ngerman]{babel}
|
|
|
\usepackage{amsmath}
|
|
|
\usepackage{amssymb}
|
|
|
\usepackage{eurosym}
|
|
|
\usepackage{enumerate}
|
|
|
\usepackage{multicol}
|
|
|
%\usepackage{booktabs}
|
|
|
%\usepackage{pstricks}
|
|
|
%\usepackage{pst-node}
|
|
|
\usepackage[paper=a4paper,left=30mm,right=20mm,top=20mm,bottom =25mm]{geometry}
|
|
|
\usepackage[
|
|
|
pdftitle={Wahrscheinlichkeitstheorie und Statistik},
|
|
|
pdfsubject={Mitschrift der Vorlesung "Wahrscheinlichkeitstheorie und Statistik" an der HTW-Aalen, bei Herrn Fischer.},
|
|
|
pdfauthor={Thomas Battermann},
|
|
|
pdfkeywords={Wahrscheinlichkeitstheorie und Statistik},
|
|
|
pdfborder={0 0 0}
|
|
|
]{hyperref}
|
|
|
%TEST
|
|
|
\usepackage{framed}
|
|
|
\usepackage{amsthm}
|
|
|
\newtheorem{mdef}[equation]{Definition}
|
|
|
\newenvironment{mydef}
|
|
|
{\begin{leftbar}\begin{mdef}}
|
|
|
{\end{mdef}\end{leftbar}}
|
|
|
%TEST ENDE
|
|
|
\usepackage{tabularx}
|
|
|
\usepackage{graphicx}
|
|
|
\usepackage[usenames,dvipsnames]{color}
|
|
|
\usepackage[table]{xcolor}
|
|
|
\usepackage{lastpage}
|
|
|
\usepackage{fancyhdr}
|
|
|
\setlength{\parindent}{0ex}
|
|
|
\setlength{\parskip}{2ex}
|
|
|
\setcounter{secnumdepth}{4}
|
|
|
\setcounter{tocdepth}{4}
|
|
|
\definecolor{darkgreen}{rgb}{0,0.5,0}
|
|
|
\definecolor{darkblue}{rgb}{0,0,0.5}
|
|
|
\definecolor{lightgrey}{rgb}{0.9,0.9,0.9}
|
|
|
\definecolor{lightgreen}{rgb}{0.9,1,0.9}
|
|
|
|
|
|
\pagestyle{fancy} %eigener Seitenstil
|
|
|
\fancyhf{} %alle Kopf- und Fußzeilenfelder bereinigen
|
|
|
\fancyhead[L]{Wahrscheinlichkeitstheorie und Statistik} %Kopfzeile links
|
|
|
\fancyhead[C]{Semester 3} %zentrierte Kopfzeile
|
|
|
\fancyhead[R]{WS 2011/2012} %Kopfzeile rechts
|
|
|
\renewcommand{\headrulewidth}{0.4pt} %obere Trennlinie
|
|
|
\fancyfoot[C]{Seite \thepage\ von \pageref{LastPage}}
|
|
|
\renewcommand{\footrulewidth}{0.4pt} %untere Trennlinie
|
|
|
|
|
|
\newcommand{\spa}{\hspace*{4mm}}
|
|
|
\newcommand{\defin}{\textcolor{darkgreen}{\textbf{Def.: }}}
|
|
|
\newcommand{\bsp}{\textcolor{darkblue}{\textbf{\underline{Bsp.}: }}}
|
|
|
\newcommand{\rrfloor}{\right\rfloor}
|
|
|
\newcommand{\llfloor}{\left\lfloor}
|
|
|
\newcommand{\cunder}[2]{{\color{#1}\underline{\color{Black}#2}}}
|
|
|
|
|
|
|
|
|
\title{Wahrscheinlichkeitstheorie und Statistik}
|
|
|
\author{Mitschrift von Thomas Battermann}
|
|
|
\date{3. Semester}
|
|
|
|
|
|
\begin{document}
|
|
|
\pagestyle{empty}
|
|
|
|
|
|
\maketitle\thispagestyle{empty}
|
|
|
\tableofcontents\thispagestyle{empty}
|
|
|
|
|
|
\newpage
|
|
|
\pagestyle{fancy}
|
|
|
\setcounter{page}{1}
|
|
|
|
|
|
Statistik:
|
|
|
\begin{itemize}
|
|
|
\item beschreibende Statistik\\
|
|
|
\(\to\) Erfassung, Auswertung von Daten.\\
|
|
|
(z.\,B. über Mittelwerte)
|
|
|
\begin{itemize}
|
|
|
\item oftmals keine Gesamterhebung (z.\,B. Wahl)
|
|
|
\item sondern Stichproben (z.\,B. Hochrechnung, Umfragen vorab)\\
|
|
|
Auswahl:
|
|
|
\begin{itemize}
|
|
|
\item Zufällig\\
|
|
|
Qualitätstests
|
|
|
\item gezielt (Repräsentative Stichprobe)\\
|
|
|
z.\,B. Hochrechnung der Wahl
|
|
|
\end{itemize}
|
|
|
\end{itemize}
|
|
|
\item beurteilende Statistik
|
|
|
\begin{itemize}
|
|
|
\item Rückschlüsse von Stichproben auf die Gesamtheit
|
|
|
\item Tests \( \to \)
|
|
|
\item[\(\to\)] Zufallseffekte
|
|
|
\item[\(\to\)] Wahrscheinlichkeitsrechnung als Hilfsmittel
|
|
|
\end{itemize}
|
|
|
\end{itemize}
|
|
|
|
|
|
|
|
|
\section{Grundbegriffe}
|
|
|
|
|
|
\subsection{Zufallsexperimente}
|
|
|
\begin{itemize}
|
|
|
\item Mehrere mögliche Ergebnisse\\
|
|
|
{\color{Orange}\bsp Würfeln \(\to\) 1,2,3,4,5,6}
|
|
|
\item prinzipiell beliebig oft wiederholbar
|
|
|
\item für die Ergebnisse lassen sich Wahrscheinlichkeiten angeben\\
|
|
|
{\color{Orange}\(\to\) jeweils \(\frac 1 6\)}
|
|
|
\end{itemize}
|
|
|
|
|
|
Überprüfung von Wahrscheinlichkeiten mit Hilfe häufiger Wiederholungen des Experiments. {\color{Orange}\bsp 1000 maliges Würfeln \(\to\) 160mal 1, 168mal 2, …}\\
|
|
|
{\color{Orange}Schätzwert für die W.: \(\frac{160}{1000} = 0,16 = \) relative Häufigkeit}\\
|
|
|
{\color{Orange}absolute Häufigkeit der 1 = 160}
|
|
|
|
|
|
Man erhält W. aus den relativen Häufigkeiten, wenn die Anzahl der Wiederholungen gegen \(\infty\) geht.\\
|
|
|
{\color{Orange}W. für die 1 = \(0.1\overline{6}\)}
|
|
|
|
|
|
\subsection{Begriffe, Bezeichnungen:}
|
|
|
|
|
|
\underline{Ergebnisse} \( \omega_1, \omega_2, \omega_3, …\)
|
|
|
|
|
|
\underline{Ergebnismenge:} \( \Omega = \{ \omega_1, \omega_2, \omega_3, … \} \) {\color{Orange} \( \Omega = \{1,2,3,4,5,6\}\)}
|
|
|
|
|
|
\underline{Ereignisse:} \( A,B,C,… \) sind Teilmengen von \(\Omega\)\\
|
|
|
\spa meist zunächst verbal formuliert\\
|
|
|
\spa {\color{Orange}A: Es wird eine gerade Zahl gewürfelt.}\\
|
|
|
\spa {\color{Orange}\(\to A= \{2,4,6\} \) }
|
|
|
|
|
|
\underline{Wahrscheinlichkeiten} für die Ergebnisse und die Ereignisse.\\
|
|
|
\spa \(P(\omega_1), P(\omega_2), …\) und \(P(A), P(B), …\) (\(P\) für probalby)\\
|
|
|
\spa {\color{Orange} \(P(1)=P(2)=P(3)=P(4)=P(5)=P(6)=\frac{1}{6} \)} (Lauter gleiche W. (Gleichverteilung))\\
|
|
|
\spa {\color{Orange} \( P(a) = \frac 3 6 = \frac 1 2 = 0,5 = 50\% \)}
|
|
|
|
|
|
\bsp 2maliges Würfeln\\
|
|
|
A: im 1. Wurf kommt 5\\
|
|
|
B: Summe der Augen ist 7\\
|
|
|
gesucht: \(\Omega, P(A), P(B) \)
|
|
|
|
|
|
\( \Omega = \{ 11,12,,21,13,31,…,66\} \) W. jeweils \( \frac 1 36 \)\\
|
|
|
\( A = \{ 51,52,53,54,55,56 \} \)\\
|
|
|
\( B = \{ 16,25,34,43,52,61 \} \)\\
|
|
|
\( P(A) = \frac 1 6 \)\\
|
|
|
\( P(B) = \frac 1 6 \)
|
|
|
|
|
|
C: Summe der Augenzahlen ist 12\\
|
|
|
\( C = \{ 66 \} \) \( P(C) = \frac 1 {36} \)
|
|
|
|
|
|
\bsp 3-maliger Münzwurf\\
|
|
|
Mit welcher w.\\
|
|
|
(a) tritt keinmal Wappen auf?\\
|
|
|
(b) tritt genau zweimal Wappen auf?
|
|
|
|
|
|
\(\Omega = \{ ZZZ, ZZW, ZWZ, WZZ, ZWW, WZW, ZWW, WWW \} \)\\
|
|
|
\( P(A) = \{ ZZZ \} = \frac 1 8 \)\\
|
|
|
\( P(B) = \{ ZWW, WZW, WWZ \} = \frac 3 8 \)
|
|
|
|
|
|
\subsection{Eigenschaften, Rechenregeln für W.}
|
|
|
|
|
|
\( P(\Omega) = 1 \), \( P(\emptyset) = 0\), für jedes Ereignis A: \( 0 \le P(A) \le 1 \)
|
|
|
|
|
|
Ereignis A \(\to\) Gegenereignis (Komplement) von A: \(\overline{A} = A^C\) mit \( P(\overline{A}) = 1-P(A) \)
|
|
|
|
|
|
Schnitt von Ereignissen A und B: \( A \cap B \)
|
|
|
|
|
|
Vereinigung von Ereignissen A und B: \( A \cup B \)\\
|
|
|
\( P(A\cup B) = P(A) + P(B) - P(A\cap B) \)\\
|
|
|
|
|
|
Wenn A und B \underline{disjunkt} sind, dann ist \( P(A\cup B) = P(A)+P(B) \)
|
|
|
|
|
|
P(\underline{entweder} A oder B) ) \( P(A) + P(B) - 2 \cdot P(A\cap B)\) \(( = P( (A\cap \overline{B}) \cup (\overline{A}\cap B) ))\)
|
|
|
|
|
|
Allgemeiner:\\
|
|
|
\begin{align*}
|
|
|
P(A \cup B \cup C) = &P(A) + P(B) + P(C) \\
|
|
|
&+ P(A\cap B\cap C) \\
|
|
|
&- P(A\cap B) - P(A\cap C) - P(B\cap C)
|
|
|
\end{align*}
|
|
|
|
|
|
Allgemein (Siebformel oder Inklusions-Exklusions-Methode):
|
|
|
\begin{align*}
|
|
|
&P(A_1 \cup A_2 \cup … \cup A_n)\\
|
|
|
= &P(A_1) + P(A_2) + … + P(A_n)\\
|
|
|
&-P(A_1 \cap A_2) - P(A_1 \cap A_2) -\\
|
|
|
&+ P(A_1 \cap A_2 \cap A_3) + …\\
|
|
|
&…\\
|
|
|
&+(-1)^{n+1} \cdot P(A_1 \cap A_2 \cap … \cap A_n )
|
|
|
\end{align*}
|
|
|
|
|
|
\bsp 100 maliges Würfeln. Mit welcher Wahrscheinlichkeit tritt {\color{Orange}\(\to 6^{100} \) mögliche Ergebnisse}\\
|
|
|
\begin{itemize}
|
|
|
\item[(a)] 100 mal 5 auf? { \color{Orange}\( \frac 1 {6^{100}} \) }
|
|
|
\item[(b)] keine 5 auf? { \color{Orange} \( \left( \frac 5 6 \right)^{100} \) }
|
|
|
\item[(c)] mindestens eine 5 auf? { \color{Orange} \( 1- \left( \frac 5 6 \right)^{100} \) } \( \to \) Über Gegenereignis (b).
|
|
|
\item[(d)] genau eine 5 auf? { \color{Orange} \( \frac 1 6 \cdot \left( \frac 5 6 \right)^{99} \cdot 100 \) }
|
|
|
\end{itemize}
|
|
|
|
|
|
\section{Berechnung von Wahrscheinlichkeiten mit der Kombinatorik}
|
|
|
|
|
|
Für ein Ereignis A, das Teilmenge von \(\Omega\) ist.\\
|
|
|
\( P(A) = \frac{\left|A\right|}{\left|\Omega\right|}= \frac{\text{günstige Fälle}}{\text{mögliche Fälle}} \) {\color{Orange}Elemente von \(\Omega\) = Anzahl aller möglichen Ergebnisse}\\
|
|
|
Nur wenn alle Ergebnisse aus \(\Omega\) \underline{gleich} Wahrscheinlich sind.
|
|
|
{\color{Orange}ansonsten: \( P(A) = \sum\limits_{\omega \in A} P(\omega) \)}
|
|
|
|
|
|
Berechnung von \(\left|A\right|\) und \( \left|\Omega\right| \) mit der Kombinatorik.\\
|
|
|
|
|
|
Kombinatorik:\\
|
|
|
k-maliges Ziehen aus n Kugeln.\\
|
|
|
Ziehen mit oder ohne Zurücklegen.\\
|
|
|
mit/ohne Berücksichtigung der Reihenfolge.
|
|
|
|
|
|
\bsp Lotto \( k = 6\) aus \(n = 49\). Ziehen ohne Zurücklegen, ohne Reihenfolge.
|
|
|
|
|
|
4 Fälle:
|
|
|
\begin{enumerate}
|
|
|
\item
|
|
|
Fall: Ziehen mit Zurücklegen, mit Reihenfolge:\\
|
|
|
\( n^k \) Möglichkeiten {\color{Orange}gesamt: \(\left|\Omega\right| = n^k\) Möglichkeiten}
|
|
|
\item
|
|
|
Fall: Ziehen ohne Zurücklegen, mit Reihenfolge:\\
|
|
|
\( \frac{n!}{(n-k)!} = n^{\underline{k}} \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
\bsp Ein 5 stelliger Code wird zufällig zufällig gewählt, bestehend aus Ziffern \( 1,2,…,9 \).\\
|
|
|
{\color{Orange} \( k=5; n=9 \) Gesamt: \( n^k = 9^6 \) Möglichkeiten}\\
|
|
|
Mit welcher Wahrscheinlichkeit
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item tritt die Kombination \(13758\) auf?\\
|
|
|
{\color{Orange} \( \frac{1}{9^5} \)}
|
|
|
\item enthält der Code lauter gleiche Zahlen?\\
|
|
|
{\color{Orange} \( \frac{9}{9^5} = \frac{1}{9^4} \)}
|
|
|
\item enthält der Code lauter verschiedene Zahlen?\\
|
|
|
{\color{Orange} \( \frac{9!}{4! * 9^5} \) }
|
|
|
\item beginnt der Code mit 3?\\
|
|
|
{\color{Orange} \( \frac{1 * 9^4}{9^5} = \frac 1 9 \)}
|
|
|
\item enthält der Code genau eine 3?\\
|
|
|
{\color{Orange} \( \frac 1 9 * \left(\frac 8 9\right)^4 * 5 = \frac{ 5 * 8^4 }{ 9^5 } \)}
|
|
|
\item enthält der Code genau zwei 3er?\\
|
|
|
{\color{Orange} \( \left(\frac{1}{9}\right)^2 * \left(\frac{8}{9}\right)^3 * 2 * 5 = \frac{10 * 8^3}{9^5} \)}
|
|
|
\end{enumerate}
|
|
|
|
|
|
%
|
|
|
|
|
|
\begin{itemize}
|
|
|
\item[3.] Fall: Ziehen ohne Zurücklegen, ohne Reihenfolge.\\
|
|
|
\(\to\) Aus n Kugeln werden k \cunder{Yellow}{ausgewählt}.\\
|
|
|
Vergleich mit 2. Fall: Ziehen ohne Zurücklegen, mit Reihenfolge\\
|
|
|
\spa \(\to n^{\underline{k}} = \frac{n!}{(n-k)!}\) Möglichkeiten\\
|
|
|
Es gibt \(k!\) Möglichkeiten, \(k\) Kugeln zu Vertauschen (auf \(k\) Plätzen).\\
|
|
|
im 3. Fall:\\
|
|
|
gesamt: \( \frac{n!}{(n-k)! * k!} = \binom{n}{k} \) Möglichkeiten.\\
|
|
|
im Beispiel von Oben (f).\\
|
|
|
\spa Mögl. aus 5 Plätzen 2 Stück für die 3er \cunder{Yellow}{auszuwählen}:\\
|
|
|
\spa \( \binom 5 2 = \frac{5!}{2! * (5-2)!} = \frac{5 * 4 * \not 3 * \not 2 * \not 1}{2 * 1 * \not 3 * \not 2 * \not 1} = 10\)\\
|
|
|
\bsp Mit welcher Wahrscheinlichkeit tritt bei 100 maligem Würfeln genau 20 mal die 4 auf?\\
|
|
|
\( W = \frac{ \binom{100}{20} * 5^{80} }{ 6^{100} } \)\\
|
|
|
\end{itemize}
|
|
|
|
|
|
\bsp Lotto 6 aus 49\\
|
|
|
Berechne die Wahrscheinlichkeiten für
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item 6 Richtige\\
|
|
|
\( \frac{1}{\binom{49}{6}} = \frac{1}{13.983.816} \) ~ 14 Mio. Möglichkeiten
|
|
|
\item 4 Richtige\\
|
|
|
\( \frac{ \binom{6}{4} * \binom{43}{2} }{ \binom{6}{49} } = \frac{645}{665896} \approx 0.096861972440140803\%\)
|
|
|
\item 3 Richtige\\
|
|
|
\( \frac{ \binom{6}{3} * \binom{43}{3} }{ \binom{6}{49} } = \frac{8815}{499422} \approx 1.765040386687010184\%\)
|
|
|
\end{enumerate}
|
|
|
|
|
|
\bsp Kiste mit 4 blauen, 3 roten, 8 gelben Laptops\\
|
|
|
Wir wählen zufällig 8 aus.
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item Mit welcher Wahrscheinlichkeit sind 3 blau und 5 gelb?\\
|
|
|
\( \frac{ \binom{4}{3} * \binom{3}{0} * \binom{8}{5} }{\binom{15}{8}} = \frac{224}{6435} \)
|
|
|
\item Mit welcher Wahrscheinlichkeit sind 6 gelb\\
|
|
|
\( \frac{ \binom{8}{6} * \binom{7}{2} }{ \binom{15}{8} } = \frac{196}{2145} \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
\bsp Kiste wie in vorigem Beispiel. Wir stellen 2 Pakete mit jeweils 4 Laptops zusammen (zufällig).\\
|
|
|
Mit welcher Wahrscheinlichkeit {\color{Orange} \(\to \binom{15}{4} * \binom{11}{4} \)}\\
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item enthält das 1. Paket 1 blauen und das 2. Paket 2 blaue Laptops?
|
|
|
\item enthält das 1. Paket 1 blauen Laptop?
|
|
|
\item enthält das 2. Paket 1 blauen Laptop?
|
|
|
\item enthält das 1. oder 2. Paket 1 blauen Laptop?
|
|
|
\item Mit welcher Wahrscheinlichkeit enthält das 2. Paket 1 blauen Laptop, wenn man weiß, das im 1. Paket 2 blaue Laptops sind?
|
|
|
\end{enumerate}
|
|
|
|
|
|
Lösung:\\
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item \( \frac{ \binom{4}{1}*\binom{11}{3} * \binom{3}{2} * \binom{8}{2} }{\binom{15}{4}*\binom{11}{4}} \approx 0.12307692307692307692\)
|
|
|
\item \( \frac{ \binom{4}{1}*\binom{11}{3} * \binom{11}{4} }{ \binom{15}{4}*\binom{11}{4} } \)
|
|
|
\item \( \frac{ \binom{4}{1}*\binom{11}{3} * \binom{11}{4} }{ \binom{15}{4}*\binom{11}{4} } \)
|
|
|
\item
|
|
|
Ereignis A: 1. Paket enthält 1 blauen Laptop\\
|
|
|
Ereignis B: 2. Paket enthält 1 blauen Laptop\\
|
|
|
gesucht: \( A \cup B = P(A) + P(B) - P(A \cap B) \)\\
|
|
|
\( 2 * \frac{ \binom{4}{1} * \binom{11}{3} }{ \binom{15}{4} } - \frac{ \binom{4}{1} * \binom{11}{3} * \binom{3}{1} * \binom{8}{3} }{ \binom{15}{4} * \binom{11}{4}} \)\\
|
|
|
{\color{Orange} Man sieht hier: \(P(A \cap B) \not= P(A) * P(B) \)}
|
|
|
\item \( \frac{ \binom{2}{1} * \binom{9}{3} }{ \binom{11}{4} } \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
|
|
|
\begin{itemize}
|
|
|
\item[4.] Fall: Ziehen mit Zurücklegen, ohne Reihenfolge.\\
|
|
|
{\color{Orange} \(\to\) ungeeignet für Wahrscheinlichkeitsrechnungen.}\\
|
|
|
\bsp 2 maliges Würfeln\\
|
|
|
Mit welcher Wahrscheinlichkeit tritt keine 5 auf?\\
|
|
|
im 4. Fall: \( \Omega = \{ (1,1), (1,2), (1,3), (1,4), (1,5), (1,6), (2,2), (2,3), … (6,6) \}; \quad \left|\Omega\right| = 21\)\\
|
|
|
Formal für die Anzahl der Ergebnisse in \(\Omega\):\\
|
|
|
\( \Omega = \binom{n+k-1}{k} = \binom{6+2-1}{2} = \binom{7}{2} = \frac{7!}{6!} = \frac{7 * 6}{2} = 21 \)
|
|
|
{\color{Orange} Problem:} Ergebnisse sind nicht gleich Wahrscheinlich\\
|
|
|
\(\to\) 4. Fall: blöd!\\
|
|
|
\(\to\) statt dem 4. Fall wird der 1. Fall betrachtet: Ziehen mit Zurücklegen und mit Reihenfolge \(\to \left|\Omega\right| = n^k \)\\
|
|
|
im \bsp \( P(\text{keine 5}) = \frac{5^2}{6^2} = \frac{25}{36}\)
|
|
|
\end{itemize}
|
|
|
|
|
|
\bsp $k = 40$ Personen\\
|
|
|
Mit welcher Wahrscheinlichkeit haben mindestens 2 am gleichen Tag Geburtstag?\\
|
|
|
$n = 365$ Kugeln; $k = 40$ maliges Ziehen\\
|
|
|
Ziehen mit Zurücklegen, mit Reihenfolge \( \to \) 1. Fall: \( \left| \Omega \right| = n^k = 365^{40} \)\\
|
|
|
\(P(\text{mindestens 2 haben am gleichen Tag Geburtstag})\)\\
|
|
|
\(= 1 - P(\text{alle haben an verschiedenen Tagen Geburtstag})\)\\
|
|
|
\( = 1 * \frac{ 365^{\underline{40}} }{365^{40}} \approx 89.123\% \)
|
|
|
|
|
|
\underline{Binomialkoeffizient/Multinomialkoeffizient}
|
|
|
|
|
|
Anzahl der Möglichkeiten, aus $n$ Elementen $k$ auszuwählen: \(\binom{n}{k} = \frac{n!}{k! * (n-k)!} \)\\
|
|
|
Allgemeiner:\\
|
|
|
Anzahl der Möglichkeiten, aus $n$ Elementen $k_1$ auszuwählen, aus den restlichen dann $k_2, …, k_l$\\
|
|
|
\( \binom{n}{k_1} * \binom{n-k_1}{k_2} * \binom{n-k_1-k_2}{k_3} * … * \binom{k_l}{k_l} \)\\[4mm]
|
|
|
\( = \frac{n!}{k_1! * (n-k_1)!} * \frac{(n-k_1)!}{k_2! * (n-k_1-k_2)!} * \frac{(n-k_1-k_2)!}{…}*…* \frac{k_l!}{k_l! * 0!} \)\\[4mm]
|
|
|
\( = \underbrace{\frac{n!}{k_1! * k_2! * … * k_l!}}_\text{Multinomialkoeffizient} \)\\[4mm]
|
|
|
{\color{Orange} wobei $k_1 + k_2 + … + k_l = n $ }
|
|
|
|
|
|
$n!$ = Anzahl der Möglichkeiten, $n$ verschiedene Elemente zu vertauschen\\[4mm]
|
|
|
\( \frac{n!}{k_1! * k_2! * … * k_l! } = \) Anzahl der Möglichkeiten, $n$ Elemente zu vertauschen, bei denen $k_1$ von der Sorte 1 sind, $k_2$ von der Sorte 2, …, $k_l$ von der Sorte $l$.
|
|
|
|
|
|
\bsp MISSISSIPPI \(\to\) Wie viele verschiedene Wörter erhält man durch vertauschen?\\
|
|
|
\spa\( \frac{11!}{1! * 4! * 4! * 2!} \)
|
|
|
|
|
|
Sorte 1: M: $k_1 = 1$\\
|
|
|
Sorte 2: I: $k_2 = 4$\\
|
|
|
Sorte 3: S: $k_3 = 4$\\
|
|
|
Sorte 4: P: $k_4 = 2$
|
|
|
|
|
|
\section{Bedingte Wahrscheinlichkeit und Unabhängigkeit}
|
|
|
|
|
|
\bsp 2 rote Bälle und ein gelber Ball. Wir ziehen 2 Bälle ohne Zurücklegen, mit Reihenfolge.\\
|
|
|
Mit welcher Wahrscheinlichkeit
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item ist der 1. Ball rot?\\
|
|
|
\( \frac 2 3 \)
|
|
|
\item ist der 2. Ball rot?\\
|
|
|
\( \frac 2 3 \)
|
|
|
\item sind beide Bälle rot?\\
|
|
|
\( \frac 2 3 * \frac 1 2 = \frac 1 3 \)
|
|
|
\item ist der 2. Ball rot, wenn man weiß, dass der 1. Ball rot ist?\\
|
|
|
\( \frac 1 2 \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
mit Ereignissen formuliert:
|
|
|
\begin{itemize}
|
|
|
\item[A:] 1. Ball ist rot
|
|
|
\item[B:] 2. Ball ist rot
|
|
|
\item[(a)]\( P(A) = \frac 2 3 \)
|
|
|
\item[(b)] \( P(B) = \frac 2 3 \)
|
|
|
\item[(c)] \( P(A \cap B) = \frac 2 4 * \frac 1 3 \)\\
|
|
|
Man sieht: \( P(A\cap B) \not= P(A) * P(B) \), denn A und B sind abhängig.\\
|
|
|
\( P(A \cap B) = \frac 2 3 * \frac 1 2 = P(A) * P(B \mid A) \)
|
|
|
\item[(d)] bedingte Wahrscheinlichkeit \( P(B \mid A) = \frac 1 2 \not= P(B) \), denn A und B sind abhängig.
|
|
|
\end{itemize}
|
|
|
|
|
|
\begin{mydef}
|
|
|
Für 2 Ereignisse A und B ist die \underline{bedingte Wahrscheinlichkeit von B unter der Bedingung A}\\
|
|
|
\spa \( P(B\mid A) = \frac{P(A \cap B)}{P(A)}\) (wenn \(P(A) \not= 0\))
|
|
|
\end{mydef}
|
|
|
|
|
|
\begin{mydef}
|
|
|
umgestellt zur Berechnung von \(P(A\cap B)\):\\
|
|
|
\spa \( P(A\cap B) = P(A) * P(B\mid A) = P(B) * P(A\mid B) \) {\color{Orange}\(\to\) gilt immer}
|
|
|
\end{mydef}
|
|
|
|
|
|
\begin{mydef}
|
|
|
2 Ereignisse A und B sind \underline{unabhängig}, wenn \( P(A\cap B) = P(A) * P(B) \).\\
|
|
|
bzw. wenn \(P(B\mid A) = P(A) \)\\
|
|
|
bzw. wenn \(P(A\mid B) = P(B) \)\\
|
|
|
{\color{Orange} \(\to\) nur bei unabhängigen Ereignissen.}
|
|
|
\end{mydef}
|
|
|
|
|
|
\subsection{Satz von der totalen Wahrscheinlichkeit}
|
|
|
|
|
|
{\color{Orange}wenn \(P(A\mid B)\) und \(P(A\mid \overline{B})\) bekannt sind.}\\
|
|
|
\( P(A) = P(A\mid B) * P(B) + P(A\mid \overline{B}) * P(\overline{B}) \)
|
|
|
|
|
|
Anwendung des Satzes für (b):\\
|
|
|
\( P(\underbrace{B}_{\text{2. Ball rot}}) = \underbrace{P(B\mid A)}_{\frac 1 2} * \underbrace{P(A)}_{\frac 2 3} + \underbrace{P(B\mid \overline{A})}_{1} * \underbrace{P(\overline{A})}_{\frac 1 3} \)
|
|
|
|
|
|
\underline{Satz von der totalen Wahrscheinlichkeit Allgemeiner:}
|
|
|
|
|
|
Ist \( \omega = B_1 \cup B_2 \cup … \cup B_K\) Zerlegung von \( \omega\) in \cunder{Yellow}{disjunkte} B, d.\,h. \( B_i \cap B_j = \emptyset \)\\
|
|
|
dann gilt: \( P(A) = P(A\mid B_1) * P(B_1) + P(A\mid B_2) * P(B_2) + … P(A\mid B_K) * P(B_K) \)
|
|
|
|
|
|
\bsp Datenübertragung über 2 Kanäle (alternativ).\\
|
|
|
\spa 95\% der Daten, die über Kanal 1 übertragen werden, kommen korrekt an.\\
|
|
|
\spa 90\% der Daten, die über Kanal 2 übertragen werden, kommen korrekt an.\\
|
|
|
\spa 40\% der Daten werden über Kanal 1 übertragen, 60\% über Kanal 2.
|
|
|
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item Wie viel Prozent der Daten werden über Kanal 1 übertragen und kommen korrekt an?\\
|
|
|
Formulierung mit Ereignissen:\\
|
|
|
A: Daten werden über Kanal 1 übertragen\\
|
|
|
B: Daten kommen korrekt an.\\
|
|
|
gegeben: \(P(A) = 0,40; P(B\mid A) = 0,95; P(B\mid \overline{A}) = 0.90 \)\\
|
|
|
Gegenteile: \( P(\overline{A}) = 0,60; P(\overline{B} \mid A) = 0.05; P(\overline{B}\mid \overline{A}) = 0.10 \)\\
|
|
|
gesucht: \( \underbrace{P(A)}_{0,4} * \underbrace{P(B\mid A)}_{0,95} = 0,38 = 38\% \)
|
|
|
\item Wie viel Prozent der Daten werden über Kanal 1 übertragen und kommen nicht korrekt an?\\
|
|
|
\( P(A \cap B) = \underbrace{P(\overline{B}\mid A}_{=0,05} * \underbrace{P(A)}_{0,4} = 0,02 = 2\% \)
|
|
|
\item Wie viel Prozent der Daten kommen korrekt an?\\
|
|
|
\( P(B) = \underbrace{P(B\mid A)}_{0,95} * \underbrace{P(A)}_{0,4} + \underbrace{P(B|\overline{A})}_{0,9} * \underbrace{P(\overline{A})}_{0,6} = 0,92 = 92\% \)
|
|
|
\item Wie viel Prozent der Daten kommen nicht korrekt an, wenn man weiß, dass sie über Kanal 1 übertragen wurden?\\
|
|
|
\( P(\overline{B}\mid A) = 0,05 = 5\% \)
|
|
|
\item Wie viel Prozent der Daten kommen korrekt an oder werden über Kanal 1 Übertragen?\\
|
|
|
\( P(B\cup A) = P(B) + P(A) - P(A\cap B) \overset{(c)(a)}{=} 0,92 + 0,4 - 0,38 = 0,94 = 94\% \)
|
|
|
\item Wie viel Prozent der Daten, die korrekt ankommen, wurden über Kanal 1 übertragen?\\
|
|
|
\( P(A\mid B) = \frac{P(A\cap B)}{P(B)} \overset{(a)}{\underset{(c)}{=}} \frac{0,38}{0,92} = 0,413 = 41,3\% \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
Im vorigen Beispiel:\\
|
|
|
A und B sind abhängig, da \( \underbrace{P(B\mid A)}_{0,95} \not= \underbrace{P(B\mid\overline{A})}_{0,9} \)
|
|
|
|
|
|
\bsp Datenübertragung:\\
|
|
|
\spa 1\% der gesendeten 1en kommt als 0 an.\\
|
|
|
\spa 2\% der gesendeten 0en kommt als 1 an.\\
|
|
|
\spa 30\% der gesendeten Daten sin 0en.
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item Wie viel Prozent der Daten sind 0en, die als 1 ankommen?\\
|
|
|
\( P(A \cap \overline{B}) = P(\overline{B}\mid A) * P(A) = 0,02 * 0,3 = 0,006 = 0,6\% \)
|
|
|
\item Wie viel Prozent der ankommenden 0en sind 1en, die gesendet wurden?\\
|
|
|
\( P(\overline{A}\mid B) = \frac{P(\overline{A} \cap B)}{P(B)} = \frac{P(B\mid\overline{A}) * P(\overline{A})}{P(B)} \)
|
|
|
\item Wie viel Prozent der Daten werden Fehlerhaft übertragen?\\
|
|
|
\( \underbrace{P(A\cap \overline{B})}_{=0,6\%} + \underbrace{P(\overline{A} \cap B)}_{=0,7\%} = 1,3\% \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
Ereignisse:
|
|
|
\begin{enumerate}[A:]
|
|
|
\item 0 wird gesendet
|
|
|
\item 0 kommt an
|
|
|
\end{enumerate}
|
|
|
|
|
|
Gegeben: \( P(B\mid\overline{A}) = 1\%; P(\overline{B}\mid A) = 2\%; P(A) = 30\% \)\\
|
|
|
|
|
|
\bsp (zu bedingten Wahrscheinlichkeiten).\\
|
|
|
2 maliges Würfeln\\
|
|
|
Ereignisse:
|
|
|
\begin{enumerate}[A:]
|
|
|
\item 1. Wurf ergibt 4
|
|
|
\item Summe der Augenzahlen ist 12
|
|
|
\item Summe der Augenzahlen ist 7
|
|
|
\item 2. Wurf ergibt 3
|
|
|
\end{enumerate}
|
|
|
Sind A und B bzw. A und C bzw. A und D bzw. A C und D unabhängig?\\
|
|
|
\textcolor{Orange}{A und B sind Unabhängig, wenn \( P(A \cap B) = P(A) * P(B) \) }
|
|
|
|
|
|
\( P(A) = \frac 1 6 \)\\
|
|
|
\( P(B) = \frac{1}{36} \)\\
|
|
|
\( P(C) = \frac 1 6 \)\\
|
|
|
\( P(D) = \frac 1 6 \)
|
|
|
|
|
|
\( P(A \cap B) = 0 \not= \frac{1}{216} = P(A) * P(B) \)\\
|
|
|
A und B sind abhängig.
|
|
|
|
|
|
\( A\cap C = \{ 43 \} \)\\
|
|
|
\( P(A\cap C) = \frac{1}{36} = \frac 1 6 * \frac 1 6 = P(A) * P(C) \)\\
|
|
|
A und C und unabhängig
|
|
|
|
|
|
\( A\cap D = \{ 43 \} \)\\
|
|
|
\( P(A\cap D)= \frac{1}{36} = \frac 1 6 * \frac 1 6 * P(A) * P(D) \)
|
|
|
A und D und unabhängig
|
|
|
|
|
|
\( A\cap D=\{43\} \)\\
|
|
|
\( P(A\cap D) = \frac{1}{36} = \frac 1 6 * \frac 1 6 = P(A) * P(D) \)\\
|
|
|
\( A\cap C\cap D = \{ 43 \} \)\\
|
|
|
\( P(A\cap C\cap D) = \frac{1}{36} \not= \frac 1 6 * \frac 1 6 * \frac 1 6 = P(A) * P(C) * P(D) \)\\
|
|
|
A, C und D sind abhängig
|
|
|
|
|
|
Zusatzfragen:\\
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item
|
|
|
Wie groß ist die Wahrscheinlichkeit, \cunder{Yellow}{das der 1. Wurf 3 ist} \textcolor{Yellow}{A},\\
|
|
|
\cunder{Orange}{wenn die Summe der Augenzahlen 6 ist} \textcolor{Orange}{B}?
|
|
|
\item
|
|
|
Wie groß ist die Wahrscheinlichkeit, \cunder{Yellow}{dass (mindestens) einer der Würfe 3 ist} \textcolor{Yellow}{C},\\
|
|
|
\cunder{Orange}{wenn die Summe der Augenzahlen 6 ist} \textcolor{Orange}{B}?
|
|
|
\end{enumerate}
|
|
|
|
|
|
\( B = \{ 15,24,33,42,51 \} \)
|
|
|
|
|
|
\(P(A) = \frac 1 6 \)\\
|
|
|
\(P(B) = \frac{5}{36} \)\\
|
|
|
\(P(C) = \)
|
|
|
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item
|
|
|
\( P(A \mid B) = \frac{P(A\cap B)}{P(B)} = \frac{ \frac{1}{36} }{ \frac{5}{36} } = \frac 1 5 \)
|
|
|
\item
|
|
|
\( P(A \mid C) = \frac{P(A\cap C)}{P(B)} = \frac{ \frac{1}{36} }{ \frac{5}{36} } = \frac 1 5 \)\\
|
|
|
\end{enumerate}
|
|
|
|
|
|
Oder direkt:
|
|
|
\begin{enumerate}
|
|
|
\item
|
|
|
\( P(A\mid B) = \frac 1 5 \)\\
|
|
|
Bedingung \( B = \{ 15, 24, \underline{3}3, 42, 51 \} \)
|
|
|
\item
|
|
|
\( P(C\mid B) = \frac 1 5 \)\\
|
|
|
Bedingung: \( B = \{ 15, 24, \underline{33}, 42, 51 \} \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
|
|
|
\subsection*{Formeln}
|
|
|
|
|
|
\(P(A\mid B) = \frac{P(A\cap B)}{P(B)}\)\\
|
|
|
\(\to\)
|
|
|
\( P(A\cap B) = P(A\mid B) * P(B) = P(B\mid A) * P(A) \) \textcolor{Orange}{gilt immer}\\
|
|
|
\( P(A\cap B) = P(A) * P(B) \) \textcolor{Orange}{nur wenn A und B unabhängig}
|
|
|
|
|
|
Totale Wahrscheinlichkeit: \( P(A) = P(A\mid B) * P(B) + P(A\mid \overline{B}) * P(\overline{B}) \)
|
|
|
|
|
|
Gegenteile: \( P(\overline{A}) = 1 - P(A) ; P(\overline{A}\mid B) = 1-P(A\mid B) \)
|
|
|
|
|
|
Unabhängigkeit von Ereignissen:\\
|
|
|
A und B sind unabhängig, wenn \( P(A\cap B) = P(A) * P(B) \) oder wenn \( P(A\mid B) = P(A) \) oder wenn \( P(B\mid A) = P(B) \)
|
|
|
|
|
|
A, B und C sind unabhängig, wenn \( P(A\cap B\cap C) = P(A) * P(B) * P(C)\) \cunder{Yellow}{und} \( P(A\cap B) = P(A)*P(B) \), \( P(A\cap C) = P(A) * P(C) \), \( P(B\cap C) = P(B)*P(C) \)
|
|
|
|
|
|
\bsp bei 100 Mengen zu prüfen:\\
|
|
|
\( \binom{100}{1} + \binom{100}{3} + … + \binom{100}{99} + \binom{100}{100} = 2^{100} - \binom{100}{1} - \binom{100}{0} \)
|
|
|
|
|
|
\bsp 2 maliges Würfeln
|
|
|
\begin{enumerate}[A:]
|
|
|
\item 1. Wurf ist 3. \( P(A) = \frac 1 6 \)
|
|
|
\item Summe der Augenzahlen ist 12. \( P(B) = \frac{1}{36} \)
|
|
|
\item 2. Wurf ist 7. \( P(C) = 0 \)
|
|
|
\end{enumerate}
|
|
|
\( \underbrace{P(A\cap B\cap C)}_{_0} = \underbrace{P(A) * P(B) * P(C)}_{=0} \)\\[2mm]
|
|
|
\( \underbrace{P(a\cap B)}_{=0} \not= \underbrace{ P(A) }_{\frac 1 6} * \underbrace{P(B)}_{\frac{1}{36}} \)\\
|
|
|
\(\to\) A, B und C sind abhängig
|
|
|
|
|
|
\section{Zufallsvariablen}
|
|
|
|
|
|
\begin{mydef}
|
|
|
Eine Zufallsvariable $X$ ist eine Funktion.\\
|
|
|
\(X: \Omega \to \mathbb R \) (jedem Ergebnis aus \(\Omega\) wird eine reelle Zahl zugeordnet)
|
|
|
\end{mydef}
|
|
|
|
|
|
\bsp 2 maliger Münzwurf\\
|
|
|
Wird 2 mal Wappen geworfen, so gewinnen wir \EUR{2}\\
|
|
|
Wird 2 mal Zahl geworfen, so gewinnen wir \EUR{3}\\
|
|
|
sonst verlieren wir \EUR{2,40}.
|
|
|
|
|
|
\( \Omega = \{ \underbrace{WW}_{3}, \underbrace{ZZ}_{2}, \underbrace{WZ}_{-2,40}, \underbrace{ZW}_{-2,40} \} \) Wahrscheinlichkeit jeweils \( \frac 1 4\)\\
|
|
|
Zufallsvariable $X$: Gewinn (in \EUR{})
|
|
|
|
|
|
\begin{mydef}
|
|
|
Die \underline{Verteilung} (Wahrscheinlichkeitsverteilung) einer Zufallsvariable gibt an, mit welchen Wahrscheinlichkeiten die Zufallsvariable ihre möglichen Werte annimmt.
|
|
|
\end{mydef}
|
|
|
|
|
|
Im \bsp Verteilung von $X$:\\
|
|
|
\( P(X=3) = \frac 1 4 \)\\
|
|
|
\( P(X=2) = \frac 1 4 \)\\
|
|
|
\( P(X=-2,40) = \frac 2 4 = \frac 1 2 \)
|
|
|
|
|
|
Anderes \bsp 2 maliges Würfeln:\\
|
|
|
Wir gewinnen \EUR{2}, wenn zuerst eine 6 gewürfelt wird.\\
|
|
|
Wir gewinnen \EUR{5}, wenn keine 6 gewürfelt wird.\\
|
|
|
Wir verlieren sonst den Betrag $B$.
|
|
|
|
|
|
Zufallsvariable $X$: unser Gewinn\\
|
|
|
gesucht:Verteilung von $X$
|
|
|
|
|
|
Verteilung von $X$:\\
|
|
|
\( P(X=2) = \frac 1 6 \)\\
|
|
|
\( P(X=5) = \frac 5 6 * \frac 5 6 = \frac{25}{36} \)\\
|
|
|
\( P(X=-B) = 1 - \left( \frac 1 6 + \frac{25}{36} \right) = 1 - \frac{31}{36} = \frac{5}{36} \)
|
|
|
|
|
|
Für welches B ist das Spiel Fair? (\(\mu = 0 \))\\
|
|
|
\( B = \frac{ 2 * \frac{1}{6} + 5 * \frac{25}{36} }{\frac{5}{36}} = \) \EUR{27,40}
|
|
|
|
|
|
\( \sigma^2 = 4 * \frac 1 6 + 25 * \frac{25}{36} + 750.76 * \frac{5}{36} = 122.3 \)\\
|
|
|
\( \sigma = \sqrt{\sigma^2} = \sqrt{122.3} = 11.06 \)
|
|
|
|
|
|
\subsection{Diskrete Zufallsvariable}
|
|
|
|
|
|
Diskret: $X$ nimmt nur einzelne Werte mit bestimmten Wahrscheinlichkeiten an.
|
|
|
|
|
|
Im \bsp 2 maliger Münzwurf:\\
|
|
|
Durchschnittsgewinn \( \mu = 2 * \frac 1 4 + 3 * \frac 1 4 - 2,4 * \frac 1 2 = 0,05 \Rightarrow \) Spiel lohnt sich für uns\\
|
|
|
(gewichtet mit Wahrscheinlichkeit – Durchschnittsgewinn pro Spiel)
|
|
|
|
|
|
Allgemein:\\
|
|
|
\begin{mydef}
|
|
|
Der \underline{Erwartungswert} (Mittelwert) einer Zufallsvariable $X$, die Werte $x_i$ mit den Werten $p_i$ annimmt \((i=1,2,3,…)\)\\
|
|
|
\textcolor{Orange}{(\(\to\) endlich viele oder abzählbar viele Werte \(x_i\)) }\\
|
|
|
ist \(\mu = E(X)=\sum\limits_i x_i*p_i \)
|
|
|
\end{mydef}
|
|
|
|
|
|
\underline{Maß für die Streuung (Schwankung)}
|
|
|
|
|
|
\begin{mydef}
|
|
|
Die \underline{Varianz} einer Zufallsvariablen $X$ (wie in der Definition von \(\mu\)) ist \(\sigma^2 = V(X) = Var(X) = \sum\limits_i {\color{Orange} (x_i-\mu)^2 } * p_i \) \textcolor{Orange}{quadratischen Abstände der Werte $x_i$ von $\mu$}\\
|
|
|
\(\to\) mittlerer Quadratischer Abstand
|
|
|
|
|
|
Die \underline{Standardabweichung} \(\sigma\) ist \(\sigma = \sqrt{\sigma^2}\)
|
|
|
\end{mydef}
|
|
|
|
|
|
Weshalb \underline{quadratische} Abstände?\\
|
|
|
z.\,B. kleiner Abstand 2 \(\to\) 2 \textcolor{Orange}{verdoppelt}\\
|
|
|
großer Abstand 10 \(\to\) 100 \textcolor{Orange}{verzehnfacht}
|
|
|
|
|
|
\(\rightarrow\) große Abstände fließen verstärkt ein in die Varianz.\\
|
|
|
Kleine Abstände sind oftmals nur Toleranzen, Messfehler, Ungenauigkeiten.
|
|
|
|
|
|
Anwendung im Finanzbereich:\\
|
|
|
z.\,B. \(\mu = \) mittlere Rendite\\
|
|
|
\spa \(\sigma = \) Maß für Streuung = Maß für das Risiko
|
|
|
|
|
|
\underline{Wenn \( \sigma = 0\)} wäre, dann gibt es nur einen Wert $x = \mu$ mit Wahrscheinlichkeit 1.
|
|
|
|
|
|
Vereinfachung der Formel für \(\sigma^2\):\\
|
|
|
\( \sigma^2 = \sum\limits_i (x_i-\mu)^2 * p_i = \sum\limits_i (x_i^2 - 2*x_i*\mu + \mu^2) *p_i = \sum\limits_i x_i^2*p_i - \sum\limits_i 2*x_i*\mu*p_i + \sum\limits_i \mu^2*p_i\)\\
|
|
|
\( = \sum\limits_i x_i^2 * p_i - 2\mu * \underbrace{\sum\limits_i x_i*p_i}_{=\mu} + \mu^2 * \underbrace{\sum\limits_i p_i}_{=1} \)\\
|
|
|
\( = \sum\limits_i x_i^2 * p_i - 2 \mu^2 + \mu^2 \)\\
|
|
|
\textcolor{Red}{\( \sigma^2 = \sum\limits_i x_i^2 * p_i - \mu^2 \) \underline{einfache Formel} für \(\sigma^2\)}
|
|
|
|
|
|
Im \bsp von oben:
|
|
|
|
|
|
\(\mu = 0,05\)\\
|
|
|
\( \sigma^2 = 4 * \frac 1 4 + 9 * \frac 1 4 + 5,76 * \frac 1 2 - 0,05^2 = 6.1275 \)\\
|
|
|
\( \sigma = \sqrt{6.1275} \approx 2.4754 \) \(\to\) Maß für die Streuung, also für die Mittlere Abweichung von \(\mu\).
|
|
|
|
|
|
Also pro Spiel: im \(\varnothing\): Gewinn von \(\mu = \)\EUR{0,05}.\\
|
|
|
aber wir haben eine Streuung um \(\mu\) von \textcolor{Orange}{\EUR{2,47} noch in Relation zu \(\mu \to\) Spiel mit hohem Risiko}
|
|
|
|
|
|
Man muss \(\sigma\) in Relation zu \(\mu\) sehen.\\
|
|
|
\(\to\) Variationskoeffizient \( \frac{\sigma}{\mu} = \frac{2,47}{0,05} = 49,4 = 4940\% \)
|
|
|
|
|
|
\subsection{Verteilung und Verteilungsfunktion von Zufallsvariablen}
|
|
|
|
|
|
Im \bsp 2 maliges Würfeln von vorhin:\\
|
|
|
\underline{Verteilung von $X$}: \( P(X=2) = \frac 1 6, P(X=5) = \frac{25}{36}, P(X=-27.4) = \frac{5}{36} \)
|
|
|
|
|
|
\begin{mydef}
|
|
|
Die Verteilungsfunktion einer Zufallsvariable $X$.\\
|
|
|
\(\to\) Funktion \(F: \mathbb R \to [0,1] \) mit \(F(x) = P(X\le x) \) \textcolor{Orange}{bei der Verteilung \(P(X=x)\)}
|
|
|
\end{mydef}
|
|
|
|
|
|
\( F(-27.4) = P(X\le -27.4) = \frac{5}{36} \)\\
|
|
|
\( F(2) = P(X\le 2) = P(X=-27.4) + P(X=2) = \frac{5}{36}+\frac{1}{6} = \frac{11}{36} \)\\
|
|
|
|
|
|
Bei einer diskreten Verteilung ist die Verteilungsfunktion eine Treppenfunktion, die von 0 nach 1 Wächst und an den Stellen $x_i$ treten Sprünge auf, mit Sprunghöhe $p_i$
|
|
|
|
|
|
Allgemein (nicht nur für diskrete Verteilungen) hat eine \underline{Verteilungsfunktion} \(F(x)\) die \underline{Eigenschaften}:
|
|
|
\begin{itemize}
|
|
|
\item
|
|
|
\( \lim\limits_{x\to -\infty} F(x) = 0 \) und \( \lim\limits_{x\to \infty} F(x) = 1 \)
|
|
|
\item
|
|
|
\( F(x) \) ist monoton wachsend \textcolor{Orange}{nicht unbedingt \underline{streng} wachsend}
|
|
|
\item
|
|
|
\(F(x)\) ist rechtsseitig stetig \textcolor{Orange}{\(\to\) aus der Definition: \(F(x) = P(X{\color{Red}\le}c) \) }
|
|
|
\end{itemize}
|
|
|
|
|
|
\bsp $X$: Anzahl an Wappen bei 2maligem Münzwurf. Skizziere die Verteilungsfunktion \(F(x)\)
|
|
|
|
|
|
\( F(x) = \begin{cases} 0, & x<0 \\ \frac 1 4, & 0\le x < 1 \\ \frac 3 4, & 1 \le x < 2 \\ 1, & 2\le x \end{cases} \)
|
|
|
|
|
|
\bsp \( F(x) = \begin{cases} a, & x < 0 \\ b*x+0.75, & 0 \le x < 1 \\ c, & x \ge 1 \end{cases} \)
|
|
|
|
|
|
Für welche \(a,b,c \in \mathbb R\) ist \(F(x)\) eine Verteilungsfunktion?
|
|
|
|
|
|
\(a = 0, 0\le x \le 2.25, c=1 \)
|
|
|
|
|
|
\bsp (zu Verteilungsfunktion)\\
|
|
|
\( F(x) = \begin{cases} e^x * \frac 1 2, & x < 0 \\ b, & 0 \le x < 2 \\ c, & x\ge 2 \end{cases} \)
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item
|
|
|
Wie groß müssen $b$ und $c$ sein, damit $F(x)$ eine Verteilungsfunktion ist?
|
|
|
\item
|
|
|
Sei \( b=0.8, c=1 \).\\
|
|
|
Berechne:\\
|
|
|
\(P(X=0), P(X=-1), P(X\le -1), P(X>-1), P(X\le 2), P(X>2), P(X\ge3) \)
|
|
|
\end{enumerate}
|
|
|
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item
|
|
|
\( e^0 * \frac 1 2 = 0.5 \)\\
|
|
|
\( \frac 1 2 \le b \le c = 1 \)\\
|
|
|
Eigenschaften der Verteilungsfunktion:
|
|
|
\begin{itemize}
|
|
|
\item \( \lim\limits_{x\to-\infty} \underbrace{F(x)}_{e^x*\frac 1 2} = 0 \), \( \lim\limits_{x\to-\infty} \underbrace{F(x)}_c = 1 \Rightarrow c=1 \)
|
|
|
\item \(F(x)\) rechtsseitig stetig
|
|
|
\item \(F(x)\) monoton wachsend
|
|
|
\end{itemize}
|
|
|
\item
|
|
|
\(P(X=0) = 0.3 (=0.8-0.5) \)\\
|
|
|
\(P(X=-1) = 0\) (Kein Sprung)\\
|
|
|
\(P(X\le-1) = F(-1) = \frac{e^{-1}}{2} \approx 0.18394 \)\\
|
|
|
\(P(X>-1) = 1-F(-1) = 1- \frac{e^{-1}}{2} \approx 0.81606 \)\\
|
|
|
\(P(X\le 2) = F(2) = 1\)\\
|
|
|
\(P(X>2) = 1-P(X\le 2) = 0 \)\\
|
|
|
\(P(X<2) = P(X\le 2) - P(X=2) = F(2) - 0.2 = 0.8\)\\
|
|
|
\(P(X\ge 3) = 1-P(X<3) = 0\)
|
|
|
\end{enumerate}
|
|
|
|
|
|
Meist ist die Verteilungsfunktion
|
|
|
\begin{itemize}
|
|
|
\item eine Treppenfunktion \(\to\) bei diskreten Verteilungen
|
|
|
\item eine durchgehend stetige Funktion \(\to\) keine Sprünge
|
|
|
\end{itemize}
|
|
|
|
|
|
\bsp\\
|
|
|
\( F(x) = \begin{cases}0, & x<1 \\ 0.2, & 1\le x<2 \\ \frac 1 8 *x^2, & x\le x<2.5 \\ 1, & x\ge 2.5 \end{cases}\)\\
|
|
|
Berechne:\\
|
|
|
\( P(X=-10) = 0\) (Kein Sprung)\\
|
|
|
\( P(X=2) = 0.3\) (Sprunghöhe bei \(x=2\))\\
|
|
|
\( P(X\le 2) = F(2) = \frac 1 8 * 2^2 = 0.5\)\\
|
|
|
\( P(X\ge 2) = 1 - P(X<2) = 1 - 0.2 = 0.8 \)\\
|
|
|
\( P(X\ge 2.2) = 1 - P(X<2.2) = 1 - P(X\le 2.2) = 1 - \frac{121}{200} = \frac{79}{200} \approx 0.395 \) (Kein Sprung!)
|
|
|
|
|
|
\( P(x\le X < 2) = P(X<2) - P(X<1) = 0.2 - 0 = 0.2 \)\\
|
|
|
\( P(2< X < 2.2) = P(X< 2.2) - P(X\le 2) = \frac{121}{200} - 0.5 = \frac{21}{200} \approx 0.105 \)
|
|
|
|
|
|
\subsection{Stetige Verteilung}
|
|
|
|
|
|
\(\to\) stetige Funktion \(F(x)\)\\
|
|
|
\(\to\) \(P(X=x) = 0\) \(\forall x \in \mathbb R\) (\(\to\) keine Sprünge)
|
|
|
|
|
|
\bsp Zufallszahlen (reelle Zahlen) im Intervall \( [100,500] \), und zwar gleich verteilt.\\
|
|
|
\( P(240\le X \le 260) = \frac{260-240}{500-100} = \frac{20}{400} = \frac{1}{20} = 0.05 \)
|
|
|
|
|
|
Stetige Verteilungsfunktionen besitzen eine \underline{Dichtefunktion} \(f(x)\) mit \( f(x) = F'(x) \).\\
|
|
|
\textcolor{Orange}{bis auf einzelne Stellen, an denen man nicht ableiten kann}\\
|
|
|
bzw. \(F(x) = \int\limits_{-\infty}^x f(t) dt \) \textcolor{Orange}{(\(=P(X\le x)\))}
|
|
|
|
|
|
\textcolor{Orange}{\(\to\) Bedeutung:} Die Dichtefunktion bei stetigen Verteilungen ist der Ersatz für die Einzelwahrscheinlichkeiten bei diskreten Verteilungen.
|
|
|
|
|
|
Im \bsp Fläche \( \underbrace{\frac{1}{400}}_{\text{Höhe}} * \underbrace{400}_{\text{Breite}} = 1 = \) Gesamtwahrscheinlichkeit
|
|
|
|
|
|
\textbf{Eigenschaften einer Dichtefunktion \(f(x)\):}
|
|
|
|
|
|
\(f: \mathbb R \to \left[0,\infty\right) \), \textcolor{Orange}{d.\,h. \( f(x) \ge 0 \quad \forall x \in \mathbb R \)}\\
|
|
|
und \( \int\limits_{-\infty}^{\infty} f(x) dx = 1 \) \textcolor{Orange}{\(\leftarrow\) Gesamtwahrscheinlichkeit}
|
|
|
|
|
|
\bsp\\
|
|
|
\( f(x) = \begin{cases} 0, & x < 0 \\ \frac 1 2 x, & 0 \le x < 1 \\ a * x^2, & 1 \le x < x \\ 0, & x \ge 2 \end{cases} \)
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item
|
|
|
Für welches \( a \in \mathbb R \) ist \(f(x)\) eine Dichtefunktion?
|
|
|
\item Berechne für das $a$ aus (a) die zugehörige Verteilungsfunktion \(F(x)\)
|
|
|
\end{enumerate}
|
|
|
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item
|
|
|
\( \int\limits_{-\infty}^{\infty} f(x) dx = 1 \to \) auflösen nach a\\
|
|
|
\( \int\limits_{-\infty}^{\infty} f(x) dx = \int\limits_0^1 \frac 1 2 x dx + \int\limits_1^2 a * x^2 dx \)\\
|
|
|
\( = \left[ \frac 1 4 x^2 \right]_0^1 + \left[ \frac a 3 * x^3 \right]_1^2 \)\\
|
|
|
\( = \frac14 - 0 + \frac83 - \frac13 a = \frac14+\frac73a=1 \)\\
|
|
|
\( \frac73a=\frac34 \Rightarrow a = \frac{9}{28} \)\\
|
|
|
\( f(x) = \begin{cases} 0, & x<0\\\frac12*x,&0\le x<1\\\frac{9}{28} * x^2, & 1 \le x < x \\ 0, & x \ge 2 \end{cases} \)
|
|
|
\item
|
|
|
\( F'(x) = f(x) \Rightarrow F(x) = \int f(x) dx \)\\
|
|
|
\( F(x) = \begin{cases} c_1,&x<0\\\frac14 x^2+c_2,&0\le x<1\\\frac{3}{28} x^3+c_3, & 1 \le x < x \\ c_4, & x \ge 2 \end{cases} \)\\
|
|
|
Bestimmung der Konstanten:\\
|
|
|
\( c_1 = 0 \), \textcolor{Orange}{da \(\lim\limits_{x\to-\infty}F(x)=0\)}\\
|
|
|
\( c_4 = 0 \), \textcolor{Orange}{da \(\lim\limits_{x\to\infty}F(x)=1\)}\\
|
|
|
\cunder{Orange}{Stetigkeit} an den Nahtstellen \(0,1,2\)\\
|
|
|
\(x=0: c_1 = \frac14*0^2 + c_2 \Rightarrow c_2 = 0 \)\\
|
|
|
\(x=1: \frac12*1^2 + c_2 = \frac{3}{28}*1^2+c_3 \Rightarrow c_3 = \frac14 -\frac{3}{28} = \frac{4}{28} = \frac17 \)\\
|
|
|
Zur Kontrolle:\\
|
|
|
\( x2: \frac{3}{28}*2^3+\frac17 = 1 = c_4 \Rightarrow\) stimmt
|
|
|
\end{enumerate}
|
|
|
|
|
|
\bsp \( f(x) = \begin{cases} c_1*e^{-2x}, & x\ge 0 \\ c_2, & x<0 \end{cases} \)\\
|
|
|
Bestimme \( c_1,c_2 \in \mathbb R\) so, dass \(f(x)\) eine Dichtefunktion ist.\\
|
|
|
Berechne dann \(F(x)\).
|
|
|
|
|
|
\( x=0: c_2=0 \)\\
|
|
|
Damit die Fläche für \(x<0\) nicht \(\infty\) groß ist, muss \(c_2=0\) sein.\\
|
|
|
\( 1 = \int\limits_{-\infty}^\infty f(x) dx = \int\limits_{-\infty}^0 c_2 dx + \int\limits_{0}^\infty c_1*e^{-2x} dx = \int\limits_{0}^\infty c_1*e^{-2x} dx = \left[ -\frac12 * c_1 * e^{-2x}\right]_0^\infty\)\\
|
|
|
\( = -\frac12*c_1*e^{-\infty} - (-\frac12*c_1*e^0) = \frac12 * c_1 \Rightarrow c_1 = 2 \)\\
|
|
|
\( f(x) = \begin{cases} 2*e^{-2x}, & x\ge 0\\0,&x<0\end{cases} \)\\
|
|
|
\( F(x) = \begin{cases} -e^{-2x} + d_1, & x\ge 0\\d_2,&x<0\end{cases} \)\\
|
|
|
Berechnung von \(d_1,d_2\):\\
|
|
|
\(d_2 = 0\), da \( \lim\limits_{x\to-\infty} F(x) = 0\) Stetigkeit an der Nahtstelle \(x=0\).\\
|
|
|
\(-e^{-2*0} + d_1 = d_2 \Rightarrow -1 + d_1 = 0 \Rightarrow d_1 = 1 \)
|
|
|
|
|
|
\( F(x) = \begin{cases} -e^{-2x} + 1,& x\ge 0 \\ 0,&x<0 \end{cases} \)
|
|
|
|
|
|
Berechne \( P(X\le-1), P(X>0.5), P(1<X\le2), P(X=0.5), P(Xy0.5) \)
|
|
|
|
|
|
\( P(X\le-1) = F(-1) = 0\)\\
|
|
|
\( P(X>0.5) = 1-P(X\le 0.5) = 1-F(0.5) = e^{-1} \approx 0.36788\)\\
|
|
|
\( P(1<X\le2) = P(X\le2) - P(x\le1) = F(2) - F(1) = e^{-2}-e^{-4} \approx 0.11702\)\\
|
|
|
\( P(X=0.5) = 0\)\\
|
|
|
\( P(X<0.5) = 1-P(X\le0.5) = 1-F(0.5) = 1-e^{-1} \approx 0.63212)\)
|
|
|
|
|
|
Allgemein: Berechnung von Wahrscheinlichkeiten bei \cunder{Orange}{stetigen} Verteilungen:\\
|
|
|
\( P(X=a) = 0\)\\
|
|
|
\(P(X\le a) = P(X<a) = F(a)\)\\
|
|
|
\(P(X\ge a) = P(X>a) = 1-F(a), P(a\le x\le b) = P(a<x<b) = F(b)-F(a) \)
|
|
|
|
|
|
Oder mit Hilfe der Dichtefunktion \(f(x)\):\\
|
|
|
\( P(X\le a) = \int\limits_{-\infty}^a f(x) dx \)\\
|
|
|
\( P(a \le a \le b) = \int\limits_a^b f(x) dx \)
|
|
|
|
|
|
\subsection{Wichtige Beispiele für Verteilungen}
|
|
|
|
|
|
\subsubsection{Diskrete Verteilung}
|
|
|
|
|
|
\begin{itemize}
|
|
|
\item \underline{Gleichverteilung}\\
|
|
|
Die Zufallsvariable $X$ nimmt Werte \( x_1,x_2,…,x_n \) mit gleicher Wahrscheinlichkeit \(\frac1n\) an.\\
|
|
|
\(\to P(X=x_1) = P(X=x_2) = … = P(X=x_n) = \frac1n\) \\
|
|
|
\item \underline{Binomialverteilung}
|
|
|
Ein Zufallsexperiment wird $n$-mal unabhängig voneinander wiederholt.\\
|
|
|
\textcolor{Orange}{\bsp 100 maliges würfeln (\(n=100\))}\\
|
|
|
A: Ereignis bei 1-maliger Durchführung des Experiments\\
|
|
|
\textcolor{Orange}{Im \bsp A: es wird 5 gewürfelt}\\
|
|
|
\(\to\) Zufallsvariable X: Anzahl, wie oft A eintritt bei der $n$-maligen Wiederholung des Experiments.\\
|
|
|
\textcolor{Orange}{im \bsp X: Anzahl der 5en beim 100-maligen Würfeln}\\
|
|
|
\(\to\) $X$ ist binomialverteilt mit Parametern $n$ und \(p=P(A)\), d.\,h. \(P(X=k)= \binom{n}{k} * p^k * (1-p)^{n-k} \) für \( k=0..n \)\\
|
|
|
\textcolor{Orange}{
|
|
|
\( P(X=0) = P(\text{keine }5) = \frac{5^{100}}{6^{100}} \) \\
|
|
|
\( P( X=1) = P(\text{eine }5) = \frac{100 * 5^{99}}{6^{100}} \) \\
|
|
|
\( P(X=10) = P(10 \text{ 5en}) = \frac{\binom{100}{10} * 5^{90}}{6^{100}} \) }
|
|
|
\end{itemize}
|
|
|
|
|
|
\bsp Datenübertragung von 5000 Bits.\\
|
|
|
Wahrscheinlichkeit, dass ein Bit Fehlerhaft übertragen wird, ist 1\%.\\
|
|
|
Mit welcher Wahrscheinlichkeit werden
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item genau 20 Bits fehlerhaft übertragen?\\
|
|
|
\textcolor{Orange}{ \( \binom{5000}{20} * 0.01^{20} * 0.99^{4980} \) }
|
|
|
\item mehr als 2 Bits fehlerhaft übertragen?\\
|
|
|
\textcolor{Orange}{ \( P(X>2) \underset{\text{Gegenteil}}{=} 1-P(X\le 2) = 1-\left(P(X=2) + P(X=1) + P(X=0)\right) \)\\
|
|
|
\( = 1-\left( \binom{5000}{2}*0.01^2*0.99^{4998}+\binom{5000}{1}*0.01*0.99^{4999}+\binom{5000}{0}*0.01^0*0.99^{5000} \right)\) }
|
|
|
\end{enumerate}
|
|
|
|
|
|
\subsubsection{Geometrische Verteilung}
|
|
|
|
|
|
\bsp Wir schießen so lange, bis wir den anderen Treffen.\\
|
|
|
Wahrscheinlichkeit, bei einem Schuss zu treffen, ist 30\%.\\
|
|
|
\(X\) Anzahl der Schüsse bis zum Treffer\\
|
|
|
\(\to\) mögliche Werte von $X: 1,2,3,…$
|
|
|
|
|
|
\( P(X=k) = 0.7^{k-1} * 0.3 \)
|
|
|
|
|
|
Allgemein: Ein Zufallsexperiment wird beliebig oft (unabhängig voneinander) wiederholt.\\
|
|
|
Die Wahrscheinlichkeit, dass ein Ereignis $A$ bei einmaliger Durchführung auftritt, ist $p$.
|
|
|
$X:$ Anzahl der Wiederholungen, bis zum ersten mal $A$ eintritt.\\
|
|
|
$\to X$ ist geometrisch verteilt mit Parameter $p$, d.\,h.\\
|
|
|
\( P(X=k) = (1-p)^{k-1} * p \) für \( k=1,2,3,…\)
|
|
|
|
|
|
\bsp Mit welcher Wahrscheinlichkeit
|
|
|
\begin{enumerate}[(a)]
|
|
|
\item tritt beim zweiten oder dritten Wurf beim Würfeln die \cunder{Orange}{erste} 2 auf?\\
|
|
|
\textcolor{Orange}{\( P(X=2)+P(X=3) = \left(\frac56\right)^2*\frac16 + \left(\frac56\right)^3*\frac16 \)}
|
|
|
\item tritt beim zehnten Wurf die \cunder{Orange}{zweite} 2 auf?\\
|
|
|
\textcolor{Orange}{\( 9*\frac16*(\frac56)^8*\frac16 \)}
|
|
|
\item Mit welcher Wahrscheinlichkeit treten bei zehn Würfen zwei zweier auf?\\
|
|
|
\textcolor{Orange}{\( \binom{10}{2} * \left(\frac16\right)^2 * \left(\frac56\right)^8 \)}
|
|
|
\item Mit welcher Wahrscheinlichkeit tritt beim 100. Wurf die fünfte zwei auf?\\
|
|
|
\textcolor{Orange}{\( \binom{100}{4}*\left(\frac16\right)^4*\left(\frac56\right)^{95}\)}
|
|
|
\end{enumerate}
|
|
|
|
|
|
\bsp Russisches Roulette, 6er Trommel, mit einer Patrone. Wir spielen allein.\\
|
|
|
$X:$ Anzahl der Versuche, bis wir tot sind.
|
|
|
\begin{align*}
|
|
|
P(X=1) &= \frac16 &= \frac16\\
|
|
|
P(X=2) &= \frac56*\frac15 &= \frac16\\
|
|
|
P(X=3) &= \frac56*\frac45*\frac14&=\frac16\\
|
|
|
P(X=4) &= \frac56*\frac45*\frac34*\frac13&=\frac16\\
|
|
|
P(X=5) &= \frac56*\frac45*\frac34*\frac23*\frac12&=\frac16\\
|
|
|
P(X=6) &= \frac56*\frac45*\frac34*\frac23*\frac12*\frac11&=\frac16\\
|
|
|
\end{align*}
|
|
|
\textcolor{Orange}{Keine geometrische Verteilung, da keine \underline{Unabhängigkeit} der Versuche}
|
|
|
|
|
|
Gleiches Beispiel, aber nach jedem Versuch wird die Trommel zufällig gedreht \(\to\) geometrische Verteilung.
|
|
|
\begin{align*}
|
|
|
P(X=1) &= \frac16\\
|
|
|
P(X=2) &= \frac56*\frac16\\
|
|
|
P(X=3) &= \left(\frac56\right)^2 * \frac16
|
|
|
\end{align*}
|
|
|
|
|
|
Berechnung von \(\mu\) und \(\sigma^2\):
|
|
|
|
|
|
Bei der \underline{geometrischen Verteilung}:\\
|
|
|
$ P(X=k) = \left(1-p\right)^{k-1} * p $, $k=1,2,3…$\\
|
|
|
\begin{align*}
|
|
|
\mu &= \sum\limits_{k=1}^\infty k*(1-p)^{k-1} * p\\
|
|
|
&= p * \sum\limits_{k=1}^\infty l*(1-p)^{k-1} \\
|
|
|
&= p*\frac{1}{p^2}\\
|
|
|
&= \frac1p\\
|
|
|
\sigma^2 &= \sum\limits_{k=1}^\infty k^2 * \left(1-p\right)^{k-1} * p - \left(\frac1p\right)^2\\
|
|
|
&= ?
|
|
|
\end{align*}
|
|
|
\textcolor{Orange}{geometrische Reihe:
|
|
|
\begin{align*}
|
|
|
\sum\limits_{k=0}^\infty x^k &= \frac{1}{1-x} &\text{für }\left|x\right| < 1\\
|
|
|
\sum\limits_{k=1}^\infty k*x^{k-1} &= \frac{1}{(1-x)^2}
|
|
|
\end{align*}}
|
|
|
|
|
|
Bei der \underline{Binomialverteilung}:
|
|
|
|
|
|
\begin{align*}
|
|
|
P(X=k) &= \binom{n}{k}*p^k*(1-p)^{n-k}\\
|
|
|
\mu &= \sum\limits_{k=0}^n k * \binom{n}{k} * p^k * \left(1-p\right)^{n-k}\\
|
|
|
&= … = n*p\\
|
|
|
\sigma^2 &= … = n*p*(1-p)
|
|
|
\end{align*}
|
|
|
|
|
|
\underline{Skizze} der Verteilungen:
|
|
|
|
|
|
\underline{geometrische} Verteilung:
|
|
|
|
|
|
% TODO
|
|
|
|
|
|
\underline{Binomialverteilt}
|
|
|
|
|
|
% TODO
|
|
|
|
|
|
für $p=0.5$ ist die Verteilung Symmetrisch
|
|
|
|
|
|
\underline{stetige Verteilung}
|
|
|
|
|
|
\begin{itemize}
|
|
|
\item
|
|
|
stetige Gleichverteilung auf einem Intervall \([a,b]\)\\
|
|
|
\\% TODO
|
|
|
\begin{align*}
|
|
|
f(x) &= \begin{cases} \frac{1}{b-a}, & a\le x\le b\\ 0, &\text{sonst} \end{cases}\\
|
|
|
F(x) &= \begin{cases}
|
|
|
c_1 \textcolor{Orange}{=0}, & x\le a \\
|
|
|
\frac{1}{b-a} * x + c_2, & a \le x \le b \\
|
|
|
c_3\textcolor{Orange}{=1} , & x \ge b
|
|
|
\end{cases}
|
|
|
\end{align*}
|
|
|
$F(x)$ muss an der Stelle $a$ stetig sein:\\
|
|
|
\( 0 = \frac{1}{b-a}*a + c_2 \Rightarrow c_2 = -\frac{a}{b-a} \)
|
|
|
\item Exponentialverteilung\\
|
|
|
Dichtefunktion \( f(x) = \begin{cases} 0, & x<0 \\ c*e^{-\lambda*x}, & 0 \le x \end{cases} \)\\
|
|
|
Bestimmen von $c$, so dass die Dichtefunktion passt:
|
|
|
\begin{align*}
|
|
|
\int\limits_{-\infty}^{\infty} f(x) dx &= \underbrace{\int\limits_{-\infty}^{0} 0 dx}_{=0} + \int\limits_{0}^{\infty} f(x) dx\\
|
|
|
&= \left[-\frac c\lambda * e^{-\lambda*x}\right]_0^\infty = 1\\
|
|
|
\underbrace{(-\frac{c}{\lambda}*e^{-\lambda*\infty})}_{=0} - ((-\frac{c}{\lambda}*e^{-\lambda*o})) &= 1\\
|
|
|
\frac{c}{\lambda} &=1 &| *\lambda\\
|
|
|
c &= \lambda\\
|
|
|
\Rightarrow f(x) &= \begin{cases} 0, & x < 0\\ \lambda*e^{-\lambda*x}, & 0\le x \end{cases}\\
|
|
|
F(x) &= \begin{cases} 0, &x<0 \\ -e^{-\lambda*x} + c_2, & 0 \le x \end{cases}\\
|
|
|
\Rightarrow F(x) &= \begin{cases} 0, &x<0 \\ -e^{-\lambda*x} + 1, & 0 \le x \end{cases}
|
|
|
\end{align*}
|
|
|
\end{itemize}
|
|
|
|
|
|
Anwendung: auf Wartezeiten-/Warteschlangenproblem\\
|
|
|
\(\to\) kurze Wartezeit mit hoher Wahrscheinlichkeit\\
|
|
|
\(\to\) größeres \(\lambda\): kürzere Wartezeiten mit höherer Wahrscheinlichkeit.
|
|
|
|
|
|
\underline{(Gaußsche Normalverteilung)}
|
|
|
|
|
|
Anwendung: wenn es einen Sollwert gibt und durch Zufallseffekte (Toleranzen, Messungenauigkeit, natürliche Abweichungen, …) Abweichungen nach oben und unten auftreten.
|
|
|
|
|
|
\begin{mydef}
|
|
|
Die Dichtefunktion der Normalverteilung mit Parametern \(\mu\) und \(\sigma\) (\(N(\mu,\sigma)\)-Verteilung) ist
|
|
|
\begin{align*}
|
|
|
f(x) &= \frac{1}{\sqrt{2\pi} * \sigma} * e^{-\frac12 * \left(\frac{x-\mu}{\sigma} \right)^2 }
|
|
|
\end{align*}
|
|
|
\end{mydef}
|
|
|
|
|
|
\( \Rightarrow f(x) = \frac{1}{\sqrt{2\pi}*\sigma} * \underbrace{e ^{-\frac12 * 0^2}}_{=0} = \frac{1}{\sqrt{2\pi}*\sigma} \)
|
|
|
|
|
|
Veränderung von \(\mu \to\) Verschiebung in $x$ Richtung\\
|
|
|
Veränderung von \(\sigma \to\) Stauchung/Dehnung in der Breite/Höhe
|
|
|
|
|
|
speziell: Standardnormalverteilung: \(N(0,1): f(x) = \frac{1}{\sqrt{2\pi}} * e^{-\frac12 x^2} \)\\
|
|
|
Problem: Verteilungsfunktion \(F(x)\) lässt sich nicht angeben/berechnen \(\to\) nur Tabellenwerte für die Standartnormalverteilung
|
|
|
|
|
|
\subsubsection{Erwartungswert und Varianz stetiger Verteilung}
|
|
|
|
|
|
\underline{diskret}:\\
|
|
|
\begin{align*}
|
|
|
\mu &= \sum\limits_i x_i*p_i\\
|
|
|
\sigma^2 &= \sum\limits_i x_i^2 * p_i - \mu^2
|
|
|
\end{align*}
|
|
|
\underline{stetig}:\\
|
|
|
\begin{align*}
|
|
|
\mu &= \int\limits_{-\infty}^{\infty} x*f(x) dx\\
|
|
|
\sigma^2 &= \int\limits_{-\infty}^{\infty} x^2 * f(x) dx - \mu^2
|
|
|
\end{align*}
|
|
|
|
|
|
\bsp \(f(x) = \begin{cases} 0, & x<0 \\ x, &0\le x <1 \\ a * x^2, & 1\le x\le 2 \\ 0, & x>2 \end{cases} \)\\
|
|
|
Bestimme $a$ so, dass $f(x)$ eine Dichtefunktion ist und bestimme dann \(\mu\).
|
|
|
|
|
|
\begin{align*}
|
|
|
\text{Bestimmung von }a:\\
|
|
|
1 &= \int\limits_{-\infty}^\infty f(x) dx\\
|
|
|
&= \int\limits_0^1 x dx + \int\limits_1^2 a*x^2 dx\\
|
|
|
&= \left[ \frac12 x^2 \right]_0^1 + \left[ a * \frac13 x^3 \right]_1^2\\
|
|
|
&= \frac12*1^2 - \frac12 *0^2+a*\frac13*8-a*\frac13*1\\
|
|
|
&= \frac12 + \frac73a = 1\\
|
|
|
\Rightarrow \frac73a &= \frac12\\
|
|
|
\Rightarrow a &= \frac{3}{14}\\[1cm]
|
|
|
%
|
|
|
\Rightarrow f(x) &= \begin{cases}
|
|
|
0,&x<0\\
|
|
|
x,&0\le x<1\\
|
|
|
\frac{3}{14}x^2,&1\le x<2\\
|
|
|
0,&x>2
|
|
|
\end{cases}\\
|
|
|
\mu &= \int\limits_{-\infty}^{\infty} x*f(x) dx\\
|
|
|
&= \int\limits_0^1 x*x dx + \int\limits_1^2 x * \frac{3}{14} x^2 dx\\
|
|
|
&= \left[ \frac13*x^3 \right]_0^1 + \left[ \frac{3}{56} x^4 \right]_1^2\\
|
|
|
&= \frac13 * 1 - \frac13 * 0 + \frac{3}{56} * 2^4 - \frac{3}{56} * 1\\
|
|
|
&= \frac13 -0 + \frac{48}{56}-\frac{3}{56} = \frac{191}{168}\\[5mm]
|
|
|
\sigma^2 &= \int\limits_{-\infty}^\infty x^2 * f(x) dx - \mu^2\\
|
|
|
&= \int\limits_0^1 x^2 * x dx + \int\limits_1^2 x^2 * \frac{3}{14} * x^2 dx - \left(\frac{191}{168}\right)^2\\
|
|
|
\end{align*}
|
|
|
|
|
|
\bsp Exponentialverteilung: \( f(x) = \begin{cases} \lambda*e^{-\lambda*x}, & x \ge 0 \\ 0, & x<0 \end{cases} \)
|
|
|
|
|
|
\begin{align*}
|
|
|
\mu &= \int\limits_{-\infty}^\infty x * f(x) dx = \int\limits_0^\infty x*\lambda*e^{-\lambda * x} dx\\
|
|
|
&= \lambda * \int\limits_0^\infty \underbrace{x}_{u} * \underbrace{e^{-\lambda*x}}_{v'} dx\\
|
|
|
&= \lambda * \left( \left[ -\frac{x}{\lambda} * e^{-\lambda*x} \right]_0^\infty - \int\limits_0^\infty -\frac1\lambda*e^{-\lambda*x}\, dx \right)\\
|
|
|
&= \lambda * \left( 0 - \left[ \frac{e^{-\lambda*x}}{\lambda^2} \right]_0^\infty\right)\\
|
|
|
&= \lambda * \left( - \left( \frac{e^{-\infty}}{\lambda^2} - \frac{e^0}{\lambda^2} \right) \right)\\
|
|
|
&= \lambda * \frac{1}{\lambda^2}\\
|
|
|
&= \frac1\lambda
|
|
|
\end{align*}
|
|
|
|
|
|
\bsp Gleichverteilung: \( f(x) = \begin{cases} \frac{1}{b-a} , & a\le x\le b \\ 0, & \text{sonst} \end{cases} \)
|
|
|
|
|
|
\begin{align*}
|
|
|
\mu &= \int\limits_{-\infty}^\infty x * f(x) \, dx = \int\limits_a^b x * \frac{1}{b-a} \, dx \\
|
|
|
&= \left[ \frac{x^2}{2} * \frac{1}{b-a} \right]_a^b\\
|
|
|
&= \frac{b^2}{2(b-a)} - \frac{a^2}{2(b-a)}\\
|
|
|
&= \frac{b^2-a^2}{2(b-a)}\\
|
|
|
&= \frac{(b-a)*(b+a)}{2 * (b-a)}\\
|
|
|
&= \frac{a+b}{2}
|
|
|
\end{align*}
|
|
|
|
|
|
\section{Normalverteilung}
|
|
|
|
|
|
\begin{mydef}
|
|
|
$X$ ist $N(\mu,\sigma)$ verteilt, wenn $X$ die Dichtefunktion \(f(x) = \frac{1}{\sqrt{2\pi}*\sigma} * e^{-\frac12 * \left(\frac{x-\mu}{\sigma}\right)^2}\) besitzt.\\
|
|
|
Es gilt: \(E(X)=\mu, Var(X) = \sigma^2\)\\
|
|
|
\(\rightarrow X\) heißt \underline{standardnormalverteilt}, wenn \(\mu=0,\sigma=1 \rightarrow f(x) = \frac{1}{\sqrt{2\pi}} * e^{-\frac12 x^2}\)\\
|
|
|
Zugehörige Verteilungsfunktion \(F(x) = \phi(x) = \phi_{0,1}(x) \rightarrow\) hierfür: \underline{Tabellenwerte}
|
|
|
\end{mydef}
|
|
|
|
|
|
\includegraphics{bilder/1-6_dichtefunktion.pdf}
|
|
|
|
|
|
Aus der Tabelle:\\
|
|
|
\bsp \(\phi(1.27) = 0.89796 \)\\
|
|
|
\( \phi(0) = \phi(0.00) = 0.5 \)\\
|
|
|
\( \phi(-1.27) = 1- \phi(1.27) = 1-0.89796 \)
|
|
|
|
|
|
Berechnung von \(\phi(-x)\):\\
|
|
|
\( \phi(-x) = 1 -\phi(x) \)
|
|
|
|
|
|
Wenn $X$ $N(0,1)$ verteilt ist, dann ist \( P(X\le b) = \phi(b), P(x\ge a) = 1-\phi(a), P(a\le x\le b) = \phi(b)-\phi(a), P(X=a)=0\)
|
|
|
|
|
|
Wenn $X$ $N(\mu,0)$ verteilt ist, dann ist…\\
|
|
|
\includegraphics{bilder/1-6_dichtefunktion_2.pdf}\\
|
|
|
… \( \frac{X-\mu}{\rho} \) \( N(0,1)\) verteilt. Standardverteilung \(\to\) Tabelle Anwendbar.
|
|
|
|
|
|
\bsp Bauteile aus der Produktion $\to$ \underline{Länge des Bauteils} ist Normalverteilt. Mit \( \mu = 10cm\) (Normalverteilt), \( \sigma = 0.2cm \) (Streuung $\to$ Maß für die mittlere Abweichung von $\mu$)\\
|
|
|
$\to 10cm\pm 0.2cm$
|
|
|
|
|
|
Ausschuss liegt vor, wenn die Länge unter $9.5cm$ liegt.\\
|
|
|
Gesucht: Auschussanteil\\
|
|
|
\begin{align*}
|
|
|
\to P(X\le 9.5) &= P(\frac{x-\mu}{\sigma} \le \frac{0.9-\mu}{\sigma})\\
|
|
|
&= P(\underbrace{\frac{x-\mu}{\sigma}}_{\text{ist }N(0,1)\text{ verteilt}} \le \frac{9.5-10}{0.2})\\
|
|
|
&= P(\frac{x-\mu}{\sigma} \le -2.5) = \phi(-2.5)\\
|
|
|
&= 1-\phi(2.5) = 1-0.99379\\
|
|
|
&= 0.00621
|
|
|
\end{align*}
|
|
|
|
|
|
Wie viel \% der Bauteile nimmt uns ein Kunde ab, wenn er eine Länge zwischen $9.7$ und $10.25$ benötigt?
|
|
|
\begin{align*}
|
|
|
P(9.7\le X<10.25) &= P\left( \frac{9.7-\mu}{\sigma} \le \frac{x-\mu}{\sigma} < \frac{10.25-\mu}{\sigma}\right)\\
|
|
|
&= P\left(\frac{-0.3}{0.2}\le \frac{x-\mu}{\sigma}<\frac{0.25}{0.2}\right)\\
|
|
|
&= \phi(\frac{0.25}{0.2}) - \phi(\frac{-0.3}{0.2})\\
|
|
|
&= \phi(1.25) - \phi(-1.5) = \phi(1.25) - (1-\phi(1.5)) \\
|
|
|
&= 0.89435 - (1-0.93319)\\
|
|
|
&= 0.89435 - 0.06681\\
|
|
|
&= 0.82754 = \underline{\underline{82.754\%}}
|
|
|
\end{align*}
|
|
|
|
|
|
Berechne die Wahrscheinlichkeit, dass ein Bauteil länger als $10.7cm$ ist.
|
|
|
\begin{align*}
|
|
|
P(X>10.7) &= 1 - P(X<10.7)\\
|
|
|
&= 1-P(\frac{x-\mu}{\sigma} < \frac{10.7-\mu}{\sigma})\\
|
|
|
&= 1-P(\frac{x-\mu}{\sigma} < \frac{0.7}{0.2})\\
|
|
|
&= 1-P(\frac{x-\mu}{\sigma} < 3.5)\\
|
|
|
&= 1 - \phi(3.5) = 1-0.99977\\
|
|
|
&= 0.00023 = \underline{\underline{0.023\%}}
|
|
|
\end{align*}
|
|
|
|
|
|
\section{Schätzungen und Tests}
|
|
|
|
|
|
Test z.\,B. Liefert die Maschine im Mittel die geforderten $10cm$ Länge?\\
|
|
|
\(\to\) mit einer Stichprobe.
|
|
|
|
|
|
\subsection{Stichproben}
|
|
|
|
|
|
Stichprobenumfang $n$, Stichprobenwerte \(x_1,x_2,…,x_n\).\\
|
|
|
$\to$ arithmetisches Mittel (Durchschnitt)
|
|
|
|
|
|
\( \overline{x} = \frac1n * (x_1+x_2+…+x_n) = \frac1n \sum\limits_{i=1}^n x_i \)\\
|
|
|
\( \to\) Schätzung für $\mu$
|
|
|
|
|
|
Stichprobenvarianz
|
|
|
\begin{align*}
|
|
|
s_{\color{Orange}n}^2 &= \frac{1}{\color{Orange}n} * \left( (x_1-\overline{x})^2 + (x_2-\overline{x})^2+ … + (x_n-\overline{x})^2 \right) \\
|
|
|
&= \frac1n * \left( x_1^2 + x_2^2 + … + x_n^2 \right) - \overline{x}^2\\
|
|
|
s^2 = s_{\color{Orange}n-1}^2 &= \frac{1}{\color{Orange}n-1} + \left( (x_1 - \overline{x})^2 + (x_2 - \overline{x})^2 + … + (x_n - \overline{x})^2 \right)\\
|
|
|
&= \frac{1}{n-1} * (x_1^2 + … + x_n^2) - \frac{n}{n-1} * \overline{x}^2
|
|
|
\end{align*}
|
|
|
|
|
|
% Datum: 2011-12-21
|
|
|
|
|
|
\begin{align*}
|
|
|
\overline{x} &= \frac1n * \left( x_1+x_2+…+x_n \right) & \textcolor{Orange}{\to \text{ Schätzwert für }\mu}\\
|
|
|
s^2 = s_{n-1}^2 &= \frac{1}{n-1} \left( x_1^2 + x_2^2 + … + x_n^2 \right) - \frac{n}{n-1}*\overline{x}^2\\
|
|
|
s = s_{n-1} &= \sqrt{s_{n-1}^2} & \textcolor{Orange}{\to \text{ Schätzwert für }\sigma}
|
|
|
\end{align*}
|
|
|
|
|
|
\bsp Stichprobe mit 100 Bauteilen aus der Produktion\\
|
|
|
$\to$ gemessene Lösungen: 50 mal 10cm, 20 mal 10.1cm, 10 mal 10.2cm, 20 mal 9.9cm.
|
|
|
\begin{align*}
|
|
|
\overline{x} &= \frac{1}{100} * (50*10 + 20*10.1 + 10*10.2 + 20*9.9)\\
|
|
|
&= 10.02 \\
|
|
|
s^2 &= \frac{1}{99} * (50*10^2 + 20*10.1^2 + 10*10.2^2 + 20*9.9^2) - \frac{100}{99} * 10.02^2\\
|
|
|
&= \frac{19}{2475} \approx 0.007677\\
|
|
|
s &= \sqrt{\frac{19}{2475}} = \frac{\sqrt{209}}{165} \approx 0.08762
|
|
|
\end{align*}
|
|
|
\textcolor{Green}{Maß für die Streuung: $0.0876cm$\\($\to\ 10.02\pm 0.08762cm$)}
|
|
|
|
|
|
\subsection{Zentraler Grenzwertsatz}\label{sec:zentraler_grenzwertsatz}
|
|
|
|
|
|
Wenn die Zufallsvariablen $X_i\ , i=1,2,3,…$ unabhängig ($X_1,X_2$ sind unabhängig, wenn $P(X_1=a \land X_2=b) = P(X_1=a)*P(X_2=b)$) und identisch Verteilt (alle $X_i$ besitzen die gleiche Verteilungsfunktion) sind mit Erwartungswert \(\mu=E(X_i)\) und Varianz \(\sigma^2 = Var(X_i) \), dann gilt für die Zufallsvariable \(\overline{X}=\frac1n*\left(X_1+X_2+…+X_n\right)\):\\
|
|
|
\( \frac{\overline{X}-\mu}{\sigma} * \sqrt{n} \) ist für große $n$ näherungsweise $N(0,1)$ verteilt.\\
|
|
|
(und: Konvergenz für \(n\to\infty\))
|
|
|
|
|
|
\includegraphics{bilder/1-6_dichtefunktion_3.pdf}
|
|
|
|
|
|
\subsection{Tests (Erwartungswerttests)}
|
|
|
|
|
|
\underline{Nullhypothese} $\to$ soll getestet werden beim Erwartungswerttest:\\
|
|
|
\(H_0: \mu = \mu_0 \) z.\,B. Sollwert der Bauteillängen\\
|
|
|
\(\to\) Zweiseitiger Test\\
|
|
|
oder \(H_0: \mu\le\mu_0\) oder \(H_0: \mu\ge\mu_0 \)\\
|
|
|
\(\to\) Einseitige Tests
|
|
|
|
|
|
Testgröße \(T=\frac{\overline{X}-\mu_0}{\sigma} * \sqrt{n} \)\\
|
|
|
i\(\to\) ist für große $n$ näherungsweise $N(0,1)$ verteilt (siehe \ref{sec:zentraler_grenzwertsatz}) wenn $H_0$ stimmt.
|
|
|
|
|
|
\includegraphics{bilder/1-6_dichtefunktion_4.pdf}
|
|
|
|
|
|
Man muss sich eine \underline{Irrtumswahrscheinlichkeit} $\alpha$ vorgeben (z.\,B. \(\alpha = 1\%, 2\% \text{ oder } 5\%\))\\
|
|
|
Testentscheidung: $H_0$ wird \( \begin{cases} \text{angenommen}, &\text{wenn } -c\le T\le c\\ \text{abgelehnt}, &\text{wenn } T> c \text{ oder } T< -c \end{cases} \)
|
|
|
|
|
|
Bestimmung von $c$:
|
|
|
\begin{align*}
|
|
|
\phi(c) &= 1-\frac{\alpha}{2}\\
|
|
|
c &= \phi^{-1}(1-\frac{\alpha}{2}) & \text{in der Tabelle: rückwärts}
|
|
|
\end{align*}
|
|
|
|
|
|
\underline{Vorgehensweise beim Test}\\
|
|
|
\begin{itemize}
|
|
|
\item aus den vorgegebenen $\alpha$ wird $c$ bestimmt: \(\phi(c) = 1-\frac{\alpha}{2} \to \)\underline{$c$ aus der Tabelle}
|
|
|
\item in der Stichprobe wird $\overline{x}$ (und evtl. $s$) bestimmt\\
|
|
|
\(\to\) Testgröße \(T=\frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} \) ($\sigma$ kann durch $s$ angenähert werden)
|
|
|
\item Testentscheidung: $H_0$ wird \( \begin{cases} \text{angenommen}, &\text{wenn } -c\le T\le c\\ \text{abgelehnt}, &\text{wenn } T> c \text{ oder } T< -c \end{cases} \)
|
|
|
\end{itemize}
|
|
|
|
|
|
\bsp aus \ref{sec:zentraler_grenzwertsatz}:\\
|
|
|
zusätzliche Angaben: Sollwert: $10cm$ ($\mu_0$); Irrtumswahrscheinlichkeit: $2\%$ ($\alpha$)
|
|
|
\begin{multicols}{2}
|
|
|
\begin{align*}
|
|
|
c &= \phi^{-1}\left(1-\frac{\alpha}{2}\right)\\
|
|
|
&= \phi^{-1}\left( 1- \frac{0.02}{2}\right)\\
|
|
|
&= \phi^{-1}( 1- 0.01 )\\
|
|
|
&= \phi^{-1}( 0.99) \\
|
|
|
&= 2.33
|
|
|
\end{align*}
|
|
|
\begin{align*}
|
|
|
T &= \frac{10.02-10}{0.08762} * \sqrt{100}\\
|
|
|
&= \frac{0.02}{0.08762} * 10 = \frac{0.2}{0.08762}\\
|
|
|
&= 2.28258
|
|
|
\end{align*}
|
|
|
\end{multicols}
|
|
|
|
|
|
Testentscheidung: \(\underbrace{-c}_{-2.33}\le \underbrace{T}_{2.283}\le \underbrace{c}_{2.33}\)\\
|
|
|
\(\Rightarrow H_0\) annehmen, d.\,h. es spricht nichts dagegen, dass die Maschine im Mittel den Sollwert produziert.\\
|
|
|
\textcolor{Orange}{Nullhypothese: $\mu=\mu_0=10$}
|
|
|
|
|
|
Bisher: zweiseitiger Test: \(H_0: \mu=\mu0\)\\
|
|
|
Jetzt: \underline{einseitige} Tests:\\
|
|
|
\(H_0: \mu\le\mu_0\) (vorgegebener Maximalwert)
|
|
|
|
|
|
\includegraphics{bilder/1-6_dichtefunktion_5.pdf}
|
|
|
|
|
|
Testentscheidung:\\
|
|
|
$H_0$ wird \(\begin{cases}\text{angenommen},&\text{wenn } T\le c\\\text{abgelehnt},&\text{wenn }T>c\end{cases}\)
|
|
|
|
|
|
im \bsp wenn die Bauteile \underline{maximal $10cm$} lang sein dürfen.\\
|
|
|
\(\to H_0: \mu \le \underbrace{\mu_0}_{=10} \)
|
|
|
|
|
|
\(T=2.283\) (wie beim zweiseitigen Test)\\
|
|
|
für $\alpha = 2\%$:
|
|
|
\( \phi(c) = 1-\alpha = 1-0.02 = 0.98 \Rightarrow c=2.06 \)
|
|
|
|
|
|
Testentscheidung:\\
|
|
|
\( \underbrace{T}_{2.283} > \underbrace{c}_{2.06} \to H_0\) ablehnen $\to$ die Maschine liefert zu lange Teile (wahrscheinlich)
|
|
|
|
|
|
|
|
|
einseitig umgekehrt: $H_0 \mu \ge \mu_0$\\
|
|
|
\includegraphics{bilder/1-6_dichtefunktion_6.pdf}\\
|
|
|
$\hookrightarrow$ mit der Tabelle: $c = -\phi^{-1} (1-\alpha)$\\
|
|
|
Testentscheidung: $ T \ge c \to H_0 $ annehmen\\
|
|
|
$T<c \to H_0 ablehnen$
|
|
|
(Unterschied zum einseitigen Test $H_0: \mu \le \mu_0$)
|
|
|
|
|
|
\bsp Haltbarkeit von Birnen\\
|
|
|
gefordert: mindestens 10 Tage (durchschnittlich) $\to H_0: \mu\ge 10$\\
|
|
|
Stichprobe: 1000 Birnen $\to$ Haltbarkeit: bei 800 Birnen 10 Tage, bei 100 Birnen 11 Tage, bei 100 Birnen 8 Tage\\
|
|
|
Irrtumswahrscheinlichkeit: $\alpha = 2\%$\\
|
|
|
Spricht die Stichprobe gegen die Aussage, das die Haltbarkeit mindestens 10 Tage beträgt?
|
|
|
|
|
|
Bestimmung von $T$:\\
|
|
|
$n=1000$\\
|
|
|
$\overline{x} = \frac1n * (x_1+x_2+…+x_n)$\\
|
|
|
$\sigma = s = \sqrt{s^2}$\\
|
|
|
($\sigma$ bisher unbekannt $\to$ aus der Stichprobe)\\
|
|
|
mit $s^2 = s_{n-1}^2 = \frac{1}{n-1} * (x_1^2,x_2^2+…+x_n^2) - \frac{n}{n-1} * \overline{x}^2$
|
|
|
|
|
|
$\overline{x} = \frac{1}{1000} * (800 * 10 + 100 * 11 + 100 * 8) = 9.9$\\
|
|
|
$s^2 = \frac{1}{999} * (800 * 10^2 + 100 * 11^2 + 100 * 8^2 ) - \frac{1000}{999} * 9.9^2 = \frac{490}{999} = 0.\overline{490}$\\
|
|
|
$s = \sqrt{\frac{490}{999}} = \frac{7*\sqrt{1110}}{333} \approx 0.7$
|
|
|
|
|
|
$T = \frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} = \frac{9.9-10}{0.7} * \sqrt{1000} = \frac{-10*\sqrt{10}}{7} \approx -4.5175$
|
|
|
|
|
|
Bestimmung von $c$:\\
|
|
|
$ c = -\phi^{-1} (1-\alpha) = -\phi^{-1}(0.98) = -2.05 $ (Rückwärts in Tabelle)
|
|
|
|
|
|
Testentscheidung:\\
|
|
|
\( \underbrace{T}_{-4.5175} < \underbrace{c}_{-2.05} \to H_0\) ablehnen $\to$ Man davon ausgehen, dass die Haltbarkeit (im Schnitt) \underline{unter} 10 Tagen liegt.
|
|
|
|
|
|
Im Überblick:\\
|
|
|
\begin{tabular}{c|c|c|c|c}
|
|
|
& Testgröße & Grenze $c$ & $H_0$ annehmen, wenn & $\mu_0$\\\hline
|
|
|
$H_0: \mu = \mu_0$ &
|
|
|
immer gleich &
|
|
|
$c = \phi^{-1}(1-\frac \alpha 2)$ &
|
|
|
$-c \le T \le c$ & Sollwert\\
|
|
|
$H_0: \mu = \mu_0$ &
|
|
|
$T = \frac{\overline{x}-\mu_0}{\color{Orange}\sigma} * \sqrt{n}$ &
|
|
|
$c = \phi^{-1}(1-\alpha)$ &
|
|
|
$T\le c$ & Höchstens\\
|
|
|
$H_0: \mu = \mu_0$ &
|
|
|
\textcolor{Orange}{evtl. $s$ aus der Stichprobe} &
|
|
|
$c = -\phi^{-1}(1-\alpha)$ &
|
|
|
$T\ge c$ & Mindestens
|
|
|
\end{tabular}
|
|
|
|
|
|
\subsection{Fehler 1. Art, Fehler 2. Art}
|
|
|
|
|
|
Vorgeben muss man $\alpha = $ Fehler 1. Art $ = P( H_0 \text{ ablehnen } \mid H_0 \text{ stimmt} )$\\
|
|
|
es ergibt sich $\beta = $ Fehler 2. Art $ = P( H_0 \text{ annehmen } \mid H_0 \text{ stimmt nicht})$
|
|
|
|
|
|
Problem: je kleiner man $\alpha$ wählt, umso größer ist $\beta$.
|
|
|
|
|
|
\includegraphics{bilder/1-6_dichtefunktion_7.pdf}
|
|
|
|
|
|
\textbf{Gütefunktion eines Tests:}
|
|
|
|
|
|
beim zweiseitigen Test: $H_0: \mu = \mu_0$\\
|
|
|
wenn $H_0$ nicht stimmt, dann ist das wahre $\mu = \mu_1$
|
|
|
|
|
|
\includegraphics{bilder/1-6_guetefunktion.pdf}
|
|
|
|
|
|
Berechnung von $\beta$ im \bsp von vorhin:\\
|
|
|
$H_0: \mu \ge 10 ; \alpha ? 2\% \to c = -2.05 $, $H_0$ annehmen, wenn $T\ge c$\\
|
|
|
wenn das wahre $\mu$ z.\,B. gleich $0.8$ ist \textcolor{Orange}{$\to H_0$ stimmt nicht}
|
|
|
|
|
|
$\beta = P(H_0 \text{ annehmen} \mid \mu = 9.8 ) = P(T \ge -2.05 \mid \mu = 9.8)$\\
|
|
|
$= P(\frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} \ge -2.05 \mid \mu = 9.8) $
|
|
|
\begin{align*}
|
|
|
&= P( \frac{\overline{x}-\mu_0}{\sigma} * \sqrt{n} \ge -2.05 \mid \mu = 9.8 )\\
|
|
|
&= P( \frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} + \frac{\mu_1-\mu_0}{\sigma} * \sqrt{n} \ge -2.05 \mid \mu = 9.8 )\\
|
|
|
&= P( \frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} \ge -2.05 - \frac{\overbrace{\mu_1}^{9.8} - \overbrace{\mu_0}^{10} }{\sigma} * \sqrt{n} \mid u = 9.8 )\\
|
|
|
&= P( \frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} \ge 6.99 \mid \mu = 9.8 ) = 1-P(\frac{\overline{x}-\mu_1}{\sigma} * \sqrt{n} \ge 6.99) = 1 - \overbrace{\phi(6.99)}^{\approx 1} \approx 0
|
|
|
\end{align*}
|
|
|
ideal, das Praktisch kein Fehler 2. Art
|
|
|
|
|
|
Berechnung von $\beta$ für $\mu = 9.99 \to$ nah an $\mu_0 = 10$
|
|
|
\[ = -2.05 - \frac{9.99-10}{0.7} * \sqrt{1000} = -1.6 \]
|
|
|
\[ \to \beta = 1-\underbrace{\phi(-1.6)}_{1-\phi(1.6)} = 1 - ( 1- \phi(1.6)) = \phi(1.6) = 0.9452 = 94.52\% \]
|
|
|
$\to$ extrem hoch, blöd
|
|
|
|
|
|
Mit 94.52\% Wahrscheinlichkeit wird die Hypothese angenommen, obwohl sie nicht stimmt.
|
|
|
|
|
|
\subsection{Tests bei Binomialverteilung}
|
|
|
\label{Tests bei Binomialverteilung}
|
|
|
|
|
|
$X_i = \begin{cases} 0, & \text{mit Wahrscheinlichkeit } 1-p \\ 1, & \text{mit Wahrscheinlichkeit } p \end{cases}$ $\to$ ist $B(\underbrace{n}_{=1},p)$-verteilt
|
|
|
|
|
|
$\mu = E(X_i) = 0 * (1-p) + 1 * p = p$\\
|
|
|
$\sigma^2 = Var(X_i) = 0^2 * (1-p) + 1^2 * p - p^2 = p-p^2 = p*(1-p)$\\
|
|
|
$\sigma = \sqrt{p*(1-p)}$\\
|
|
|
mit einem Test $H_0: \mu = \mu_0 \to p = p_0$ können Wahrscheinlichkeiten getestet werden; z.\.B. für Fehlerraten $H_0: p\le p_0$ ($P_0$ = max. Fehlerrate).
|
|
|
|
|
|
\bsp Es soll getestet werden, ob ein Würfel gezinkt ist, anhand der Anzahl an Zweiern.\\
|
|
|
$H_0: p = \frac16$, Stichprobe: 3600 maliges Würfeln $\to$ liefert 580 Zweier.\\
|
|
|
Kann man mit Irrtumswahrscheinlichkeit von 3\% sagen, dass der Würfel gezinkt ist?
|
|
|
|
|
|
Testgröße $T = \frac{\overline{x}-p_0}{\sqrt{p_0*(1-p_0)}} * \sqrt{n} = \frac{-2 * \sqrt{5}}{5} \approx -0.8944$
|
|
|
|
|
|
Bestimmung von $c: \phi(c) = 1-\frac\alpha2 = 1-\frac{0.03}{2} = 0.985 \Rightarrow 2.17$\\
|
|
|
\textcolor{Orange}{für Zweiseitigen Test: $H_0: \mu = \mu_0$}\\
|
|
|
Testentscheidung:\\
|
|
|
Annehmen, wenn $-c \le T \le c \Rightarrow -2.17 \le -0.8944 \le 2.17$\\
|
|
|
$\Rightarrow$ Wird angenommen $\Rightarrow$ Nicht gezinkt.
|
|
|
|
|
|
\bsp Datenübertragung\\
|
|
|
Gefordert: maximale Fehlerrate von 1\% aller übertragenen Bits. Nachricht mit 10000 Bits wird übertragen.\\
|
|
|
\(\to\) es treten 105 Fehler auf.
|
|
|
|
|
|
Kann man bei einer Irrtumswahrscheinlichkeit von 2\% davon ausgehen, dass die Fehlerrate max. 1\% beträgt?
|
|
|
|
|
|
$p_0 = 0.01; \overline{x} = \frac{105}{10000} = 0.0105; n = 10000 $
|
|
|
|
|
|
|
|
|
Testgröße $T = \frac{\overline{x}-p_0}{\sqrt{p_0*(1-p_0)}} * \sqrt{n} = \frac{0.0105 - 0.01}{\sqrt{0.01*(1-0.01)}} * \sqrt{10000} = \frac{5*\sqrt{11}}{33} \approx 0.5025 $
|
|
|
|
|
|
Bestimmung von $c: \phi(c) = 1-\alpha = 1 - 0.02 = 0.98 \Rightarrow 2.05$
|
|
|
|
|
|
Testentscheidung: Annehmen, wenn $T\le c \Rightarrow 0.5025 \le 2.05$\\
|
|
|
$\Rightarrow$ Es ist davon auszugehen, dass die Fehlerrate max. 1\% beträgt.
|
|
|
|
|
|
\subsection{Konfidenzintervall}
|
|
|
|
|
|
Konfidenzintervall (Vertrauensintervall) für den Erwartungswert $\mu$
|
|
|
|
|
|
$\to$ Intervall, das um den Stichproben-Schätzwert $\overline{x}$ herumliegt, in dem $\mu$ mit Wahrscheinlichkeit \cunder{Yellow}{$1-\alpha$} liegt.\\
|
|
|
\textcolor{Orange}{$\to$ $1-\alpha$ Konfidenzintervall}
|
|
|
|
|
|
Analog zu den Tests (zweiseitig): $P(-c \le T \le c) = 1-\alpha$\\
|
|
|
$\to \underbrace{P\Big(-\phi^{-1}(1-\frac\alpha2) \le \underbrace{T}_{ \frac{\overline{x}-\mu}{\sigma} * \sqrt{n} } \le \phi^{-1}(1-\frac\alpha2) \Big) }_{\color{Orange}\text{Umformen, so dass } \mu \text{ in der Mitte steht}}$\\
|
|
|
$\to P\Big( \overline{x}-\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}} \le \mu \le \overline{x}+\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}}\Big)$\\
|
|
|
$\to$ Formel für das $(1-\alpha)$ Konfidenzintervall:\\
|
|
|
$ \Big[ \overline{x}-\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}}, \overline{x}+\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}} \Big] $ \textcolor{Orange}{$\leftarrow$ da drin liegt $\mu$ mit Wahrscheinlichkeit $1-\alpha$}
|
|
|
|
|
|
\includegraphics{bilder/1-6_konfidenz.pdf}
|
|
|
|
|
|
\bsp Länge von Bauteilen aus der Produktion.\\
|
|
|
Stichprobe von 100 Bauteilen mit $\overline{x} = 8.8, s=0.2$\\
|
|
|
gesucht: 95\% Konfidenzintervall für $\mu$
|
|
|
|
|
|
$ \Big[ \overline{x}-\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma}{\sqrt{n}}, \overline{x}+\phi^{-1}(1-\frac{\alpha}{2}) * \frac{\sigma} {\sqrt{n}} \Big] $\\
|
|
|
$= \Big[ 8.8 - 1.96 * \frac{0.2}{\sqrt{100}} , 8.8 + 1.96 * \frac{0.2}{\sqrt{100}} \Big] $\\
|
|
|
$= \Big[ \frac{10951}{1250} , \frac{11049}{1250} \Big] = \Big[ 8.7608, 8.8392 \Big]$
|
|
|
|
|
|
\textcolor{Orange}{In diesem Intervall liegt mit 95\% Wahrscheinlichkeit die $\varnothing$-Länge der Bauteile, die die Maschine Produziert.\\
|
|
|
Wird $1-\alpha$ größer gewählt, so wird das Intervall größer.\\
|
|
|
Für größeres $n$ wird das Intervall kleiner.
|
|
|
}
|
|
|
|
|
|
\subsection{Näherungen durch die Normalverteilung}
|
|
|
|
|
|
$\to$ Wie groß muss $n$ sein, damit die Näherung erlaubt ist?\\
|
|
|
Bei der Binomialverteilung (zum Schätzen von Wahrscheinlichkeit) ist die Näherung erlaubt, wenn $n*p*(1-p) \ge 9$ ist.
|
|
|
|
|
|
Im \bsp aus \ref{Tests bei Binomialverteilung}: maximale Fehlerrate 1\%, $p=0.01 ; n = 10000$\\
|
|
|
$ n * p * (1-p) = 10000 * 0.01 * (1-0.01) = 99 \ge 9 \to$ Näherung passt gut.\\
|
|
|
$n$ sollte $ \ge \frac{9}{p*(1-p)} = \frac{9}{0.01*0.99} = 910$ sein.
|
|
|
|
|
|
\section{Kovarianz und Korrelation}
|
|
|
|
|
|
Zur Messung von Zusammenhängen, hier: lineare Zusammenhänge, zwischen 2 Zufallsvariablen $X,Y$.
|
|
|
|
|
|
\begin{mydef}
|
|
|
\underline{Kovarianz} von $X$ und $Y$: $Cov(X,Y) = E\big( (X-\mu_X) * (Y-\mu_Y) \big) = E(X*Y) - \mu_X * \mu_Y$\\
|
|
|
\textcolor{Orange}{$( \to Var(X) = E((X-\mu_X)^2 = Cov(X,X) = E(X^2) - \mu_X^2 )$}
|
|
|
\end{mydef}
|
|
|
|
|
|
\begin{mydef}
|
|
|
\underline{Korrelationskoeffizient}:\\
|
|
|
$ \rho (X,Y) = \frac{Cov(X,Y)}{\sigma_X*\sigma_Y} $\\
|
|
|
\textcolor{Orange}{$\to -1 \le \rho(X,Y) \le 1$ }
|
|
|
\end{mydef}
|
|
|
|
|
|
\includegraphics{bilder/1-7_korrelation.pdf}
|
|
|
|
|
|
\begin{tabular}{lcl}
|
|
|
$\rho(X,Y)$ & $=0$ & $\to$ kein Zusammenhang zwischen X und Y (unkorreliert)\\
|
|
|
& $>0$ & $\to$ wachsender Zusammenhang (positiv korreliert)\\
|
|
|
& $=1$ & $\to$ exakt auf einer Gerade mit positiver Steigung
|
|
|
\end{tabular}
|
|
|
|
|
|
\bsp Zweimaliger Münzwurf\\
|
|
|
$X: $ Anzahl an Wappen im 1. Wurf\\
|
|
|
$Y: $ Gesamtzahl an Wappen
|
|
|
|
|
|
\begin{align*}
|
|
|
P(X=0,Y=0) &\overset{ZZ}{=} \frac14\\
|
|
|
P(X=0,Y=1) &\overset{ZW}{=} \frac14\\
|
|
|
P(X=1,Y=1) &\overset{WZ}{=} \frac14\\
|
|
|
P(X=1,Y=2) &\overset{WW}{=} \frac14\\
|
|
|
\\
|
|
|
Cov(X,Y) &= E(X+Y) - \mu_X*\mu_Y\\
|
|
|
&= 0 * 0 * \frac14 + 0 * 1 * \frac14 + 1 * 1 * \frac14 + 1 * 2 * \frac14 - 0.5 * 1\\
|
|
|
&= \frac 14 = 0.25 > 0
|
|
|
\end{align*}
|
|
|
|
|
|
\newpage
|
|
|
\section*{Standardnormalverteilung}
|
|
|
\addcontentsline{toc}{section}{Standardnormalverteilung}
|
|
|
|
|
|
\input{snv.tex}
|
|
|
|
|
|
\end{document}
|