|
|
 |
|
 |
| Wörterbuch der Bedeutung |
<<Zurück
Bitte wählen Sie einen Buchstaben:
A, Ä |
B |
C |
D |
E |
F |
G |
H |
I |
J |
K |
L |
M |
N |
O, Ö |
P |
Q |
R |
S |
T |
U, Ü |
V |
W |
X |
Y |
Z |
0-9
(Groß-/Kleinschreibung wird nicht unterschieden)
Klicken Sie hier, um zur Shopping-Mall zu gelangen
Maximum-Likelihood-Methode
*** Shopping-Tipp: Maximum-Likelihood-Methode
Die '''Maximum-Likelihood-Methode''' (von engl. ''maximale Wahrscheinlichkeit'') bezeichnet in der Statistik ein statistisches Schätzverfahren Schätzverfahren.
Motivation
Einfach gesprochen bedeutet die Maximum-Likelihood-Methode Folgendes: Wenn man statistische Untersuchungen durchführt, untersucht man in der Regel eine Stichprobe mit einer bestimmten Anzahl von Objekten einer Population. Da die Untersuchung der gesamten Population in den meisten Fällen natürlich hinsichtlich der Kosten und des Aufwandes unmöglich ist, sind die wichtigen Kennwerte der Population unbekannt. Solche Kennwerte sind z.B. der Erwartungswert oder die Standardabweichung. Da man diese Kennwerte jedoch zu den statistischen Rechnungen, die man durchführen möchte, benötigt, muss man die unbekannten Kennwerte der gesamten Population aufgrund der bekannten Stichprobe schätzen.
Die Maximum-Likelihood-Methode ist nun ein besonderes Verfahren zur möglichst genauen Schätzung der Populationskennwerte auf Grundlage der Stichprobenwerte. Man versucht, seine Schätzer so zu definieren, dass die Wahrscheinlichkeit, dass eben dieser geschätzte Kennwert die beobachteten Ergebnisse in der Stichprobe verursacht hat, maximiert wird.
Eine heuristische Herleitung
Stellen wir uns folgendes Beispiel vor: Wir haben vor uns eine Urne mit einer riesigen Anzahl von Kugeln, die entweder schwarz oder rot sind. Da die Untersuchung aller Kugeln praktisch unmöglich erscheint, ziehen wir eine Stichprobe von zehn Kugeln. In dieser Stichprobe erhalten wir eine rote und neun schwarze Kugeln. Wir wollen nun ausgehend von unserer Stichprobe die wahre Wahrscheinlichkeit, eine rote Kugel in der Gesamtpopulation (Urne) zu ziehen, schätzen.
Bild:M-L-S Beispielkurve.gif thumb|Verlauf der Kurve für f(p)=B(10;1,p)
Die Maximum-Likelihood-Methode versucht diese Schätzung nun so zu erstellen, dass das Ergebnis unserer Stichprobe damit am wahrscheinlichsten wird. Dazu könnte man "herumprobieren", bei welchem Schätzer die Wahrscheinlichkeit für unser Stichprobenergebnis maximal wird.
Wir "probieren" beispielsweise mal 0.2 als Schätzer für die Wahrscheinlichkeit einer roten Kugel. Mit Hilfe der Binomialverteilung Binomialverteilung B(10|1, 0.2) können wir die Wahrscheinlichkeit des beobachteten Ergebnisses (eine rote Kugel) berechnen - das Ergebnis ist 0.2684.
Jetzt "probieren" wir mal 0.1 als Schätzer - rechnen also B(10|1, 0.1) für den Fall, dass wir eine rote Kugel ziehen, aus. Das Ergebnis ist 0.3874.
Die Wahrscheinlichkeit, dass das beobachtete Ergebnis in unserer Stichprobe durch eine Populationswahrscheinlichkeit für rote Kugeln von 0.1 verursacht wurde, ist also größer als bei 0.2 als geschätzte Wahrscheinlichkeit. Damit wäre nach der M-L-Methode 0.1 ein besserer Schätzer für den Anteil roter Kugeln in der Population.
Definition
Die Maximum-Likelihood-Methode ist aufgrund ihrer Vorteile gegenüber anderen Schätzverfahren (beispielsweise Methode der kleinsten Quadrate OLS- und Momentenmethode) das wichtigste Prinzip zur Gewinnung von Schätzfunktionen für die Parameter einer Verteilung. Bei dieser Methode wird von einer Zufallsvariablen ausgegangen, deren Dichtefunktion Dichte-
bzw. Wahrscheinlichkeitsfunktion von einem Parameter_(Statistik) Parameter abhängt. Liegt eine einfache Auswahlverfahren Zufallsstichprobe mit Stochastische_Unabhängigkeit unabhängigen
und identisch verteilten Realisationen vor, so lässt sich die Dichtefunktion bzw. Wahrscheinlichkeitsfunktion wie folgt
faktorisieren:
Statt nun für einen festen Parameter die Dichte für beliebige Werte auszuwerten,
kann umgekehrt für beobachtete und somit feste Realisationen die Dichte als Funktion von
betrachtet werden. Dies führt zur Likelihood-Funktion
Wird diese Funktion in Abhängigkeit von maximiert, so erhält man die Maximum-Likelihood-Schätzung für . Es wird also der Wert von gesucht, bei dem die Stichprobenwerte die größte Dichte- bzw. Wahrscheinlichkeitsfunktion haben. Der Maximum-Likelihood-Schätzer ist in diesem Sinne der plausibelste Parameterwert für
die Realisierungen der Zufallsvariablen . Die Maximierung dieser Funktion erfolgt, indem man die erste Differenzialrechnung Ableitung nach bildet und diese dann Null setzt. Da dieses bei Dichtefunktionen mit komplizierten Exponentialfunktion Exponentenausdrücken sehr aufwändig werden kann, wird häufig die Logarithmus logarithmierte Likelihood-Funktion verwendet, da sie an derselben Stelle wie die nicht-logarithmierte Dichtefunktion ein Maximum besitzt, jedoch einfacher zu berechnen ist:
Beispiel
Diskrete Verteilung, endlicher Parameterraum
Eine Urne enthält Kugeln, die entweder rot oder schwarz sind. Die genaue Anzahl der roten Kugeln ist nicht bekannt.
Es werden Kugeln nacheinander gezogen und jeweils wieder zurück in die Urne gelegt.
Beobachtet werden (erste Kugel ist rot), (zweite Kugel ist rot),
(dritte Kugel ist schwarz) und (vierte Kugel ist rot).
Gesucht ist nun die nach dem Maximum-Likelihood-Prinzip plausibelste Zusammensetzung der Kugeln in der Urne.
Die möglichen Parameter der Wahrscheinlichkeitsfunktion sind
. Hier entspricht die Erfolgswahrscheinlichkeit
einer Ziehung gerade dem Parameter der Likelihood-Funktion.
Die zugehörige Likelihood-Funktion ist
Nun können wir die Funktionswerte berechnen:
{| border="1" cellspacing="0" cellpadding="5" style="border-collapse:collapse;"
|
|
|
|
|
|
|
|
|
|
|-
|
| 0
| 0,002
| 0,012
| 0,033
| 0,063
| 0,092
| 0,105
| 0,084
| 0
|}
Damit ist der plausibelste (größte) Parameterwert für die Realisation drei roter Kugeln bei vier Ziehungen und
somit der Schätzwert für nach der Maximum-Likelihood-Methode, d.h. rote Kugeln sind die wahrscheinlichste Anzahl.
Dies kann auch direkt über die Ableitung nach der Likelihoodfunktion
berechnet werden: Die Nullstellen der Ableitung sind bei und ; überprüfen zeigt, dass das Maximum nicht an den Randpunkten sondern für angenommen wird. Wir haben damit das gewünschte Ergebnis.
Stetige Verteilung, kontinuierlicher Parameterraum
Zu der Normalverteilung , die die Dichtefunktion Wahrscheinlichkeitsdichte
:
hat, ist die Likelihoodfunktion
:
oder umgeschrieben
:,
wobei der Mittelwert ist.
Diese Familie von Verteilungen hat zwei Paramter: '' q''=('' m'','' s''), wir maximieren die Likelihoodfunktion nach diesen beiden Parametern.
Da der Logarithmus eine streng monoton wachsende Funktion ist, können wir auch den Logarithmus der Likelihoodfunktion maximieren.
Wir bilden die partielle Ableitung partiellen Ableitungen
:
::
::
und
:
::
::.
Wir setzen beide Gleichungen gleich null und erhalten
:
und
:.
Tatsächlich hat die Funktion an dieser Stelle ihr Maximum.
Wir berechnen noch die Erwartungswerte von und :
:,
das heisst der Maximum-Likelihood-Schätzer ist erwartungstreu.
Aber
:, denn
:
::
::
::
::
::
::
::
::
Der Schätzer ist also nicht erwartungstreu.
Maximum-Likelihood-Schätzung
Als '''Maximum-Likelihood-Schätzung''' bezeichnet man in der Statistik eine Parameterschätzung, die nach der Maximum-Likelihood-Methode berechnet wurde. In der englischen Fachliteratur ist die Abkürzung MLE (''maximum likelihood estimate'') dafür sehr verbreitet. Eine Schätzung, bei der Vorwissen in Form einer A-priori-Wahrscheinlichkeit ''a priori''-Wahrscheinlichkeit einfließt, wird ''Maximum-A-Posteriori-Schätzung'' (MAP) genannt.
Existenz und asymptotische Eigenschaften von Maximum-Likelihood-Schätzern
Die besondere Qualität von Maximum-Likelihood-Schätzern äußert sich darin, dass sie in der Regel die Effizienz (Statistik) effizienteste Methode zur Schätzung bestimmter Parameter darstellt.
Es lässt sich zum einen unter bestimmten Regularitätsannahmen beweisen, dass Maximimum-Likelihood-Schätzer existieren, was aufgrund ihrer impliziten Definition als eindeutiger Maximalstelle einer nicht näher bestimmten Wahrscheinlichkeitsfunktion nicht offensichtlich ist. Die für diesen Beweis benötigten Voraussetzungen bestehen im Prinzip ausschließlich aus Annahmen zur Vertauschbarkeit von Infinitesimalrechnung Integration und Differentiation, was in den meisten betrachteten Modellen erfüllt ist.
Zum anderen sind Maximum-Likelihood-Schätzer, sofern sie unter den oben angesprochenen Bedingungen existieren, asymptotisch effizient, d. h. sie Konvergenz in Verteilung konvergieren in Verteilung gegen eine Normalverteilung normalverteilte Zufallsvariable, deren Varianz das Inverse der Fisher-Information ist. Formal gesprochen sei der Maximum-Likelihood-Schätzer für einen Parameter und die Matrix der Fisher-Information von . Dann gilt die folgende Konvergenzaussage
Dieser Grenzwertsatz ist speziell deswegen von Bedeutung, weil als Konsequenz aus der Cramer-Rao-Ungleichung das Inverse der Fisher-Information die bestmögliche Varianz für die Schätzung eines unbekannten Parameters darstellt. In dieser Hinsicht ist die Maximum-Likelihood-Methode bezüglich Asymptote asymptotischer Betrachtungen optimal.
Nachteil
Diese wünschenswerten Eigenschaften des Maximum-Likelihood-Ansatzes beruhen jedoch auf der entscheidenden Annahme über den datenerzeugenden Prozess, das heißt auf der unterstellten Dichtefunktion der untersuchten Zufallsvariable. Der Nachteil von Maximum-Likelihood ist deshalb, dass eine konkrete Annahme über die gesamte Verteilung der Zufallsvariable getroffen werden muss.
Wenn diese jedoch verletzt ist, kann es sein, dass die Maximum-Likelihood-Schätzer inkonsistent sind. Nur in einigen Fällen ist es unerheblich, ob die Zufallsvariable tatsächlich der unterstellten Verteilung gehorcht, allerdings gilt dies nicht im Allgemeinen. Per Maximum-Likelihood gewonnene Schätzer, die konsistent sind, auch wenn die zu Grunde gelegte Verteilungsannahme verletzt wird, sind sogenannte Pseudo-Maximum-Likelihood-Schätzer. Jedoch können diese Schätzer Effizienzprobleme in kleinen Stichproben aufweisen.
Maximum-Likelihood in der molekularen Phylogenie
Das Maximum-Likelihood-Kriterium gilt als eine der Standardmethoden zur Berechnung von phylogenetischer Baum phylogenetischen Bäumen, um Verwandtschaftsbeziehungen zwischen Organismen – meist anhand von DNA- oder Proteinsequenzen – zu erforschen. Als explizite Methode ermöglicht Maximum-Likelihood die Anwendung verschiedener Evolutionsmodelle, die in Form von Substitutionsmatrizen in die Stammbaumberechnungen einfließen. Entweder es werden empirische Modelle verwendet (Proteinsequenzen) oder die Wahrscheinlichkeiten für Punktmutationen zwischen den verschiedenen Nucleotiden werden anhand des Datensatzes geschätzt und hinsichtlich des Likelihood-Wertes (-''ln''L) optimiert (DNA-Sequenzen). Allgemein gilt ML als die zuverlässigste und am wenigsten Artefakt-anfällige Methode unter den phylogenetischen Baumkonstruktionsmethoden. Dies erfordert jedoch ein sorgfältiges Taxon-"Sampling" und meist ein komplexes Evolutionsmodell.
Literatur
* Schwarze, Jochen: Grundlagen der Statistik – Band 2: Wahrscheinlichkeitsrechnung und induktive Statistik, 6. Auflage, Berlin; Herne: Verlag Neue Wirtschaftsbriefe, 1997
* Blobel, Volker und Lohrmann Erich: Statistische und numerische Methoden der Datenanalyse, Stuttgart; Leipzig: Teubner Studienbücher, 1998
* Felsenstein, Joseph: Inferring Phylogenies. Sinauer Associates, 2003
* Internet-Lexikon der Methoden der empirischen Sozialforschung: Maximum Likelihood-Schätzung [http://www.lrz-muenchen.de/~wlm/ilm_m3.htm ILMES]
Kategorie:Statistik
en:Maximum likelihood
fr:Maximum de vraisemblance
it:Metodo della massima verosimiglianza
ja:最尤法
nl:Maximum Likelihood
no:Sannsynlighetsmaksimeringsestimator
ru:Метод макÑ?имального правдоподобиÑ?
sv:Maximum Likelihood-metoden
zh:最大似然估计
*** Shopping-Tipp: Maximum-Likelihood-Methode
[Der Artikel zu Maximum-Likelihood-Methode stammt aus dem Nachschlagewerk Wikipedia, der freien Enzyklopädie. Dort findet sich neben einer Übersicht der Autoren die Möglichkeit, den Original-Text des Artikels Maximum-Likelihood-Methode zu editieren.
Die Texte von Wikipedia und dieser Seite stehen unter der GNU Free Documentation License.]
<<Zurück |
Zur Startseite |
Impressum |
Zum Beginn dieser Seite
|
|
|
|