Diskussion:Hypothese (Statistik)

Letzter Kommentar: vor 1 Jahr von Sigma^2 in Abschnitt Nullverteilung als verbreiteter Begriff
Zum Archiv
Wie wird ein Archiv angelegt?

Verständnisprobleme Bearbeiten

Irgendwie verstehe ich das noch nicht so ganz. Vielleicht kann ja jemand im Text noch folgende Frage beantworten: Wieso unterteilt man in zwei disjunkte Klassen, wo ich doch eine ganz konkrete Vermutung über die Wahrscheinlichkeitsverteilung treffe. Entweder mein X ist normalverteilt oder eben nicht. Wieso muss ich da zwei Klassen bilden? Vielen Dank! 128.176.114.42 19:21, 12. Jan 2005 (CET)

Gemeint ist wohl der Parameterraum. ZB: Ho: mü => 0; H1: mü < 0. Es wäre eh mal angesagt, alle Test-Stubs zu einem schönen Artikel zu vereinen. --Philipendula 01:00, 13. Jan 2005 (CET)


"Diese Logik verwirrt den Anwender oft, sodass auch der umgekehrte Weg möglich ist, die Nullhypothese wird als richtig angenommen." Den Satz versteh ich irgendwie nicht. --Sagehorn 20:56, 8. Dez. 2011 (CET)Beantworten

Ich auch nicht. Nijdam 12:04, 9. Dez. 2011 (CET)Beantworten
Ich habe versucht, diesen Satz umzuformulieren, damit klarer wird, was mit diesem Satz wohl gemeint war. --Kogwiss 14:57, 24. Jan. 2012 (CET)Beantworten

Beipiele für Nullhypothesen Bearbeiten

Das Beispiel im ersten Absatz ("Wenn jemand ein Kind ist, dann ist er älter als 18 Jahre" usw.) würde ich ersetzen, ich glaube nicht, dass das eine statistische Hypothese ist. Eine statistische Hypothese ist eine Aussage über eine Verteilung einer Zufallsvariable.

Grundsätzlich wird bei der Wahl der Nullhypothese so vorgegangen:

  • Man möchte den Sachverhalt   untermauern also zeigen, dass der Sachverhalt wahrscheinlich zutrifft.
  • Man formuliert die Nullhypothese ( ):   (also nicht  ).
  • Falls man mit einem statistischen Test zeigen kann, dass   angesichts der vorliegenden Daten sehr unwahrscheinlich ist, so kann die   abgelehnt werden - das Ziel wurde erreicht. Man glaubt (mit der gegebenen Irrtumswahrscheinlichkeit) an  , zumindest so lange, bis weitere (neue) Beobachtungen vorliegen und eventuell zu anderen Ergebnissen führen.
  • Das ablehnen einer   ist eine starke Aussage, das nicht ablehnen dagegen nur eine schwache Aussage, das heißt mit dem nicht ablehnen ist die   keinesfalls als bewiesen zu betrachten (was aber eh schon im Artikel steht).

Beispiele für Null- und Alternativhypothesen wären z. B.:

   
Die betrachtete Verteilung ist eine Normalverteilung Die Verteilung ist keine Normalverteilung
Die betrachtete Verteilung ist symmetrisch. Die Verteilung ist nicht symmetrisch.
Der (wahre) Mittelwert der betrachteten Verteilung ist   wobei   irgend ein fester Wert aus   ist. Der wahre Mittelwert ist kleiner oder größer als  .
Der (wahre) Mittelwert der betrachteten Verteilung ist  . Der wahre Mittelwert ist größer als  .
Die (wahre) Varianz der Verteilung ist  . Die wahre Varianz der Verteilung ist kleiner oder größer als  .
   

Den letzten Satz im ersten Abstatz "Diese Logik verwirrt den Anwender oft, sodass auch der umgekehrte Weg möglich ist, die Nullhypothese wird als richtig angenommen." verstehe ich nicht ganz.

--VincentBosch 01:12, 23. Feb. 2008 (CET)Beantworten

Ich habe versucht, diesen Satz umzuformulieren, damit klarer wird, was mit diesem Satz wohl gemeint war. --Kogwiss 14:57, 24. Jan. 2012 (CET)Beantworten

Anmerkungen Bearbeiten

Thema: Umgekehrte Interpretation der Nullhypothese Bearbeiten

Folgendes steht am Ende des ersten Abschnitts: "Diese Logik verwirrt den Anwender oft, sodass auch der umgekehrte Weg möglich ist, die Nullhypothese wird als richtig angenommen." Während meines Studium habe ich mich sehr intensiv mit der Problematik befasst, aber eine derartige "falsch"-Interpretation der Nullhypothese habe ich in keine wissenschaftlichen Literatur gefunden. Diese Aussage sollte unbedingt mit wissenschaftlicher Literatur belegt werden -ansonsten ist meine Empfehlung, sie zu löschen.

Antwort zum Thema: Umgekehrte Interpretation der Nullhypothese

Ich kann zwar keine wissenschaftliche Literatur liefern. Aber ich erinnere mich sehr genau, dass vor gut 20 Jahren im Gymnasium der ganze Leistungskurs bei diesem Thema Probleme hatte und sich der Eindruck durchsetzte, als Nullhypothese müsse man das wählen, was der Lehrbuch- oder Prüfungsfragenautor erwürfelt hatte.

Wir hatten sicher nicht den besten Lehrer, und heute bin ich auf die Seite gekommen weil ich genau das wieder bräuchte. Ich bin aber zu dem Schluss gekommen, dass ich ein Lehrbuch brauche - keine Kritik an der Wikipedia, denn dass braucht und soll sie nicht sein.

-- FrankKuester 16:50, 8. Jul. 2010 (CEST)Beantworten

Habe mal einen Abschnitt zur Wahl der Null- und Alternativhypothese ergänzt. Vielleich hilfts. --Sigbert 22:57, 8. Jul. 2010 (CEST)Beantworten

Thema: Beispiele für Nullhypothese/Alternativhypothese Bearbeiten

Bitte vorsichtig sein mit dem "vereinfachen" - das Konstrukt besteht nicht aus Hypothese und Gegenhypothese, sondern weißt folgenden Zusammenhang auf: Vermutung, die man überprüfen möchte -> Nullhypothese, die es zu verwerfen gilt -> Alternativhypothese, die durch Verwerfen der Nullhypothese zwar nicht verifiziert werden kann, aber zumindest sehr wahrscheinlich ist. Auf Wunsch kann ich gerne Quellen liefern.

Beste Grüße und: Super Arbeit hier!

80.142.250.252 20:00, 29. Mär. 2009 (CEST)Beantworten

Ist ein Verweis auf Falsifikationismus#Wahrscheinlichkeitshypothesen sinnvoll? Bearbeiten

fragt --Zulu55 16:39, 13. Jan. 2010 (CET)Beantworten

Arten von Alternativhypothesen Bearbeiten

Hier wird der Eindruck vermittelt, dass man alle Alternativhypothesen in die beiden Kategorien gerichtet bzw. ungerichtet einordnen kann. Das ist jedoch falsch. Zugegeben lassen sich die meisten Alternativhypothesen in eine der beiden Kategorien einordnen. Aber eben nicht alle. Es gibt noch eine Reihe von Spezialfällen. z.B.:

  • die Alternativhypothese, dass sich p zwischen zwei Werten befindet. (z.B. die Alternativhypothese: "Der Durchschnitt von xyz liegt zwischen 1,7m und 1,9m.")
  • oder Aussagen über zwei auseinanderliegende Zustände. (z.B. die Alternativhypothese: "Er ist entweder ein sehr guter Schüler oder ein sehr schlechter Schüler, aber auf keinen Fall mittelmäßig.", wobei man halt nicht alle seine Noten kennt, sondern nur eine Auswahl.)
  • oder mehrdimensionale Aussagen.

Solche Alternativhypothesen sind zwar extrem selten, aber man kann sie nicht kategorisch ausschließen. Wenn kein Einspruch kommt, werde ich den Absatz dergestalt umschreiben, dass klar wird, dass gerichtete und ungerichtete zwar die beiden häufigsten Kategorien sind, aber eben nicht alle. (Es gibt quasi auch "halbgerichtete" Alternativhypothesen.) --Eulenspiegel1 23:39, 25. Feb. 2010 (CET)Beantworten

Abgrenzung Alternativhypothese / Nullhypothese Bearbeiten

Mir scheint der Artikel einen Widerspruch zu enthalten: Im Einführungsabsatz grenzt er Nullhypothese (=kein Zusammenhang) und Alternativhypothese (=der Annahme entgegengesetzter Zusammenhang) voneinander ab, unter "Nullhypothese" beinhaltet diese nur noch "häufig" die Gleichheit von Sachverhalten (ist das Nichthäufige dann die Alternativhypothese?), und unter "Arten von Hypothesen" steht dann ganz klar: "Die Nullhypothese lautet dann entsprechend entweder, dass beide Populationen gleich sind oder einen Unterschied in die entgegengesetzte Richtung aufweisen." Geklärt werden müsste also, ob die Alternativhypothese Element der Nullhypothese ist oder etwas anderes. Die Literatur ist sich dazu auch nicht ganz einig, was wohl an den zwei möglichen Bedeutungen des "Null" in der Nullhypothese liegt: "Null Zusammenhang" oder "Null Bestätigung für die Hypothese". Bei letzterem wäre die Alternativhypothese auch Element der Nullhypothese... P.S.: Mein erster Beitrag bei wikipedia. Bitte um Feedback, wenn ich irgendwas falsch gemacht habe...

-- Maulwurfn 10:44, 15. Apr. 2011 (CEST)Beantworten

Der Versuch einer Antwort:
  • Mit dem Satz Häufig sagt die Nullhypothese aus, dass ein bestimmter Zusammenhang nicht besteht. wird eine Aussage über den Inhalt von Nullhypothesen gemacht. Gemeint ist er wohl so: Betrachtet man die Hypothesenpaare, dann sagt die Nullhypothese oft : "Es gibt keinen Zusammenhang zwischen..." und die dazugehörige Alternativhypothese "Es gibt einen Zusammenhang zwischen...". Es wäre vermutlich besser, wen dieser Satz gestrichen würde, weil das Häufig impliziert, dass es nicht immer so ist und dann die Frage auftaucht, wann ist es so und wann nicht?
  • Nullhypothesen und Alternativhypothesen sind immer disjunkt, d.h. keine ist Teil der jeweils anderen und sie überlappen sich auch nicht,
Ich weiss leider nicht, warum die Nullhypothese Nullhypothese heisst. --Sigbert 22:29, 15. Apr. 2011 (CEST)Beantworten

Parameterraum Bearbeiten

Ich halte die Bezeichnung   für die Parametermenge für ziemlich ungünstig, weil das doch normalerweise immer der Ergebnisraum ist. Hat das einen tieferen Grund oder wärs ok, wenn ich es einfach auf z.B.   ändere? -- HilberTraum (Diskussion) 22:14, 30. Mai 2012 (CEST)Beantworten

Der Parameterraum ist der Ergebnisraum: Das Ergebnis des Experimentes ist ein Parameter. Daher ist Parameterraum und Ergebnisraum in diesem Fall synonym. --Eulenspiegel1 (Diskussion) 00:36, 1. Jun. 2012 (CEST)Beantworten
Oh, da hast du mich anscheinend völlig falsch verstanden. Ich meinte,   bezeichnet doch üblicherweise die Menge, auf der die Stichprobenvariablen   definiert sind. Der Testparameter ist doch kein Ergebnis, sondern ein unbekannter Parameter in der Verteilung der  . -- HilberTraum (Diskussion) 08:03, 1. Jun. 2012 (CEST)Beantworten
Ich bin da mit Hilbertraum einer Meinung. Der Ergebnisraum wird üblicherweise mit Ω bezeichnet, Und ... der Parameterraum ist etwas ganz Anderes als der Ergebnisraum; da hat Eulenspiegel1 anscheinend keine Ahnung. Nijdam (Diskussion) 00:31, 2. Jun. 2012 (CEST)Beantworten

Schreibt man dies so? Bearbeiten

Im Artikel steht: … die Größe des erwarteten Unterschieds oder Zusammenhangs. Koennen 'Unterschied' und 'Zusammenhang' auf diese Art zusammengezogen werden?Nijdam (Diskussion) 21:35, 16. Jan. 2014 (CET)Beantworten

Beispiel zu 2. Bearbeiten

Das Beispiel zu 2 stimmt nicht. Analyse:

a=P(Fehler 1. Art)
b=P(Fehler 2. Art)

Verlust L:

L=-80 wenn Kunde akzeptiert wird und solvabel ist
L=1000 wenn Kunde akzeptiert wird und nicht solvabel ist
Erwartete Verlust EL

1. H0: Kunde solvabel

EL=1000 P(verwerf H0 nicht und H1) - 80P(verwerf H0 nicht und H0) =
=1000 P(verwerf H0 nicht | H1)P(H1) - 80 P(verwerf H0 nicht | H0) P(H0) =
=1000 b P(H1) -80 (1-a) P(H0) < 1000 P(H1)-80 a P(H0) = (a=0,05) 1000 {1-P(H0)} - 76 P(H0) =
= 1000 - 1076 P(H0) =1000 - 1076 P(Kunde solvabel) = -76 +1076 P(Kunde insolvabel)

2. H0:Kunde insolvabel

EL=-80 P(verwerf H0 und H1) + 1000 P(verwerf H0 und H0) =
=-80 P(verwerf H0 | H1)P(H1) + 1000 P(verwerf H0 | H0) P(H0) =
=-80 (1-b) P(H1) +1000 a P(H0) < 1000 a P(H0) = (a=0,05) 50 P(H0)= 50 P(Kunde insolvabel)

Es haengt nun davon ab wie gross P(Kunde insolvabel) ist. Nijdam (Diskussion) 17:40, 2. Feb. 2014 (CET)Beantworten


Beispiel zu 2.: Ein Bankkunde will einen Kredit von 1.000 Euro von seiner Bank. Akzeptiert der Bankier den Kreditwunsch und ist der Kunde solvent, so gewinnt er die gezahlten Zinsen in Höhe von 80 Euro. Gibt der Bankier dem Kunden den Kredit und der Kunde ist insolvent, so verliert der Bankier die gesamten 1.000 Euro.

  • Formuliert man die Nulhypothese wie: "Kunde ist solvent", mit einem Signifikanzniveau von 5 %, da entspricht der Fehler 1. Art gerade Bankier lehnt den Kreditwunsch ab und der Kunde ist solvent, und wissen wir, dass der Verlust beim Fehler 1. Art gleich -80 Euro × 95 % = -76 Euro ist. Beim Fehler 2. Art kennen wir die Wahrscheinlichkeit nicht, d. h. im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 1.000 Euro. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von maximal 1.000 Euro. Der maximal erwartete Verlust V hängt ab von der Wahrscheinlichkeit   dass die Nulhypothese richtig sei, und zwar gilt:   Euro.
  • Formuliert man die Nulhypothese wie: "Kunde ist insolvent, mit einem Signifikanzniveau von 5 %, da entspricht der Fehler 1. Art gerade Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent, und wissen wir, dass der Verlust beim Fehler 1. Art gleich 1.000 Euro × 5 % = 50 Euro ist. Beim Fehler 2. Art kennen wir die Wahrscheinlichkeit nicht, d.h. im ungünstigsten Fall ist er Eins und der maximale Verlust ist gleich 0 Euro. Zusammen ergibt sich bei einer Fehlentscheidung im Test ein erwarteter Verlust von maximal 50 Euro. Der maximal erwartete Verlust V hängt ab von der Wahrscheinlichkeit   dass die Nulhypothese richtig sei, und zwar gilt:   Euro.

Die Hypothesen sollten also so gewählt werden, dass der Fehler 1. Art Bankier akzeptiert den Kreditwunsch und der Kunde ist insolvent entspricht, da dann der erwartete Verlust am geringsten ist.

Ja, so erscheint mir das mathematisch richtig (und im Artikel falsch). Allerdings frage ich mich, ob das Beispiel überhaupt in den Artikel passt. Wo ist den hier der Test? Das ist doch eigentlich nur eine Aufgabe mit bedingten (Bayesschen) Wahrscheinlichkeiten und Abschätzung einer Verlustfunktion, aber es gibt doch gar keine Beobachtungen/Stichprobe. -- HilberTraum (Diskussion) 16:31, 8. Feb. 2014 (CET)Beantworten
Es handelt sich hier um die Wahl der Nulhypothese. Deshalb koennte es im Artikel passen. Aber meinentwege koennte es auch rausgenomen werden. Nijdam (Diskussion) 18:04, 8. Feb. 2014 (CET)Beantworten
Ja, von mir aus kann das schon in den Artikel, aber ich fände es schon besser, wenn es zu den Hypothesen einen echten Test (mit Stichprobe und so) gäbe. -- HilberTraum (Diskussion) 20:13, 9. Feb. 2014 (CET)Beantworten
Vielleicht koennte das Beispiel so geaendert werden dass es sich um Produzent/Kosument handelt.Nijdam (Diskussion) 00:21, 12. Feb. 2014 (CET)Beantworten

»Arten von Hypothesen« Bearbeiten

Unter »Arten von Hypothesen« heißt es: »Wenn   die Gesamtheit aller Möglichkeiten ist, dann kann man einen Test allgemein so formulieren, dass die Teilmenge   die Nullhypothese darstellt und   die Alternativhypothese.« Weiter unten bei »Wahl der Null- und Alternativhypothese« steht dann »Formal zerlegen die Null- und Alternativhypothese einen Parameterraum   in zwei disjunkte nicht leere Teilmengen   und  .« Widersprichen sich die beiden Sätze nicht dahingehend, daß der erste auch   zuläßt, der zweite aber nicht leere Teilmengen verlangt? Chrullrich (Diskussion) 20:10, 30. Apr. 2018 (CEST)Beantworten

Nullverteilung als verbreiteter Begriff Bearbeiten

In einen Gespräch wurde die Nullverteilung erwähnt. Ich musste erstmal suchen und fand eine Masterarbeit. Es gibt den Begriff auch in der englischen Wikipedia.

Ich würde gerne einen Hinweis darauf in den Artikel schreiben, sowas "(umgangssprachlich auch Nullverteilung genannt)" reinbringen,

Zur Beurteilung, ob die Alternativhypothese akzeptiert oder abgelehnt werden soll, muss außerdem die Verteilung der Prüfgröße unter der Nullhypothese, auch Nullverteilung genannt, bekannt sein.

Gehört der Hinweis in den Artikel?

https://en.wikipedia.org/wiki/Null_distribution

"In statistical hypothesis testing, the null distribution is the probability distribution of the test statistic when the null hypothesis is true." Das ist der erste Satz, der aber in dieser Allgemeinheit falsch ist, da es in der Regel viele Wahrscheinlichkeitsverteilungen gibt, die durch die Nullhypothese zugelassen werden, und es häufig auch viele Wahrscheinlichkeitsverteilungen der Teststatistik gibt, falls die Nullhypothese wahr ist. Da hilft es auch nicht, dass der Satz ein Zitat ist.--Sigma^2 (Diskussion) 18:53, 31. Jan. 2023 (CET)Beantworten

Verbesserungsmöglichkeiten Bearbeiten

Der insgesamt gute Artikel hat noch Verbesserungsmöglichkeiten. Die Verwendung der Terminologie ist etwas unscharf, etwas uneinheitlich und manchmal zu umgangssprachlich, so dass die statistische Fachterminologie unklar bleibt. Beispiele:

  • 'Nullhypothese gilt', 'Nullhypothese ist erfüllt' anstelle von 'Nullhypothese ist wahr'. Hypothesen sind wahr oder unwahr, Entscheidungen (z. B. die Ablehnung einer Nullhypothese) sind richtig oder falsch. Manchmal werden unwahre Hypothesen (etwas unscharf) als 'falsche Hypothesen' bezeichnet. Diese Bezeichnung sollte man vermeiden, ist bisher auch nicht im Artikel.
  • '  stammt aus  '.
  • Die Terminologie 'gerichtete und ungerichtete Hypothese' ist unbelegt und scheint wesentlich Theoriefindung zu sein, um einseitige und zweiseitige Tests zu verstehen. Sie wird vielleicht in bestimmten Anwendungsgebieten verwendet. Das sollte belegt werden.
  • Naheliegen wäre das Begriffspaar 'einseitige' und 'zweiseitige' Hypothese.
  • Die Terminologie 'spezifische und unspezifische Hypothese' ist unbelegt und scheint wesentlich Theoriefindung zu sein. Sie wird vielleicht in bestimmten Anwendungsgebieten verwendet. Das sollte belegt werden.
  • Literatur: Ein Ökonometriebuch – auch wenn es zu besten Ökonometriebüchern gehört – ist als Quelle zu dürftig.
  • Der Einstichproben-t-Test als Beispiel ist insofern wenig geeignet, da der Parameter   ist, wobei die erste Komponente interessiert und der zweite Teil ein lästiger Parameter (nuisance parameter) oder Rauschparameter ist. Bezüglich   ist   eine verkürzte Schreibweise für eine zusammengesetzte Hypothese, die alle Normalverteilungen mit   und   zuläßt. Die Begriffe einfach und zusammengesetzt beziehen sich auf die Mengen zugelassener Verteilungen. Auch der Lilliefors-Test ist ein schlechtes Beispiel, da die Nullhypothese eine nicht einelementige Menge von Wahrscheinlichkeitsverteilungen beschreibt.
  • Bei multiplen Tests werden Familien von Nullhypothesen und die sogenannte Globalhypothese als Durchschnitt der Elementarhypothesen untersucht.

--Sigma^2 (Diskussion) 10:56, 31. Jan. 2023 (CET)Beantworten