Diskussion:Häufigkeitsklasse
Zur Berechnung
BearbeitenIf a word occurs once for every thousand of the most frequent word, the ratio would be 1/1000 and the base 2-logarithm would be -10. But isn't the häufigkeitsklasse really +10? Should the ratio be inverted? The oldest version of this article says 0.5 - log2(ratio). What is the true definition? How is the computed value rounded to an integer? By rounding or flooring, i.e. int() or round()? --LA2 06:18, 23. Dez. 2007 (CET)
- Auch mir erschließt sich die Erklärung zur Berechnung nicht. Zipf geht von einer hyperbolischen Verteilung aus. Ich nehme an, die logarithmische Klasseneinteilung dient dazu, gleich große Klassen zu erzeugen. Nur, wie bestimmen sich die Integrationskonstanten? Berklas 22:29, 23. Mai 2008 (CEST)
- Einfach mal nachdenken: das Argument des Logarithmus ist das Verhältnis zweier Verhältnisse, immer positiv und kleiner Eins, also ist der Logarithmus immer negativ. Folglich ist Gaußklammer von "Positive Zahl" plus 0,5 der klassische Algorithmus zum kaufmännischen Runden auf die nächste Ganze Zahl. Wieso aber das Wort "Geschwurbel" die Häufigkeitsklasse 19 hat kann ich nicht verstehen. Gemäß Formel kommt das häufigste Wort dann etwa 500000 mal öfter vor als eben Geschwurbel. Demnach gibt es geschätzt ganze Bibliotheken, in den das Wort nicht vorkommt. Schwer zu glauben...CBa--80.137.123.146 20:35, 27. Nov. 2009 (CET)
Übersetzung, Bitte
BearbeitenWie kann man "Insbesondere erwartet man nach dem Zipfschen Gesetz für jedes Korpus, dass..." in ein Deutsch übersetzen, das den Wortschatz des durchschnittlichen Wikipedianer nicht überfordert? Welche kranke Nebenbedeutung hat das Wort Korpus in diesem Zusammenhang und warum ist dessen Benutzung hier so notwendig, daß man auf eine allgemeine Verständlichkeit der Aussage verzichtet? Mit einer elitären Wortwahl - äh, Terminologie - bekommt man jedes Thema pseudoakademisch kompliziert. Die Adjektive angemessen, fachgerecht und sachgerecht sind für den Wissenden der diametralen Gegensatz zu fachidiotisch. Nur passive Dummköpfe und aktive Fachidioten glauben, daß fachchinesisches Geschwurbel von extraordinärer Kompetenz zeugt. Man könnte das auch einfacher ausdrücken, aber dann werde ich von denjenigen, die es betrifft, möglicherweise nicht ernst genommen... CBa--80.137.123.146 20:15, 27. Nov. 2009 (CET)
Wie wäre es denn mal mit einer Grafik und wenigstens einem Beispiel, um diesen Artikel auch für Leute verständlich zu machen, die noch keinen Abschluß als Linguist haben.
--Konrad – 05:34, 19. Mai 2010 (CEST)
Formel geändert
BearbeitenAn den Benutzer:92.231.92.205, der am 27. April 2014 die Formel geändert hat:
Wieso wurde die Formel geändert? Ich nehme an, das war ein Versehen, richtig?
Mit dieser Änderung ergibt die Formel eine Dezimalzahl, im Text wird die Häufigkeitsklasse aber als eine "ganze Zahl" bezeichnet. Text und Formel stehen also aktuell im Widerspruch zueinander.
Die Häufigkeitsklasse als ganze Zahl entspricht der wissenschaftlichen Praxis, zumal man bei den Dezimalzahlen der aktuellen Formel kaum von "Klassen" sprechen würde, da dann die meisten Wörter eine Klasse für sich bilden würden. Aus diesen Gründen werde ich die Formel vorläufig wieder auf ihre ursprüngliche Form korrigieren.
Falls hierzu eine andere Meinung besteht: Bitte auf diesen Diskussionsthread antworten.
Korrigierte Formel
BearbeitenDie Formel müsste nach Beschreibung im Text korrekterweise lauten (da mit Häufigkeit des Zielsworts zum Referenzwort zur Klasse führt):
wobei man statt -log(1/2) natürlich auch +log(2/1) schreiben könnte, falls man das in der Literatur anders findet. Ich habe die Formel darum korrigiert (außerdem hatte sie vor dem 27.04.2014 auch diese Form) und möchte sie hier nochmals hinterlegen, falls es da Missverständnisse geben sollte. -79.229.127.130 01:01, 7. Nov. 2014 (CET)