Kennzahlen des zentralen Trends für gruppierte Daten
Die Messungen der zentralen Tendenz gruppierter Daten Sie werden in Statistiken verwendet, um bestimmte Verhaltensweisen einer Gruppe von gelieferten Daten zu beschreiben, z. B. welcher Wert ihnen nahe ist, wie hoch der Durchschnitt der gesammelten Daten ist.
Wenn eine große Menge von Daten genommen wird, ist es nützlich, sie zu gruppieren, um eine bessere Reihenfolge von ihnen zu haben und somit in der Lage zu sein, bestimmte Maße der zentralen Tendenz zu berechnen.
Zu den am häufigsten verwendeten Maßen der zentralen Tendenz gehören das arithmetische Mittel, der Median und der Modus. Diese Zahlen weisen bestimmte Eigenschaften der in einem bestimmten Experiment gesammelten Daten auf.
Um diese Maßnahmen zu nutzen, muss man zunächst wissen, wie man einen Datensatz gruppiert.
Gruppierte Daten
Um Daten zuerst zu gruppieren, müssen Sie den Bereich der Daten berechnen, der durch Subtrahieren des höchsten Werts minus des niedrigsten Werts der Daten erhalten wird.
Wählen Sie dann eine Zahl "k", die Anzahl der Klassen, in denen Sie die Daten gruppieren möchten.
Wir fahren fort, den Bereich zwischen "k" zu teilen, um die Amplitude der Klassen zu erhalten, die gruppiert werden sollen. Diese Zahl ist C = R / k.
Schließlich wird die Gruppierung gestartet, für die eine kleinere Anzahl als der niedrigste Wert der erhaltenen Daten gewählt wird.
Diese Nummer ist die untere Grenze der ersten Klasse. Dazu wird C hinzugefügt. Der erhaltene Wert ist die Obergrenze der ersten Klasse.
Dann wird C zu diesem Wert addiert und die obere Grenze der zweiten Klasse wird erhalten. Auf diese Weise fahren wir fort, bis wir die Obergrenze der letzten Klasse erhalten.
Nachdem die Daten gruppiert wurden, können Sie fortfahren, den Mittelwert, Median und Modus zu berechnen.
Um zu veranschaulichen, wie das arithmetische Mittel, der Median und der Modus berechnet werden, werden wir mit einem Beispiel fortfahren.
Beispiel
Gruppieren Sie die folgenden Daten in 4 Klassen.Wenn Sie den Bereich berechnen, erhalten Sie, dass dies R = 9-1 = 8 ist. Die Amplitude der Klassen ist C = R / k = 8/4 = 2.
Daher erhalten Sie beim Gruppieren der Daten eine Tabelle wie die folgende:
Die 3 wichtigsten zentralen Tendenzen messen
Jetzt werden wir fortfahren, das arithmetische Mittel, den Median und den Modus zu berechnen. Das vorherige Beispiel wird zur Veranschaulichung dieses Verfahrens verwendet.
1- Arithmetisches Mittel
Das arithmetische Mittel besteht aus der Multiplikation jeder Frequenz mit dem Durchschnitt des Intervalls. Dann werden alle diese Ergebnisse hinzugefügt und schließlich wird es unter den gesamten Daten aufgeteilt.
Mit dem vorherigen Beispiel würde erhalten, dass das arithmetische Mittel gleich ist:
(4*2 + 4*4 + 6*6 + 4*8) / 18 = (8+16+36+32)/18 = 5,11111
Dies zeigt an, dass der Durchschnittswert der Daten in der Tabelle 5,111111 ist.
2- Mittel
Um den Median eines Datensatzes zu berechnen, werden alle Daten zuerst vom kleinsten zum größten sortiert. Zwei Fälle können vorgestellt werden:
- Wenn die Datennummer ungerade ist, dann ist der Median die Daten, die in der Mitte liegen.
- Wenn die Datenzahl gerade ist, dann ist der Median der Durchschnitt der beiden Daten, die in der Mitte verbleiben.
Bei gruppierten Daten erfolgt die Berechnung des Medians folgendermaßen:
- N / 2 wird berechnet, wobei N die Gesamtdaten sind.
- das erste Intervall, in dem die kumulative Frequenz (Summenfrequenz) größer ist als N / 2 gesucht wird, und die untere Grenze dieses Bereichs ausgewählt wird, genannt Li.
Der Median ist durch die folgende Formel gegeben:
Me = Li + (Ls-Li) * (N / 2 - Akkumulierte Frequenz vor Li) / Frequenz von [Li, Ls]
Ls ist die obere Grenze des oben genannten Bereichs.
Wenn die obige Datentabelle verwendet wird, um N / 2 = 18/2 = 9.e Summenhäufigkeiten sind 4, 8, 14 und 18 (einer für jede Zeile der Tabelle).
Daher sollte das dritte Intervall gewählt werden, da die akkumulierte Frequenz größer als N / 2 = 9 ist.
Also Li = 5 und Ls = 7. Mit der oben beschriebenen Formel müssen Sie:
Me = 5 + (7-5) * (9-8) / 6 = 5 + 2 * 1/6 = 5 + 1/3 = 16/3 · 5,3333.
3- Mode
Mode ist der Wert, der unter allen gruppierten Daten am häufigsten auftritt; das heißt, es ist der Wert, der am häufigsten in dem anfänglichen Datensatz wiederholt wird.
Wenn Sie sehr viele Daten haben, wird die folgende Formel verwendet, um den Modus der gruppierten Daten zu berechnen:
Mo = Li + (Ls-Li) * (Frequenz Li - Frequenz L (i-1)) / ((Frequenz Li - Frequenz L (i-1)) + (Frequenz Li - Frequenz L ( ich + 1)))
Das Intervall [Li, Ls] ist das Intervall, in dem die höchste Frequenz gefunden wird. Für das Beispiel in diesem Artikel haben wir, dass die Mode gegeben ist durch:
Mo = 5 + (7-5) * (6-4) / ((6-4) + (6-4)) = 5 + 2 * 2/4 = 5 + 1 = 6.
Eine weitere Formel, die verwendet wird, um einen Näherungswert für Mode zu erhalten, ist der folgende:
Mo = Li + (Ls-Li) * (Frequenz L (i + 1)) / (Frequenz L (i-1) + Frequenz L (i + 1)).
Mit dieser Formel lauten die Konten wie folgt:
Mo = 5 + (7-5) * 4 / (4 + 4) = 5 + 2 * 4/8 = 5 + 1 = 6.
Referenzen
- Bellhouse, D. R. (2011). Abraham De Moivre: Die Bühne für die klassische Wahrscheinlichkeit und ihre Anwendungen. CRC Drücken.
- Cifuentes, J. F. (2002). Einführung in die Wahrscheinlichkeitstheorie. Univ. National von Kolumbien.
- Daston, L. (1995). Klassische Wahrscheinlichkeit in der Aufklärung. Princeton Universitätspresse.
- Larson, H.J. (1978). Einführung in die Wahrscheinlichkeitstheorie und statistische Inferenz. Redaktionell Limusa.
- Martel, P.J. & Vegas, F.J. (1996). Wahrscheinlichkeitsrechnung und mathematische Statistik: Anwendungen in der klinischen Praxis und im Gesundheitsmanagement. Ediciones Díaz de Santos.
- Vázquez, A.L., und Ortiz, F.J. (2005). Statistische Methoden zur Messung, Beschreibung und Kontrolle der Variabilität. Ed. Universität von Kantabrien.
- Vázquez, S. G. (2009). Mathematikhandbuch für den Zugang zur Universität. Editorial Studienzentrum Ramon Areces SA.