Mehrere lineare Regressionsräume, Methoden und Anwendungen



Die multiple lineare Regression ist ein Berechnungswerkzeug, das Ursache-Wirkungs-Beziehungen der Lernobjekte untersucht und komplexe Hypothesen testet.

Es wird in Mathematik und Statistik verwendet. Diese Art der linearen Regression erfordert abhängige Variablen (mit anderen Worten, die Ergebnisse) und unabhängige Variablen (dh die Ursachen), die einer hierarchischen Ordnung folgen, zusätzlich zu anderen Faktoren, die verschiedenen Untersuchungsgebieten innewohnen.

Normalerweise ist die lineare Regression eine, die durch eine lineare Funktion dargestellt wird, die aus zwei abhängigen Variablen berechnet wird. Dies ist der wichtigste Fall, in dem das untersuchte Phänomen eine gerade Linie der Regression aufweist.

In einer gegebenen Menge von Daten (x1, y1) (xn, yn) und von Werten, die einem Paar von Zufallsvariablen in direkter Korrelation miteinander entsprechen, kann die Regressionslinie die Form einer Gleichung annehmen, als y = a · x + b.

Theoretische Prämissen der Berechnung in der multiplen linearen Regression

Jede Berechnung, die eine multiple lineare Regression verwendet, hängt stark von dem untersuchten Objekt und dem Studiengebiet ab, wie zum Beispiel der Ökonomie, da die Variablen die verwendeten Formeln mit Komplexitäten versehen, die je nach Fall variieren.

Je komplizierter die Frage ist, je mehr Faktoren berücksichtigt werden müssen, desto mehr Daten müssen gesammelt werden, und desto größer ist das Volumen der Elemente, die in die Berechnung einbezogen werden, wodurch die Formel größer wird.

Allen diesen Formeln ist jedoch gemeinsam, dass es eine vertikale Achse (die Ordinatenachse oder Y-Achse) und eine horizontale Achse (die Abszisse oder X-Achse) gibt, die nach der Berechnung grafisch mittels eines kartesischen Systems dargestellt werden.

Von dort werden die Interpretationen der Daten gemacht (siehe nächster Abschnitt) und Schlussfolgerungen oder Vorhersagen gemacht. Unter allen Umständen können vorstatistische Prämissen verwendet werden, um die Variablen wie folgt zu gewichten:

1- Schwache Exogenität

Es bedeutet, dass die Variable mit einem festen Wert angenommen werden muss, der sich aufgrund von Ursachen außerhalb ihres Modells kaum für Modelländerungen eignet.

2- Lineares Zeichen

Es bedeutet, dass die Werte der Variablen sowie anderer Parameter und Prädiktionskoeffizienten als lineare Kombination von Elementen dargestellt werden müssen, die im Diagramm im kartesischen System dargestellt werden können.

3- Homocedastizität

Dies muss konstant sein. Hier ist gemeint, dass unabhängig von den prädiktiven Variablen die gleiche Varianz der Fehler für jede unterschiedliche Antwortvariable vorliegen muss.

4- Unabhängigkeit

Dies gilt nur für die Fehler der Antwortvariablen, die isoliert angezeigt werden müssen und nicht als eine Gruppe von Fehlern, die ein definiertes Muster darstellen.

5- Abwesenheit von Multikollinearität

Es wird für unabhängige Variablen verwendet. Es passiert, wenn Sie versuchen, etwas zu studieren, aber sehr wenig Informationen verfügbar sind, so dass es viele Antworten geben kann und daher die Werte viele Interpretationen haben können, die letztendlich das Problem nicht lösen.

Es gibt andere Prämissen, die berücksichtigt werden, aber die oben dargestellten machen deutlich, dass die multiple lineare Regression viele Informationen benötigt, um nicht nur eine strengere, vollständigere und vorurteilsfreie Studie zu erhalten, sondern auch die Lösung der Frage Der Vorschlag ist konkret.

Das heißt, es muss auf etwas ganz Spezifisches, Spezifisches, das sich nicht zur Unbestimmtheit eignet und das in geringerem Maße zu Fehlern führt, auf den Punkt gebracht werden.

Beachten Sie, dass die multiple lineare Regression nicht unfehlbar ist und zu Berechnungsfehlern und Ungenauigkeiten neigen kann. Dies liegt weniger an der Person, die die Studie durchführt, sondern daran, dass ein bestimmtes Phänomen der Natur nicht vollständig vorhersehbar ist und nicht notwendigerweise das Produkt einer bestimmten Ursache ist.

Es passiert oft, dass sich jedes Objekt plötzlich ändern kann oder dass ein Ereignis durch die Aktion (oder Untätigkeit) zahlreicher Elemente entsteht, die miteinander interagieren.

Interpretationen der Grafiken

Sobald die Daten gemäß den in den vorherigen Phasen der Studie entwickelten Modellen berechnet wurden, ergeben die Formeln Werte, die in einer Grafik dargestellt werden können.

In dieser Reihenfolge der Ideen wird das kartesische System nicht wenige Punkte zeigen, die den berechneten Variablen entsprechen. Einige werden mehr in der Achse der Ordinaten sein, während andere mehr in der Achse der Abszissen sein werden. Einige werden mehr gruppiert sein, während andere mehr isoliert sein werden.

Um die Komplexität bei der Interpretation der Daten der Graphen zu erkennen, kann man beispielsweise das Ascombe-Quartett beobachten. In diesem Quartett werden vier verschiedene Datensätze bearbeitet, und jeder von ihnen befindet sich in einem separaten Diagramm, das daher eine separate Analyse verdient.

Die Linearität bleibt bestehen, aber die Punkte im kartesischen System müssen sehr genau betrachtet werden, bevor man weiß, wie die Teile des Puzzles zusammenkommen. Danach können die entsprechenden Schlussfolgerungen gezogen werden.

Natürlich gibt es mehrere Mittel, um diese Teile zusammenzufügen, obwohl sie verschiedenen Methoden folgen, die in speziellen Berechnungshandbüchern beschrieben sind.

Die multiple lineare Regression hängt, wie bereits gesagt, von vielen Variablen ab, abhängig vom Studienobjekt und dem Anwendungsgebiet, so dass die Verfahren in der Ökonomie nicht dieselben sind wie in der Medizin oder in der Informatik. Insgesamt wird ja eine Schätzung vorgenommen, eine Hypothese, die dann am Ende überprüft wird.

Erweiterungen der multiplen linearen Regression

Es gibt verschiedene Arten der linearen Regression, wie einfach und allgemein, aber es gibt auch mehrere Facetten der multiplen Regression, die sich an verschiedene Lernobjekte und damit an die Bedürfnisse der Wissenschaft anpassen.

Diese behandeln normalerweise eine große Anzahl von Variablen, so dass Sie oft Modelle wie multivariate oder Multilevel sehen können. Jede verwendet Postulate und Formeln verschiedener Komplexität, so dass die Interpretation ihrer Ergebnisse tendenziell von größerer Bedeutung ist.

Schätzmethoden

Es gibt eine Vielzahl von Verfahren zur Schätzung der Daten, die in der multiplen linearen Regression erhalten werden.

Auch hier hängt alles von der Solidität des verwendeten Modells, den Berechnungsformeln, der Anzahl der Variablen, den berücksichtigten theoretischen Postulaten, dem Untersuchungsgebiet, den Algorithmen, die in spezialisierten Computerprogrammen programmiert werden, und von , par excellence, die Komplexität des Objekts, des Phänomens oder des Ereignisses, das analysiert wird.

Jede Schätzmethode verwendet völlig unterschiedliche Formeln. Keine ist perfekt, aber es hat einzigartige Vorteile, die in Übereinstimmung mit der statistischen Studie verwendet werden müssen.

Es gibt alle Arten von instrumentellen Variablen, generalisierte kleinste Quadrate, Bayessche lineare Regression, gemischte Modelle, Tyjonov Regularisierung, Quantil Regression, Theil-Sen Schätzer und eine lange Liste von Werkzeugen, mit denen die Daten mit größerer Genauigkeit untersucht werden können.

Praktische Anwendungen

Die multiple lineare Regression wird in verschiedenen Studienbereichen verwendet, und in vielen Fällen ist die Unterstützung von Computerprogrammen erforderlich, um genauere Daten zu erhalten.

Auf diese Weise werden die Fehlermargen, die bei manuellen Berechnungen auftreten können, reduziert (angesichts der Anwesenheit vieler unabhängiger und abhängiger Variablen ist es nicht überraschend, dass diese Art von linearer Regression zu Fehlern führt, da es viele Daten und Faktoren gibt verarbeitet).

Bei der Analyse von Markttrends untersuchen wir beispielsweise, ob sich Daten wie die Preise eines Produkts erhöht oder verringert haben, aber vor allem wann und warum.

Der Zeitpunkt wird genau dann analysiert, wenn es in einem bestimmten Zeitraum große Unterschiede in den Zahlen gibt, vor allem wenn die Änderungen unerwartet sind. Warum suchen Sie nach den genauen oder wahrscheinlichen Faktoren, mit denen das Produkt seinen Verkaufspreis nach oben, unten oder in der Höhe gehalten hat?

Ebenso profitieren die Gesundheitswissenschaften (Medizin, Bioanalytik, Pharmazie, Epidemiologie ua) von einer multiplen linearen Regression, mit der sie Gesundheitsindikatoren wie Mortalität, Morbidität und Geburtenrate untersuchen.

In diesen Fällen können wir von einer Studie ausgehen, die mit der Beobachtung beginnt, obwohl später ein Modell erstellt wird, um festzustellen, ob die Variation einiger dieser Indikatoren auf eine bestimmte Ursache zurückzuführen ist, wann und warum.

Finanzen verwenden auch multiple lineare Regression, um die Vor- und Nachteile bestimmter Investitionen zu untersuchen. Hier ist es immer notwendig zu wissen, wann die finanziellen Transaktionen getätigt werden, mit wem und mit welchen erwarteten Vorteilen.

Die Risikostufen werden entsprechend den verschiedenen Faktoren, die bei der Bewertung der Qualität dieser Anlagen berücksichtigt werden, höher oder niedriger sein, wobei auch das Volumen des Geldumtauschs zu berücksichtigen ist.

In der Wirtschaft wird dieses Berechnungswerkzeug jedoch am häufigsten verwendet. Daher wird in dieser Wissenschaft eine multiple lineare Regression verwendet mit dem Ziel, Verbrauchsausgaben, Investitionskosten, Käufe, Exporte, Importe, Vermögenswerte, Arbeitsnachfrage, Stellenangebote und viele andere Elemente vorherzusagen.

Sie alle stehen im Zusammenhang mit Makroökonomie und Mikroökonomie und sind die ersten, bei denen Datenanalysevariablen häufiger vorkommen, weil sie global lokalisiert sind.

Referenzen

  1. Baldor, Aurelio (1967). Flächen- und Raumgeometrie mit Einführung in die Trigonometrie. Caracas: Redaktionelle Cultura Venezolana, S.A.
  2. Universitätsklinikum Ramón y Cajal (2017). Multiples lineares Regressionsmodell Madrid, Spanien: HRC, Autonome Gemeinschaft Madrid. Von www.hrc.es abgerufen.
  3. Pedhazur, Elazar J. (1982). Multiple Regression in der Verhaltensforschung: Erklärung und Vorhersage, 2. Auflage. New York: Holt, Rinehart und Winston.
  4. Rojo Abuín, J.M. (2007). Multiple lineare Regression Madrid, Spanien: Zentrum für Human- und Sozialwissenschaften. Wiederhergestellt von humanidades.cchs.csic.es.
  5. Autonome Universität von Madrid (2008).Multiple lineare Regression Madrid, Spanien: UAM. Wiederhergestellt von web.uam.es.
  6. Universität von A Coruña (2017). Multiples lineares Regressionsmodell; Korrelation La Coruña, Spanien: UDC, Fakultät für Mathematik. Wiederhergestellt von dm.udc.es.
  7. Uriel, E. (2017). Multiple lineare Regression: Schätzung und Eigenschaften. Valencia, Spanien: Universität von Valencia. Von www.uv.es abgerufen.
  8. Barrio Castro, Tomás del; Clar López, Miquel und Suriñach Caral, Jordi (2002). Modell der multiplen linearen Regression: Spezifikation, Schätzung und Kontrast. Katalonien: UOC Redaktion.