[PYTHON] Untersuchen Sie die Beziehung zwischen zwei Variablen (2)

Heute werde ich in der Küche stehen und eine gebratene chinesische Kohlsuppe machen. Gut umrühren und dann etwas probieren, um das Ergebnis des Gerichts zu beurteilen.

Alternativ können in einem Vorstellungsgespräch zur Unternehmensrekrutierung nur wenige zehn Minuten persönlicher Besprechungen feststellen, ob die Person für einen Mitarbeiter geeignet ist.

Oder nach nur wenigen Monaten oder einem Jahr Datierung entscheide ich mich, für den Rest meines Lebens als Begleiter zu heiraten.

Auf diese Weise ist das Ableiten der Population aus einigen Stichproben die Essenz der Inferenzstatistik.

Probenahme

Bei der Auswahl der beiden Variablen werden wir die Stichprobe aus der Population extrahieren. Wie ich zuvor erklärt habe, gibt es verschiedene Arten von Stichprobenverfahren.

Im vorherigen Beispiel haben wir uns auf 10 Schüler einer High-School-Klasse konzentriert und Sportergebnisse extrahiert.

Dies bedeutet nicht, dass die Noten aller Schüler überhaupt sichtbar sind. Es ist jedoch möglich, das Ganze mit einem gewissen Grad an Genauigkeit aus den statistischen Informationen solcher Proben abzuleiten. Mit anderen Worten, Sampling ist kein Selbstzweck, sondern ein Mittel, um das Ganze zu erfassen.

Korrelation

Im vorherigen Beispiel schien die Beziehung zwischen Greifkraft und Wurfwerfen etwas nach rechts oben verteilt zu sein.

Und der Korrelationskoeffizient betrug 0,53. Es wird eine positive Korrelation geben.

Der Wert des Korrelationskoeffizienten r (x, y) reicht von -1 bis 1, und je näher er am Absolutwert 1 liegt, desto stärker ist der Korrelationsgrad.

Gerade zurückgeben

Betrachten Sie nun noch einmal die beiden Variablen x, y.

Artikel Wert
Variante x x_1, x_2, ..., x_n
Variable y y_1, y_2, ..., y_n

Eine gerade Linie, die durch das Zentrum O '(x, y) im Korrelationsdiagramm der Variablen x, y verläuft

y=a(x-\overline{x})+\overline{y}

N Punkte aus

P_1(x_1,y_1), P_2(x_2,y_2), ... P_N(x_N,y_N)

Betrachten Sie die gerade Linie, die am nächsten liegt.

Die Regressionslinie von y nach x ist wie folgt:

\frac {y-\overline{y}} {\sigma(y)} = r(x,y) \frac {x-\overline{x}} {\sigma(x)}

Ich habe zuvor die lineare Regression erklärt. Erinnern wir uns noch einmal an die Methode der kleinsten Quadrate.

image.png

Wenn sich der Korrelationskoeffizient 1 (r (x, y) → 1), S_0 → 0 oben nähert, werden alle Punkte im Streudiagramm allmählich in einer Form nahe einer geraden Linie verteilt. ist.

Referenz

Statistische Analyse von Grund auf neu gelernt http://www.amazon.co.jp/dp/4061546562

Recommended Posts

Untersuchen Sie die Beziehung zwischen zwei Variablen (2)
Untersuchen Sie die Beziehung zwischen zwei Variablen (1)
Berechnen Sie die Entsprechung zwischen zwei Abteilungen
Schätzen Sie die Verzögerung zwischen zwei Signalen
Visualisieren Sie einfach den Korrelationskoeffizienten zwischen Variablen
Die subtile Beziehung zwischen Gentoo und Pip
Über die Beziehung zwischen Git und GitHub
Bayes Modellierung-Schätzung des Unterschieds zwischen den beiden Gruppen-
Untersuchung des Zusammenhangs zwischen Eisausgaben und Temperatur
Untersuchen Sie das doppelte Problem
Berechnen Sie den Zeitunterschied zwischen zwei Spalten mit Pandas DataFrame
Verstehen Sie den Unterschied zwischen der kumulativen Zuordnung zu Variablen und der kumulativen Zuordnung zu Objekten
[Statistik] Lassen Sie uns die Beziehung zwischen der Normalverteilung und der Chi-Quadrat-Verteilung visualisieren.
Ich untersuchte die Beziehung zwischen Keras 'zustandsbehaftetem LSTM und verstecktem Zustand