Deprecated: $wgMWOAuthSharedUserIDs=false is deprecated, set $wgMWOAuthSharedUserIDs=true, $wgMWOAuthSharedUserSource='local' instead [Called from MediaWiki\HookContainer\HookContainer::run in /var/www/html/w/includes/HookContainer/HookContainer.php at line 135] in /var/www/html/w/includes/Debug/MWDebug.php on line 372
Regression and correlation evaluated by a method of partial sums. - MaRDI portal

Regression and correlation evaluated by a method of partial sums. (Q2605158)

From MaRDI portal





scientific article
Language Label Description Also known as
English
Regression and correlation evaluated by a method of partial sums.
scientific article

    Statements

    Regression and correlation evaluated by a method of partial sums. (English)
    0 references
    1937
    0 references
    Verf. bevorzugt im Anschluß an \textit{Laplace} die mittlere Abweichung \(\vartheta\) vor der von \textit{Gauß} verwendeten Streuung \(\sigma^2\). Hier führt er den Gedanken in die Korrelationsrechnung ein. Er sucht diejenigen geraden Linien \(y = r_2 \,x\) und \(x = r_1 \,y\), welche den Daten nach der Methode der kleinsten Quadrate am besten entsprechen, wenn das Gewicht einer Abweichung umgekehrt proportional dem absoluten Wert der Veränderlichen angenommen wird. Ist z. B. \(x\) die unabhängige Variable, so ist \(r_2\) der Wert von \(a\), welcher die über alle Daten ausgedehnte Summe \(\sum \dfrac{1}{|\, x \,|} \,(y-ax)^2\) zu einem Minimum macht. Dabei bezeichnen \(x\) und \(y\) die Abweichungen von den arithmetischen Mittelwerten. Dieser Ansatz führt auf folgende Lösung: \[ r_1=\sum_{+y} x: \sum_{+y} y=\sum_{-y} x: \sum_{-y} y; \quad r_2=\sum_{+x} y: \sum_{+x} x=\sum_{-x} y: \sum_{-x} x; \quad r=\sqrt{r_1 \, r_2}. \] Unter \(\sum\limits_{+y} x\) wird die Teilsumme aller \(x\)-Werte verstanden, zu denen ein positives \(y\) gehört. Entsprechend sind die übrigen Ausdrücke aufzufassen. Die Größe \(r\) ist nicht mit dem üblichen Korrelationskoeffizienten identisch, kommt ihm aber in den Beispielen des Verf. sehr nahe. Es gelingt Verf., für die mittleren Fehler der Regressionskoeffizienten einfache (im Text leider verdruckte) Formeln anzugeben, nämlich \[ \sigma^2 \,(r_1)=\frac{\pi r_1^2}{2N} \,(1+m \,(m-2r)); \quad \sigma^2 \,(r_2)=\frac{\pi r_2^2}{2N} \,(1+n \,(n-2r)) \] \[ \text{ mit } m=\sum\limits_{+x} x: \sum\limits_{+y} x \quad \text{und} \quad n=\sum\limits_{+y} y: \sum\limits_{+x} y, \] deren Beweis im Anhang zu finden ist. Der Vorzug des Ansatzes besteht darin, daß nur \textit{lineare} Ausdrücke vorkommen. Dadurch verringert sich die numerische Arbeit, und eine Korrektur bei einer Einteilung des Materials in Klassen wird nicht notwendig. Die Formeln verdienen es, in der Praxis in ausgedehntem Maße erprobt zu werden.
    0 references
    0 references

    Identifiers