Regression and correlation evaluated by a method of partial sums. (Q2605158)

scientific article

Language	Label	Description	Also known as
English	Regression and correlation evaluated by a method of partial sums.	scientific article

Statements

instance of

scholarly article

0 references

title

Regression and correlation evaluated by a method of partial sums. (English)

0 references

published in

Annals of Mathematical Statistics

0 references

publication date

1937

0 references

review text

Verf. bevorzugt im Anschluß an \textit{Laplace} die mittlere Abweichung \(\vartheta\) vor der von \textit{Gauß} verwendeten Streuung \(\sigma^2\). Hier führt er den Gedanken in die Korrelationsrechnung ein. Er sucht diejenigen geraden Linien \(y = r_2 \,x\) und \(x = r_1 \,y\), welche den Daten nach der Methode der kleinsten Quadrate am besten entsprechen, wenn das Gewicht einer Abweichung umgekehrt proportional dem absoluten Wert der Veränderlichen angenommen wird. Ist z. B. \(x\) die unabhängige Variable, so ist \(r_2\) der Wert von \(a\), welcher die über alle Daten ausgedehnte Summe \(\sum \dfrac{1}{|\, x \,|} \,(y-ax)^2\) zu einem Minimum macht. Dabei bezeichnen \(x\) und \(y\) die Abweichungen von den arithmetischen Mittelwerten. Dieser Ansatz führt auf folgende Lösung: \[ r_1=\sum_{+y} x: \sum_{+y} y=\sum_{-y} x: \sum_{-y} y; \quad r_2=\sum_{+x} y: \sum_{+x} x=\sum_{-x} y: \sum_{-x} x; \quad r=\sqrt{r_1 \, r_2}. \] Unter \(\sum\limits_{+y} x\) wird die Teilsumme aller \(x\)-Werte verstanden, zu denen ein positives \(y\) gehört. Entsprechend sind die übrigen Ausdrücke aufzufassen. Die Größe \(r\) ist nicht mit dem üblichen Korrelationskoeffizienten identisch, kommt ihm aber in den Beispielen des Verf. sehr nahe. Es gelingt Verf., für die mittleren Fehler der Regressionskoeffizienten einfache (im Text leider verdruckte) Formeln anzugeben, nämlich \[ \sigma^2 \,(r_1)=\frac{\pi r_1^2}{2N} \,(1+m \,(m-2r)); \quad \sigma^2 \,(r_2)=\frac{\pi r_2^2}{2N} \,(1+n \,(n-2r)) \] \[ \text{ mit } m=\sum\limits_{+x} x: \sum\limits_{+y} x \quad \text{und} \quad n=\sum\limits_{+y} y: \sum\limits_{+x} y, \] deren Beweis im Anhang zu finden ist. Der Vorzug des Ansatzes besteht darin, daß nur \textit{lineare} Ausdrücke vorkommen. Dadurch verringert sich die numerische Arbeit, und eine Korrektur bei einer Einteilung des Materials in Klassen wird nicht notwendig. Die Formeln verdienen es, in der Praxis in ausgedehntem Maße erprobt zu werden.

0 references

MaRDI profile type

Publication

0 references

full work available at URL

https://doi.org/10.1214/aoms/1177732428

0 references

author

Felix Bernstein

0 references