On the solution of linear equations with infinitely many variables (Q1491996)
From MaRDI portal
| This is the item page for this Wikibase entity, intended for internal use and editing purposes. Please use this page instead for the normal view: On the solution of linear equations with infinitely many variables |
scientific article; zbMATH DE number 2640749
| Language | Label | Description | Also known as |
|---|---|---|---|
| English | On the solution of linear equations with infinitely many variables |
scientific article; zbMATH DE number 2640749 |
Statements
On the solution of linear equations with infinitely many variables (English)
0 references
1908
0 references
Die vorliegende Arbeit geht in der Allgemeinheit der Problemstellung bei der Auflösung unendlich vieler Gleichungen \[ (1)\qquad \sum_{m=1}^\infty a_{nm} z_m = c_n\quad (n = 1, 2, \dots) \] mit unendlich vielen Unbekannten \(z_1, z_2, \dots\) um einen wesentlichen Schritt über die frühere Literatur hinaus. Während die älteren, besonders durch \textit{H. v. Koch} geförderten Untersuchungen von der Existenz einer Determinante des unendlichen Systems der Koeffizienten \(a_{nm}\) ausgehen, lassen die neuen, in \textit{Hilberts} vierter Mitteilung (JFM 37.0351.04 und JFM 37.0351.05) in Angriff genommenen Problemstellungen zwar diese Forderung und die durch sie bedingten Einschränkungen fallen, behalten aber -- gemäß\ ihrer Beziehung zu einer Theorie gewisser Klassen quadratischer und bilinearer Formen unendlich vieler Veränderlicher (``beschränkter'' F) -- umfassendere Konvergenzbedingungen bei, die die \textit{sämtlichen} Koeffizienten \(a_{nm}\) gleichzeitig verknüpfen. Dementgegen stellt \textit{Schmidt} nur noch je eine Konvergenzanforderung für die Koeffizienten jeder einzelnen der Gleichungen (1), und zwar die, die erst zusammen mit der für die Unbekannten von ihm beibehaltenen \textit{Hilbert}schen Bedingung -- daß nur Lösungen von konvergenter Quadratsumme \(\sum_{m=1}^\infty |z_m|^2\) in Betracht gezogen werden -- die Konvergenz der linken Seiten von (1) garantiert: die Quadratsumme der Koeffizientenbeträge \(\sum_{m=1}^\infty |a_{nm}|^2\) soll für jedes \(n\) konvergieren. Weiterhin und im Zusammenhange damit sieht Verf. auch von jeder die rechten Seiten \(c_n\) der Gleichungen (1) verknüpfenden Konvergenzbedingung ab, und wendet die Frage vielmehr so: Welches sind die Bedingungen (Konvergenzbedingungen und Gleichungen), denen die \(c_n\) genügen müssen, damit die Gleichungen (1) Lösungen von konvergenter Quadratsumme haben? Die Methoden, mit denen \textit{Schmidt} dieses Problem bis zur expliziten Angabe sämtlicher Lösungen durchführt, sind im wesentlichen die, die er in seiner Dissertation (JFM 36.0461.03) auf den Bereich stetiger Funktionen statt abzählbar unendlicher Zahlenreihen von konvergenter Quadratsumme angewandt hat; sie bestehen in der Übertragung eines an durchaus anschaulichen geometrischen Betrachtungen orientierten, determinantenfreien Verfahrens zur Auflösung von \(m\) linearen Gleichungen mit \(n\) Unbekannten auf das unendliche System (1), wobei es seinen elementaren Charakter vollkommen beibehält und nur ein einziges äußerst einfaches Konvergenztheorem nötig ist. Im ersten Kapitel wird demgemäß\ die Geometrie im Raume der Funktionen \(A(z) = A_x\) einer ganzzahligen Variable \(x\) behandelt, für die die Quadratsumme \(\sum_{x=1}^\infty A_x^2 = \| A\|^2\) konvergiert (vgl. die analogen Begriffsbildungen für den Raum der stetigen Funktionen bei \textit{E. Fischer}, JFM 38.0422.02); am bequemsten wird die Deutung, wenn man die Zahlen \(A_x\) als Komponenten eines im unendlich vieldimensionalen Raume vom Anfangspunkt aus abgetragenen Vektors deutet. Bezeichnet man \(\| A \|\) als Länge des Vektors und nennt zwei Vektoren \(A(x), B(x)\) orthogonal, wenn \((A; B)= \sum_{x=1}^\infty A_x B_x= 0,\) so lassen sich die Analoga der elementaren geometrischen Sätze sofort aufstellen. Der Häufungsstellenbegriff wird wie bei \textit{Hilbert} übertragen: eine Folge unendlichvieler Vektoren \(D_n(x) = D_{nx}\) \((n = 1, 2, \dots)\) ``konvergiert stark'' gegen \(D(x),\) wenn \(\lim_{n=\infty} \| D - D_n\|^2 = \lim_{n=\infty} \sum_{x=1}\infty (D_x - D_{nx})^2 = 0,\) d. h. wenn die Entfernung der Endpunkte von \(D(x)\) und \(D_n(x)\) im Limes verschwindet. Die notwendige und hinreichende Bedingung für die Existenz einer starken Grenzfunktion in diesem Sinne ist nun -- das ist das erwähnte grundlegende Konvergenztheorem -- daß für hinreichend große \(m, n \| D_n - D_m\|\) beliebig klein wird. Des weiteren wird eine ``Theorie der linearen Funktionengebilde'' (lineare Teilräume) entwickelt, d. i. in der vorliegenden Abhandlung die Menge der Funktionen, die aus einer endlichen Teilanzahl der gegebenen Funktionen \(A_\nu (x)(\nu = 1, 2, \dots) \) -- der ``Basis'' des Gebildes -- linear-homogen mit konstanten Koeffizienten komponiert werden können, zuzüglich ihrer Häufungsfunktionen (im Sinne starker Konvergenz). In jedem solchen Gebilde \(\mathfrak U\) kann man als Basis ein System zueinander orthogonaler Funktionen einführen, geometrisch gesprochen: ein rechtwinkliges Koordinatensystem; den Übergang von den \(A_\nu(x)\) zu dieser Basis liefert das bekannte sukzessive Orthogonalisierungsverfahren; das schon in \textit{Schmidt}s Dissertation eine so große Rolle spielt. Jede Funktion \(D(x)\) kann man nun auf eine und nur eine Weise in die Summe einer \(\mathfrak U\) angehörenden Funktion (Projektion des Vektors \(D\) in den Raum \(\mathfrak U)\) und einer zu \(\mathfrak U,\) d. h. zu allen Funktionen von \(\mathfrak U\) orthogonalen Funktion (``Perpendikelfunktion'') zerlegen; diese Perpendikelfunktion \(P(x)\) wird entweder durch den Rest einer nach Funktionen der Orthogonalbasis fortschreitenden, der \textit{Fourier}schen Reihe analogen Reihe, oder bei Zugrundelegung einer beliebigen Basis als -- stets stark konvergenter -- Limes des Quotienten zweier Determinanten dargestellt, in die außer den Funktionen \(A_\nu(x)\) und \(D(x)\) nur die Werte \((A_\nu; A_\mu)\) und \((A_\nu; D)\) eingehen; einen ähnlich gebauten Ausdruck erhält man jeweils auch für den Betrag \(\| P\|^2\) der Perpendikelfunktion. Mit diesen Hülfsmitteln wird nun im zweiten Kapitel zunächst das Problem der Auflösung der homogenen Gleichungen: \[ (2)\quad (A_n; Z) = \sum_{x=1}^\infty A_{nx} Z_x = 0\quad (n = 1, 2, \dots ) \] behandelt, d. h. die Bestimmung sämtlicher auf dem Gebilde \(\mathfrak U\) mit der Basis \(A_1(x), A_2(x), \dots \) orthogonalen Funktionen. Solche Funktionen erhält man z. B. als Perpendikelfunktionen \(\varPi_\nu(x)\) von den in der Richtung der Koordinatenachsen gelegenen Einheitsvektoren \(E_\nu(x)\) (wo \(E_\nu(x) = 1\) für \(x = \nu, E\nu (x) = 0\) für \(x \neq \nu)\) auf das Gebilde \(\mathfrak A,\) und man zeigt leicht, daß das zur Basis \(\varPi_\nu(x) \) gehörige lineare Gebilde \(\mathfrak R\) die Gesamtheit der Lösungen von (2) umfaßt; die früheren Formeln für die Perpendikelfunktionen liefern zugleich explizite Formeln für die Lösungen, bzw. in dem identischen Verschwinden sämtlicher \(\varPi_\nu(x)\) d. h. in dem Verschwinden der Beträge \(\|\varPi_\nu\|\) das Kriterium dafür, (2) keine nicht triviale Lösung von konvergenter Quadratsumme besitzt. Danach genügt es nun, für die inhomogenen Gleichungen (1) eine einzige Lösung zu bestimmen; und zwar geht Schmidt auf die Bestimmung der -- eindeutig bestimmten -- Lösung von kleinster Quadratsumme \(\| Z\|^2\) aus. Eine erste Methode geht von der Bemerkung aus, daß man (1) auf (2) zurückführen kann, indem die durch \(G_n (1) = - c_n,\;Z (1) = 1, \;G_n(x) = a,_{n,x-1},\;Z(x) = z_{x-1}\) definierten Vektoren den homogenen Gleichungen \((G_n; Z)=0\) genügen; liegt nun \(E_1(x) (E_{11} = 1,\;E_{1x} = 0\) für \(x\geqq 2)\) in dem Gebilde der \(G_n(x)\), so gibt es keine \((E_1; Z) = Z(1)= 1\) genügende Lösung dieser homogenen Gleichungen und daher auch keine Lösung von (1) -- andernfalls ist das durch seinen Betrag \(\| H\|^2\) dividierte Perpendikel \(H(x)\) von \(E_1(x)\) auf dieses Gebilde die gesuchte Lösung. Die früheren Formeln liefern sofort wieder explizite Darstellungen der Lösung und des Kriteriums für die Unlösbarkeit von (1), des Verschwindens von \(\| H\|\). -- Eine andere (die dritte) Methode zur Lösung von (1) wird erhalten, indem man von der Bestimmung einer (normierten) Orthogonalbasis \(B_n(x) = \sum_{\nu=1}^n \gamma_{n\nu} A_\nu(x) \) des linearen Gebildes der \(A_\nu(x)\) ausgeht; die transformierten Gleichungen, deren Koeffizienten dem Orthogonalsystem \(B_n(x)\) angehören, lassen sich bekanntlich leicht behandeln, und man erhält, wenn man von linearen Dependenzen der \(A_n(x)\) absieht, in der Konvergenz von \(\sum_{n=1}^\infty (\sum_{\nu=1}^n \gamma_{n\nu} c_\nu)^2\) die notwendige und hinreichende Bedingung für die Lösbarkeit von (1), während dann \(Z(x) = \sum_{\nu=1}^\infty B_\nu (x) (\sum_{\nu=1}^n \gamma_{n\nu} c_\nu)\) wird. Keine dieser beiden Methoden läßt jedoch unmittelbar auf eine innerhalb in eines gewissen Bereiches der \(c_n\) konvergente Darstellung \(z_m = \sum_{n=1}^\infty b_{mn} c_n\) der Lösung von (1) schließen, wie man sie nach der Analogie endlicher Gleichungssysteme sowie der \textit{Hilbert}schen Resultate auch hier wird wünschen mögen. In dieser Richtung ergänzt eine letzte (die zweite) Methode die vorigen: Man konstruiere für jede der Funktionen \(A_n(x)\) das Perpendikel \(P_n(x)\) auf das von den übrigen \(A_1(x), A_2(x), \dots\) gebildete lineare Gebilde; sind dann sämtliche Längen \(\| P_n\|\neq 0,\) so ist (1) jedenfalls dann lösbar, wenn \(\sum_{n=1}^\infty \frac{| c_n|}{\| P_n\|}\) konnvergiert, und die kürzeste Lösung ist \(Z(x) =\sum_{n=1}^\infty \frac{|c_n|}{\| P_n\|^2}P_n(x);\) verschwindet aber ein \(\| P\|\), so ist weiterhin eine lineare Relation zwischen den \(c_n\) notwendig für die Lösbarkeit. Speziell folgt, daß \(\| P_n\|\neq 0 \) die notwendige und hinreichende Bedingung für die Existenz einer ``reziproken Matrix'' \(b_{mn}=\frac{P_n (m)}{\| P_n\|^2}\) von konvergenter Kolonnenquadratsumme zur gegebenen Koeffizientenmatrix \(a_{mn}\), ist. Endlich wird noch die Verallgemeinerung des \textit{Toeplitz}schen Kriteriums (F. d. M. 38, 157, 1907, JFM 38.0157.01) auf den vorliegenden Fall aus der dritten Methode abgeleitet. Bleibt die definite quadratische Form \(\sum_{x=1}^\infty ( \sum_{\nu=1}^n y_\nu a_\nu (x))^2\) für alle \(\sum_{\nu=1}^n y_\nu^2 = 1 \) genügenden Veränderlichen und für jedes \(n\) oberhalb, eines Wertes \(l \neq 0,\) so genügt bereits die Konvergenz von \(\sum_{n=1}^\infty c_n^2\) zur Lösbarkeit der Gleichungen (1), und es existiert stets eine in \textit{Hilbert}schem Sinne beschränkte Reziproke \((b_{mn})\) zu \((a_{mn})\). Zum Schluß\ sei noch darauf hingewiesen, daß bei \textit{Schmidt} alle Entwicklungen sogleich für komplexe Werte der Koeffizienten und Unbekannten angestellt werden, wo es sich dann um Funktionen \(A(x)\) von konvergenter Quadratsumme der absoluten Beträge \(| A|^2 = \sum_{x=1}^\infty |A(x)|^2\) handelt; dann ändert sich nichts Wesentliches gegen vorstehendes Referat (JFM 39.0399.03), wenn nur die Orthogonalitätsbedingung \((A; \overline B) = \sum_{x=1}^\infty A_x\overline B_x = 0\) gefaßt wird, wo durch Überstreichen der Übergang zu konjugiert komplexen Werten angedeutet wird.
0 references