Rayleigh quoziente

In matematica , per una matrice Hermitiana A e un vettore x diverso da zero, il quoziente di Rayleigh è l'espressione scalare definita da

dove x * denota il vettore aggiunto di x . Per una matrice simmetrica a coefficienti reali , il vettore x * è semplicemente la sua trasposizione x T .

In entrambi i casi, il quoziente di Rayleigh fornisce un valore reale che fornisce informazioni sullo spettro della matrice dalle seguenti due proprietà fondamentali:

Queste due proprietà possono essere sfruttate per determinare numericamente i valori, i vettori e gli autospazi di un operatore Hermitiano o simmetrico.

Il quoziente di Rayleigh, la cui proprietà estrema può essere correlata al principio di minima energia potenziale in meccanica , fu studiato per la prima volta da Rayleigh (1877). Walter Ritz riprese l'idea nel 1909 per farne la base di un metodo di approssimazione variazionale.

Proprietà

Partendo da una matrice simmetrica Hermitiana (i cui autovalori sono reali), il quoziente di Rayleigh soddisfa le seguenti proprietà:

  1. È una funzione omogenea di grado 1 poiché R ( A , cx ) = R ( A , x ) per ogni scalare c .
  2. Per x non a zero, dove e sono gli stessi estremi di A . Si raggiunge un'uguaglianza se e solo se x è un autovettore per il corrispondente autovalore estremo.
  3. Se x 0 è un autovettore autovalore non estremo, allora R ( A , x ) ha un punto di sella nell'intorno di x 0 .
Elementi di giustificazione Prova di proprietà 2

Nel caso reale, la matrice simmetrica è diagonalizzabile nel senso che esiste una matrice ortogonale O (le cui colonne sono autovettori) e una matrice diagonale D i cui coefficienti sono gli autovalori come

Nel caso complesso, la matrice Hermitiana può essere diagonalizzata utilizzando una matrice unitaria e il ragionamento è identico.

Il cambio di variabile preserva la norma euclidea e quindi

Nelle variabili y i , il quoziente di Rayleigh è una media ponderata degli autovalori, che giustifica la proprietà 2.

Prova di proprietà 3

Si presume che gli autovalori siano distinti l'uno dall'altro; in caso contrario, è sufficiente raccogliere i termini di Φ ( y ) da gruppi di più autovalori.

Controlliamo che il gradiente e la matrice hessiana di Φ ( y ) siano scritti rispettivamente

dove J è una matrice diagonale:

Con autovalori distinti, il gradiente svanisce se e solo se tutti y i sono zero tranne uno. Scegliendo arbitrariamente un indice k e ponendo ( simbolo di Kronecker ), deduciamo:

è diagonale con

Finalmente

Nota: H kk = 0 riflette l'omogeneità di Φ ( y ) .

Un altro approccio

La norma di x non ha effetto per la proprietà 1, possiamo anche formulare il problema con il metodo dei moltiplicatori di Lagrange trovando x che massimizza (o minimizza) x T A x sotto il vincolo x T x = 1 Si tratta quindi di una questione di considerando la funzione

e trova x e μ che annullano il differenziale di Ψ ( x , μ) . La soluzione è data dalle seguenti condizioni necessarie (ma non sufficienti in generale):

Combinato con il teorema min-max di Current - Fischer , il quoziente di Rayleigh permette di determinare uno ad uno tutti gli autovalori di una matrice. Può anche essere utilizzato per calcolare un valore approssimativo di un autovalore da un'approssimazione di un autovettore. Queste idee costituiscono anche la base dell'algoritmo di iterazione Rayleigh .

Caso speciale di matrici autoadiacenti positive

Le matrici autoadiacenti positive (cioè semi-definite positive) hanno autovalori positivi o nulli e il quoziente di Rayleigh rimane quindi sempre positivo o zero. Questo è particolarmente vero per le matrici di covarianza e questa proprietà è la base dell'analisi delle componenti principali e delle correlazioni canoniche.

Metodo Rayleigh-Ritz

La teoria di Sturm-Liouville si riferisce all'azione del lineare

sul spazio pre-Hilbert di funzioni y ( x ) soddisfa la condizioni limite specifico per x = un e b , dotato del prodotto scalare  : .

In questo caso, il quoziente di Rayleigh è

A volte è presentato in una forma equivalente, ottenuta dividendo l'integrale del numeratore e integrando per parti  :

Per determinare una soluzione approssimativa dell'equazione

verifica delle condizioni al contorno, abbiamo scelto una serie di funzioni di controllo se stessi le condizioni al contorno, e cerchiamo la soluzione approssimata come combinazione lineare di modalità p selezionato: . I coefficienti sconosciuti si ottengono scrivendo la stazionarietà del quoziente di Rayleigh :, che determina p equazioni lineari di incognite

Generalizzazione

Possiamo estendere la nozione di quoziente di Rayleigh a due matrici simmetriche definite positive reali ( A , B ) , e ad un vettore x diverso da zero , secondo:

Questa "Quoziente di Rayleigh generalizzato" è ridotto al quoziente di Rayleigh R ( D , Cx ) mediante lavorazione dove C è la fattorizzazione di Cholesky della matrice B .

Note e riferimenti

(fr) Questo articolo è parzialmente o interamente tratto dall'articolo di Wikipedia in inglese intitolato Quoziente di Rayleigh  " ( vedi la lista degli autori ) .
  1. Vedi ad es. Ciarlet 2006 , p.  12-13.

Bibliografia

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">