In matematica , una funzione reale di una variabile reale si dice convessa se:
Specificando mediante i valori della funzione quali sono i punti A e B di cui sopra, si ottiene una definizione equivalente data spesso della convessità di una funzione: una funzione definita su un intervallo reale I è convessa quando, per ogni x e y di I e tutti t in [0; 1] abbiamo:
Quando la disuguaglianza è stretta (con x diverso da y e t in ] 0; 1 [ ), si parla di funzione strettamente convessa .
La funzione quadrato e la funzione esponenziale sono esempi di funzioni strettamente convesse oltre ℝ .
Queste definizioni sono generalizzate a funzioni definite su uno spazio vettoriale arbitrario (o affine ) e con valori nella linea reale completata .
Viceversa, una funzione di cui lo stesso segmento [ AB ] si trova al di sotto del grafico, o di cui l' ipografo (l'insieme dei punti che stanno al di sotto del grafico della funzione) è un insieme convesso, o di cui, vista dal basso, il grafico è cavo, si dice concavo . In altre parole, una funzione f è concava se il suo opposto –f è convesso. Pertanto, le funzioni affini sono sia convesse che concave.
Le funzioni convesse sono, insieme agli insiemi convessi, gli oggetti costitutivi dell'analisi convessa , una disciplina "intermedia" tra l'algebra lineare e l' analisi non lineare . Consentono di dimostrare un gran numero di notevoli disuguaglianze, chiamate disuguaglianze di convessità. Svolgono anche un ruolo singolare nell'ottimizzazione , rimuovendo la distinzione tra minimi locali e globali (qualsiasi minimo locale di una funzione convessa è un minimo globale).
In questa prima sezione, si assumerà che l'insieme di partenza sia un intervallo reale I . Questa restrizione permette di fornire un primo avvio alle funzioni convesse in un primo momento più facile e perché la possibilità di disegnare rappresentazioni grafiche piatte facilita sicuramente il compito, poi e soprattutto perché i concetti di continuità o differenziabilità sono significativamente più gestibili per le funzioni. una singola variabile. Questo approccio mostra rapidamente i suoi limiti, in particolare perché è poco rilevante per applicare la teoria delle funzioni convesse all'ottimizzazione, che è senza dubbio la sua motivazione principale.
Definizione - Una funzione f da un intervallo reale I a ℝ si dice convessa quando, per tutti x 1 e x 2 di I e tutti t in [0; 1] abbiamo:
Ciò significa che per tutti x 1 e x 2 di I , il segmento [ A 1 , A 2 ] di ℝ 2 , dove A 1 = ( x 1 , f ( x 1 )) e A 2 = ( x 2 , f ( x 2 )) , si trova sopra la curva rappresentativa di f .
Una funzione concava è una funzione la cui funzione opposta è convessa.
Verifichiamo subito quanto segue, collegando le nozioni di insieme convesso e funzione convessa:
Nota - La funzione f è convessa su I se e solo se la sua epigrafe è un sottoinsieme convesso di ℝ 2 .
Esempio La funzione x | x | è convessa, perché la sua epigrafe è un quarto di piano (a sua volta convessa come intersezione di due semipiani). Spesso è scomodo verificare dalla sola definizione la convessità di una funzione definita da una formula concreta, quindi aspetteremo qualche paragrafo per fare altri esempi, quando avremo un criterio di convessità più utilizzabile in pratica. .La definizione di convessità rivela baricentri dove i coefficienti sono reali arbitrari di [0; 1] . Quando l'ipotesi è fatta solo sui media , si estende agli isobaricentri :
Lemma - Se f soddisfa la seguente condizione per p = 2 , allora la soddisfa per ogni intero p ≥ 2 :
DimostrazioneIl seguente “ principio di ricorrenza alternativo ” dimostra questo lemma.
otteniamo
cioè
Aggiungendo un'ulteriore ipotesi di regolarità di f , si ottiene:
Proposizione - Una funzione continua f su I è convessa su I se (e solo se) qualunque siano gli elementi x 1 e x 2 di I :
DimostrazioneGrazie al lemma, abbiamo
per ogni razionale t in [0; 1] quindi (per densità ) per ogni t in [0; 1] .
La disuguaglianza della definizione si estende come segue (possiamo dimostrarla per induzione sull'intero p o con lo stesso argomento della proposizione precedente. Questa versione è talvolta chiamata disuguaglianza di Jensen :
Proposizione - Se f è convesso su I e se x 1 ,…, x p sono punti di I e t 1 ,…, t p positivi o nulli reali tali che t 1 +… + t p = 1 , allora:
Il seguente risultato è talvolta chiamato "lemma a tre stringhe" o "disuguaglianza delle pendenze" o anche "disuguaglianza delle tre pendenze":
Proposizione - Se f è convessa su I per tutti i punti x 1 , x 2 e x 3 di I con x 1 < x 2 < x 3
Viceversa, se una delle due disuguaglianze vale per tutti x 1 , x 2 e x 3 di I con x 1 < x 2 < x 3 , allora f è convessa.
Il “lemma delle tre stringhe” ci permette di mostrare che:
Teorema - Se I è un intervallo aperto e se f : I → ℝ è convesso allora:
Dimostriamo anche ( vedi sotto ) che f è anche localmente Lipschitziano .
Abbiamo due caratterizzazioni:
Proposta - Sia f una funzione derivabile su un intervallo I .
Dalla seconda caratterizzazione deduciamo:
Corollario - Sia f una funzione differenziabile due volte su un intervallo I .
f è convessa se e solo se la sua derivata seconda f '' ha valori positivi o nulli.
Pertanto, ora possiamo facilmente aggiungere alla nostra raccolta di funzioni convesse (o concave) i seguenti esempi:
Usando le disuguaglianze strette, abbiamo una variante della convessità: la convessità stretta.
Definizione - Una funzione f di un intervallo I da a ℝ si dice strettamente convessa quando, per tutti x 1 e x 2 distinti in I e tutti t in ] 0; 1 [ , abbiamo:
I risultati sopra indicati per le funzioni convesse generalmente si adattano facilmente a funzioni strettamente convesse.
Proprio come le funzioni derivabili convesse sono quelle che hanno una derivata crescente, le funzioni derivabili strettamente convesse sono quelle che hanno una derivata strettamente crescente.
Secondo il legame tra monotonia e segno della derivata , una funzione f doppiamente differenziabile è quindi strettamente convessa se e solo se f'' è positiva e si annulla solo su un insieme interno vuoto.
Esempio x ↦ x 4 è strettamente convesso (la sua seconda derivata è positiva e si annulla solo in 0 ).Possiamo dare almeno due definizioni leggermente diverse di una funzione convessa di più variabili reali (o più in generale: di una variabile vettoriale ), che sostanzialmente equivalgono ma non forniscono tuttavia esattamente le stesse funzioni. Ci occuperemo quindi del contesto nell'invocare una di queste definizioni per capire se si tratta o meno di funzioni suscettibili di assumere infiniti valori.
Definizione 1 - Sia E uno spazio vettoriale (o affine) reale e C un convesso E . Diciamo che una funzione
è convesso quando
per tutti x 1 e x 2 di C e tutto t in [0; 1] , abbiamo: .In altre parole: f è convessa se la sua “restrizione” t ↦ f ( tA + (1 - t ) B ) a qualsiasi segmento è una funzione convessa della variabile reale t ∈ [0; 1] ( vedi sopra ).
Definizione 2 - Sia E uno spazio vettoriale reale (o affine). Diciamo che una funzione è convesso quandoper tutti x 1 e x 2 di dom f e tutto t in [0; 1] , abbiamo: .Data una funzione convessa ai sensi della definizione 1, possiamo associarla ad una funzione convessa ai sensi della definizione 2 estendendola da C per il valore + ∞ ; viceversa, data una funzione convessa ai sensi della definizione 2, l'insieme C : = dom f è un convesso e la restrizione da f a C è una funzione convessa ai sensi della definizione 1. Le due trasformazioni sono reciproche l' uno su l'altro: le due definizioni, sebbene tecnicamente distinte, descrivono la stessa nozione.
Alcune fonti richiedono inoltre che C sia non vuoto (nella definizione 1) o che f non sia la costante + (nella definizione 2) per evitare spiacevoli eccezioni in alcune affermazioni. Una tale funzione di E in si dice propria .
La definizione 2 è più recente della definizione 1 ed è stata introdotta indipendentemente da Rockafellar e Moreau . Permette di definire una funzione convessa come un singolo "oggetto" (una funzione definita su uno spazio vettoriale avente una proprietà molto particolare) e non come una coppia formata da un insieme convesso di uno spazio vettoriale e una funzione con valori valori reali definito su questo insieme convesso. La definizione 2 è quella più utilizzata nell'analisi convessa , per i seguenti motivi: da un lato, alleggerisce spesso l'espressione dei risultati e, dall'altro, permette di non dover specificare il convesso su cui si definisce un convesso funzione ottenuta da una delle costruzioni standard dell'analisi convessa, come il guscio superiore , la funzione di supporto , la funzione marginale , la funzione coniugata , l' ottimizzazione della doppia funzione , ecc.
Convessità rigorosaSia E uno spazio vettoriale reale (o affine). Diciamo che una funzione è strettamente convessa se, per tutti x 1 e x 2 distinti in dom f e tutti t in ] 0; 1 [ , abbiamo:
Forte convessitàSia ( E , ║ ∙ ║) uno spazio normato . Diciamo che una funzione è fortemente convessa , di modulo α> 0 se, per tutti x 1 e x 2 in dom f e tutti t in [0; 1] , abbiamo:
Troviamo la nozione di funzione convessa quando α = 0 .
Ecco alcuni esempi di costruzioni di funzioni convesse:
Ecco alcuni esempi concreti di funzioni convesse o concave:
Per ogni spazio vettoriale topologico E di dimensione infinita, esistono funzioni convesse di dominio E che non sono continue: per esempio forme lineari non continue su E .
Tuttavia, una proporzione significativa di risultati validi per funzioni convesse di una variabile sono riprodotti identicamente per funzioni convesse su una parte di uno spazio vettoriale, vale a dire che si riduce per dimostrarli per considerare la restrizione della funzione unifilare, oppure la dimostrazione è una semplice revisione della versione a una variabile. Eccone alcuni:
La tecnica di minimizzazione delle funzioni convesse mediante funzioni affini è una variante adatta all'analisi dell'uso di iperpiani di supporto in geometria convessa. La forma analitica del teorema di Hahn-Banach permetterebbe di abbassare direttamente una funzione convessa definita (e con valori finiti) sulla totalità del suo spazio di partenza. D'altra parte, non appena la funzione non è definita ovunque, è necessario porre alcune restrizioni tecniche.
Moto - Sia E uno spazio vettoriale topologico, f una funzione convessa e continua definita su un convesso aperto U non vuoto di E e x 0 un punto U .
Esiste allora una funzione affine continua che meno f e che coincide con essa in x 0 .
Vedremo un po' più avanti che l'assunzione di continuità è superflua in dimensione finita (è una conseguenza della convessità). Essenziale, invece, la condizione topologica su U , anche in una sola variabile: per la funzione convessa su [–1; 1] (il cui grafico è un semicerchio) e x 0 = 1 , non possiamo trovare una funzione affine di limite inferiore ai sensi della proposizione precedente.
DimostrazioneSi consideri da un lato l'epigrafe rigorosa di f : è convessa per convessità di f , aperta in perché U è aperta e f continua, e dall'altro il singleton L = {( x 0 , f ( x 0 ) )} . Utilizzando la prima forma geometrica del teorema di Hahn-Banach , abbiamo la garanzia che esiste un iperpiano portante in C passante per ( x 0 , f ( x 0 )) , che è chiuso. Questo iperpiano non può contenere la linea perché non contiene ( x 0 , f ( x 0 ) + 1) per esempio. Concludiamo che è il grafico di una mappa affine che minimizza f , e che è continua perché H è chiusa.
Ecco un primo risultato che permette di riconoscere la convessità di una funzione mediante le sue prime derivate. Indichiamo la forma lineare continua che è il differenziale di f nel punto x . Il punto 2 sotto significa che l' approssimazione affine di f in qualsiasi punto x è un limite inferiore di f ; il punto 3 esprime la monotonia della derivata.
Convessità e derivate prime - Sia E uno spazio normato, Ω un convesso aperto di E e una funzione differenziabile. Quindi le seguenti proprietà sono equivalenti:
Un risultato simile permette di caratterizzare la stretta convessità di una funzione. È sufficiente sostituire le disuguaglianze di cui sopra con disuguaglianze strette e assumere che i punti di valutazione x e y differiscono.
Convessità stretta e derivata prima I - Sia E uno spazio normato, Ω un convesso aperto di E e una funzione differenziabile. Quindi le seguenti proprietà sono equivalenti:
In dimensione finita, le disuguaglianze di cui sopra possono essere rinforzate.
Convessità stretta e derivate prime II - Sia E uno spazio vettoriale a dimensione finita, funzione di classe C 1 e t ∈] 0; 1 [ . Allora le seguenti proprietà sono equivalenti:
Infine, possiamo caratterizzare la convessità forte mediante le derivate prime.
Convessità e derivate prime forti - Sia E essere uno spazio euclideo, Ω un aperto convesso di E e una funzione differenziabile. Quindi le seguenti proprietà sono equivalenti:
Indichiamo la forma bilineare continua e simmetrica che è il secondo differenziale di f nel punto x .
Convessità e derivate seconde - Sia Ω uno spazio aperto di uno spazio normalizzato e una funzione differenziabile due volte.
Ricordiamo che il viceversa del secondo punto è falso ( vedi sopra ).
Come nella dimensione 1, una funzione convessa definita su un aperto di ℝ n è necessariamente continua in qualsiasi punto dell'aperto. La dimostrazione ci darà informazioni più precise:
Teorema - Una funzione convessa definita (e di valore finito) su un aperto di ℝ n è localmente Lipschitziana , quindi continua e derivabile quasi ovunque .
DimostrazioneSia f una funzione convessa sull'apertura convessa C , e sia x 0 un punto C .
Mostreremo prima che f è localmente limitato. La dimensione finita è qui usata in modo essenziale.
Per vincolare localmente f , prendiamo un simplesso contenente x 0 al suo interno, e indichiamo con M il valore più grande assunto da f sugli n + 1 vertici di questo simplesso. La disuguaglianza di convessità permette di estendere questo incremento all'intero simplesso, quindi ad un intorno di x 0 .
Passando al markdown locale, valido su qualsiasi pallina B centrata in x 0 sulla quale sappiamo già aumentare f di un milione . Per ogni punto x 1 di questa palla, introducendo la simmetrica x 1 ' di x 1 rispetto a x 0 e scrivendo la disuguaglianza di convessità per x 0 come punto medio di [ x 1 , x 1 '] e tracciando y la limite superiore di f ( x 1 ') , otteniamo il limite inferiore .
Lasciare δ poi essere strettamente positivo vero abbastanza piccolo per f per prendere valori inferiori a M (e quindi maggiore di 2 f ( x 0 ) - M sulla sfera aperta B 2 con il centro x 0 e raggio 2 δ . Poi verifica abbastanza facilmente che f è L -lipschitziano sulla palla aperta B 1 di centro x 0 e raggio δ , dove poniamo:
Per questa verifica, siano x 1 e x 2 distinti in B 1 . Introduciamo i punti ausiliari x 1 ' e x 2 ' definiti da:
e .Notare che questi punti ausiliari sono in B 2 . Se poi scriviamo successivamente le disequazioni di convessità corrispondenti alla rappresentazione di x 1 come punto del segmento e alla rappresentazione di x 2 come punto del segmento [ x 1 , x 2 '] , allora vi inseriamo gli incrementi e diminuzioni disponibili per i valori di f su B 2 , otteniamo rapidamente l'aumento desiderato:
In dimensione > 1, l' insieme trascurabile di punti dove f non è differenziabile può avere la potenza del continuo : si consideri ad esempio la mappa convessa .
Discontinuità ai marginiCon una variabile, su un intervallo non aperto, abbiamo visto che una funzione convessa non era necessariamente continua.
Tuttavia è possibile renderlo continuo con un semplice processo: se f è convesso su un intervallo [ a , b ] , allora necessariamente il limite destro f + ( a ) di f in a esiste ed è minore o uguale al valore f ( a ) . La discontinuità di f al limite a si verifica allora nel caso in cui f + ( a ) < f ( a ) . Possiamo districarlo semplicemente modificando il valore di f a questo punto: basta diminuirlo e sostituirlo con f + ( a ) .
Dalla dimensione 2, le cose non sono così comode, come mostra il seguente esempio:
Sia C il disco unitario chiuso di 2 ; si consideri la funzione f definita su C da:
Questa funzione f è convessa. È però discontinua nel punto (0, –1) ma qui la discontinuità non può essere rimossa con una semplice modifica del valore f (0, –1) . Si nota infatti che se si tende radialmente verso questo punto, essendo la funzione nulla sul raggio, f (0, y ) tende a 0; ma un facile calcolo mostra che, se tendiamo a f (0, –1) lungo il cerchio di confine di C , f ( x , y ) tende a 2. Tutti i valori tra 0 e 2 sono anche valori di adesione di f nel punto (0, –1) ed è decisamente illusorio sperare di rendere continua questa f modificandone i valori sul bordo.
Tuttavia, se l'insieme di definizione è un politopo , le cose accadono come sugli intervalli di , come possiamo vedere applicando il seguente teorema:
Teorema - Una funzione convessa limitata definita all'interno di un politopo ammette un'estensione convessa continua al politopo.
Chiusura di una funzione convessaUna volta compreso che è inutile voler modificare una funzione convessa f sulla frontiera del suo dominio di definizione fino a renderla continua, si può tuttavia scegliere un insieme di valori su questa frontiera più notevole degli altri, richiedendo che l'estensione sia allo stesso tempo semi-continua inferiore (che richiede di scegliere valori deboli) e convessa (che richiede di prenderli forti).
Per scrivere l'enunciato in modo abbastanza comodo, è qui particolarmente appropriato utilizzare funzioni definite su tutto and n ed eventualmente assumendo il valore + ∞ .
Teorema - Sia f una funzione convessa di dominio effettivo . Indichiamo con f la funzione definita da:
La funzione f è quindi caratterizzata da una delle seguenti tre proprietà:
Il fatto che f è semicontinuo inferiormente e la proprietà (3) sono vere senza usare l'assunzione di convessità di f , e sono semplici esercizi di topologia elementare.
È anche evidente il fatto che f coincide con f al di fuori dell'adesione di dom f , cioè assume il valore + in qualsiasi punto di questa parte di spazio.
Il fatto che f coincida con f sull'interno relativo di dom f deriva dalla continuità della restrizione di f a questo interno relativo, come funzione convessa su un convesso aperto (relativamente al suo inviluppo affine).
La convessità di f può sembrare chiara, poiché la sua epigrafe è convessa come l'adesione di una convessa, ma qui c'è un problema! Non dobbiamo dimenticare di controllare che f tenga i suoi valori in ( in altre parole, che il liminf usato per definire f non valga da nessuna parte –∞ ) il che non è ovvio. Per fare ciò, è desiderabile porsi temporaneamente nell'involucro affine di dom f . Per la proposizione di esistenza delle funzioni affini minimizzanti, costruiamo su questo sottospazio una forma affine che meno f sull'interno relativo di dom f ; la riduzione è ancora vera sul relativo bordo (si nota punto per punto restringendo lo spazio di partenza ad una linea passante per questo punto), si prolunga infine arbitrariamente questa forma affine a ℝ n interamente in forma affine , continua poiché siamo in dimensione finita, e che meno ovunque f . Questa forma poi abbassa anche i limiti che costruiscono f dimostrando che non possono valere –∞ .
Una volta nota la convessità di f , quindi la sua restrizione a qualsiasi segmento, l'affermazione (2) deriva dal seguente facile lemma: una funzione di una singola variabile che è sia convessa che semicontinua inferiore è infatti continua .
È chiaro che (2) e (3) caratterizzano f . Per (1), questo segue dal paragrafo precedente della dimostrazione, in cui abbiamo mostrato che (1) implica (2).
La funzione f è detta chiusura di f . Le funzioni convesse uguali alla loro chiusura sono dette funzioni convesse chiuse ; in altre parole sono le funzioni convesse la cui epigrafe è chiusa, ovvero sono le funzioni convesse semicontinue inferiori.
Possiamo anche introdurre una nozione di convessità per funzioni con valori vettoriali , purché ci diamo un cono nello spazio di arrivo della funzione.
Più specificamente, si assume dati due spazi vettoriali E ed F , un convesso da C a E , un cono appuntito convesso K di F e una funzione f di C in F . Diciamo che f è K -convesso se, per tutti x 1 e x 2 di C e tutti t in [0; 1] , abbiamo
Per le proprietà assunte di K , l'insieme delle funzioni K -convesse è un cono convesso dell'insieme delle funzioni da E a F (perché K è un cono convesso), contenente le funzioni affini (perché K è puntato).
Se il cono K è anche saliente , induce su f un ordine parziale , denotato ≤ K e definito da
Quindi, si scrive anche l'espressione sopra della K -convessità di f
che richiama la familiare disuguaglianza di convessità.
L'analisi convessa trova un gran numero di applicazioni in fisica, quando i potenziali energetici sono localmente convessi (esistenza di soluzioni stabili, cambiamenti di fase ). In omogeneizzazione , ad esempio, di tipo teorie variazionali permettono di stimare le soluzioni di ellittiche parziali equazioni differenziali grazie alla rappresentazione delle potenzialità energetiche da Legendre trasformare. La trasformata di Legendre , una formulazione matematica che rappresenta una funzione convessa per tutte le sue tangenti, permette lo sviluppo di metodi di linearizzazione.
(it) R. Tyrrell Rockafellar , Analisi convessa , Princeton, Princeton University Press ,1970, 451 pag. ( ISBN 978-0-691-01586-6 , leggi online )
<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">