Analisi di sensibilità

L' analisi di sensitività è lo studio di come l' incertezza dell'output di un codice o di un sistema (digitale o altro) possa essere attribuita all'incertezza nelle sue voci. Ciò comporta la stima degli indici di sensibilità che quantificano l'influenza di un input o di un gruppo di input sull'output.

introduzione

Applicazioni

L'analisi di sensibilità può essere utile per molte applicazioni:

Notazioni e vocabolario

L'oggetto di studio dell'analisi di sensitività è una funzione , (chiamata " modello matematico" o " codice "). Può essere visto come una scatola nera da cui conosciamo solo la sua uscita . Le sue voci sono annotate . Queste sono le impostazioni della scatola nera che influiscono sull'output del sistema.

Y=f(X){\ displaystyle Y = f (X)} con .

Problemi

La scelta del metodo di analisi della sensibilità è generalmente determinata per soddisfare i vincoli imposti dalla funzione . I più comuni sono:

Metodologie

Esistono numerosi approcci per eseguire analisi di sensibilità, molti dei quali sono stati sviluppati per affrontare uno o più dei vincoli discussi sopra. Si distinguono anche per il tipo di misurazione della sensibilità (scomposizione della varianza, derivate parziali , effetti elementari, ecc.). In generale, il seguente piano si trova nella maggior parte delle procedure:

  1. Quantificare l'incertezza in ogni voce (possibili intervalli di valori, distribuzioni di probabilità). Questo può essere un problema in sé perché esistono molti metodi per ottenere l'incertezza delle distribuzioni soggettive dei dati.
  2. Identificare gli output del modello che verranno analizzati (il target di interesse dovrebbe idealmente avere una relazione diretta con il problema affrontato dal modello). L'unica razionalizzazione imposta da questo compito è uno dei vantaggi dell'analisi di sensitività.
  3. Eseguire il modello più volte seguendo un disegno sperimentale (diverso a seconda dell'approccio scelto e dell'incertezza degli input).
  4. Calcola la misura di sensibilità scelta per il problema.

In alcuni casi questa procedura verrà ripetuta, ad esempio in problemi di dimensioni elevate, in cui l'utente deve prima ordinare le variabili non importanti ("screening") prima di eseguire un'analisi di sensibilità completa.

Le diverse metodologie (vedi sotto) si distinguono per le misure di sensibilità calcolate. Queste metodologie a volte si sovrappongono e possono essere testate altre misure di sensibilità, adattate ai vincoli del problema.

One-at-a-time (OAT)

Il modo più semplice e comune per studiare la sensibilità degli input è cambiarli uno alla volta ("One-At-a-Time": OAT), gli altri rimanendo fissati su un valore nominale. Vediamo quindi l'effetto che questo ha sull'output. Il metodo OAT di solito prevede:

La sensibilità può quindi essere misurata monitorando i cambiamenti nell'output, ad esempio mediante derivate parziali o regressione lineare . Sembra logico che qualsiasi cambiamento osservato nell'output possa essere attribuito in modo inequivocabile alla singola variabile modificata. Inoltre, modificando una variabile alla volta, si possono mantenere tutte le altre variabili fisse ai loro valori centrali o di riferimento. Ciò aumenta la comparabilità dei risultati (tutti gli "effetti" sono calcolati con riferimento allo stesso punto "centrale" nello spazio di input). Il metodo OAT è spesso preferito dai modellisti per motivi pratici. Quando il modello non converge durante un'analisi OAT, il modellatore sa immediatamente quale parametro è responsabile del guasto.

Tuttavia, nonostante la sua semplicità, questo approccio non consente l'esplorazione completa dello spazio d'ingresso. Infatti, non tiene conto della variazione simultanea delle variabili di input. Ciò significa che il metodo OAT non è in grado di rilevare la presenza di interazioni tra le variabili di input. Inoltre, la scelta del valore nominale e del campionamento può essere problematica. Ad esempio, sul modello con il valore nominale , l'influenza di sarà invisibile da un metodo OAT.

Metodi locali

I metodi locali prevedono di prendere la derivata parziale dell'output Y rispetto a un input X i :

dove l'indice indica che la derivata è presa in un punto fisso nello spazio di input (da qui l'aggettivo "locale"). Questi metodi sono la modellazione aggiuntiva e la differenziazione automatizzata . Simile a OAT, i metodi locali non tentano di esplorare lo spazio di input. Guardano solo piccoli disturbi, di solito una variabile alla volta.

Nuvole di punti

Uno strumento semplice ma utile è quello di tracciare nuvole di punti della variabile di output rispetto alle variabili di input, dopo che il modello è stato valutato su un campione casuale (rispettando le distribuzioni degli input). Il vantaggio di questo approccio è che si applica anche ai dati. Fornisce anche un'indicazione visiva diretta della sensibilità.

Analisi di regressione

L' analisi di regressione , nel contesto dell'analisi di sensibilità, implica l'utilizzo dei coefficienti di regressione standardizzati come misure dirette di sensibilità. La regressione dovrebbe essere lineare rispetto ai dati. Altrimenti è difficile interpretare i coefficienti standardizzati. Questo metodo è quindi più appropriato quando il modello di risposta è di fatto lineare; la linearità può essere confermata, ad esempio, se il coefficiente di determinazione è grande. I vantaggi dell'analisi di regressione sono che è semplice e ha un basso costo computazionale.

Scomposizione della varianza

I metodi basati sulla scomposizione della varianza trattano gli input come variabili casuali e guardano solo la varianza dell'output. Questo è suddiviso in termini attribuibili a una voce o a un gruppo di voci. Gli indici di sensibilità calcolati sono gli indici di Sobol  : rappresentano la proporzione di varianza spiegata da una voce o da un gruppo di voci.

Per la voce , l'indice semplice di Sobol è dato da:

Sio=V(E[Y|Xio])V(Y){\ displaystyle S_ {i} = {\ frac {V (\ mathbb {E} [Y \ vert X_ {i}])} {V (Y)}}} dove e denotano la varianza e la media.

Il semplice indice di Sobol non tiene conto dell'incertezza causata dalle interazioni di con le altre variabili. Per includere tutte le interazioni in cui è coinvolto utilizziamo l'indice di Sobol totale:

SioT=1-V(E[Y|X∼io])V(Y){\ displaystyle S_ {i} ^ {T} = 1 - {\ frac {V (\ mathbb {E} [Y \ vert X _ {\ sim i}])} {V (Y)}}} dove .

I metodi basati sulla scomposizione della varianza consentono di esplorare completamente lo spazio di input e di prendere in considerazione le interazioni e le risposte non lineari. Per questi motivi sono ampiamente utilizzati. Il calcolo degli indici di Sobol richiede numerose valutazioni del modello (dell'ordine del mille). Esistono diversi stimatori. Generalmente utilizziamo meta-modelli (emulatori) per rendere possibile il calcolo.

Selezione

I metodi di "screening" si applicano ai modelli su larga scala per i quali si vuole distinguere rapidamente quali input sono significativi, senza cercare l'esaustività. Si tratta di osservare l'effetto dei disturbi elementari degli ingressi sulle uscite. Il metodo Morris è uno dei più conosciuti.

Test di sensibilità all'ampiezza di Fourier (FAST)

Il principio è quello di avvicinarsi a una funzione per armoniche utilizzando la trasformazione di Fourier. Gli indici di Sobol vengono poi espressi analiticamente in funzione dei coefficienti della serie di Fourier.

Polinomi del caos

Il principio è proiettare la funzione di interesse sulla base di polinomi ortogonali . Gli indici di Sobol vengono poi espressi analiticamente in funzione dei coefficienti di questa scomposizione.

Riferimenti

  1. (en) Bertrand Iooss e Paul Lemaître , gestione dell'incertezza nella simulazione-ottimizzazione di sistemi complessi , Springer, Boston, MA, coll.  "Serie di interfacce per ricerca operativa / informatica",2015( ISBN  978-1-4899-7546-1 e 9781489975478 , DOI  10.1007 / 978-1-4899-7547-8_5 , leggi online ) , p.  101–122
  2. A. Saltelli , "  Analisi della sensibilità per la valutazione dell'importanza  ", Analisi del rischio , vol.  22, n o  3,2002, p.  1–12
  3. A. Saltelli , M. Ratto , T. Andres , F. Campolongo , J. Cariboni , D. Gatelli , M. Saisana e S. Tarantola , globale Sensitivity Analysis: Il primer , John Wiley & Sons ,2008
  4. DJ Pannell , "  Analisi della sensibilità dei modelli economici normativi: quadro teorico e strategie pratiche  ", Agricultural Economics , vol.  16,1997, p.  139–152 ( DOI  10.1016 / S0169-5150 (96) 01217-0 )
  5. A. Bahremand e F. De Smedt , "  Distributed Hydrological Modeling and Sensitivity Analysis in Torysa Watershed, Slovacchia  ", Water Resources Management , vol.  22, n o  3,2008, p.  293–408 ( DOI  10.1007 / s11269-007-9168-x )
  6. M. Hill , D. Kavetski , M. Clark , M. Ye , M. Arabi , D. Lu , L. Foglia e S. Mehl , "  Uso pratico di metodi di analisi del modello computazionalmente frugali  ", Groundwater , vol.  54, n o  22015, p.  159-170 ( DOI  10.1111 / gwat.12330 )
  7. M. Hill e C. Tiedeman , Calibrazione efficace del modello delle acque sotterranee, con analisi di dati, sensibilità, previsioni e incertezza , John Wiley & Sons ,2007
  8. JC Helton , JD Johnson , CJ Salaberry e CB Storlie , "  Indagine sui metodi basati sul campionamento per l'analisi dell'incertezza e della sensibilità  ", Reliability Engineering and System Safety , vol.  91,2006, p.  1175–1209 ( DOI  10.1016 / j.ress.2005.11.017 )
  9. (in) Gaelle Chastaing Fabrice Gamboa e Clémentine Prieur , "  Decomposizione Hoeffding-Sobol generalizzata per variabili dipendenti - Applicazione all'analisi di sensibilità  " , Giornale elettronico di statistica , vol.  6,2012, p.  2420-2448 ( ISSN  1935-7524 , DOI  10.1214 / 12-EJS749 , letto online , accesso 20 novembre 2017 )
  10. Julien JACQUES, Contributi per l'analisi di sensitività e analisi discriminante generalizzata , Université Joseph Fourier-- Grenoble I,12 dicembre 2005( leggi online )
  11. A. Saltelli e P. Annoni , “  Come evitare un'analisi superficiale della sensibilità  ”, Environmental Modeling and Software , vol.  25,2010, p.  1508-1517 ( DOI  10.1016 / j.envsoft.2010.04.012 )
  12. (in) Fabrice Gamboa Alexander Janon Thierry Klein e Agnes Lagnoux , "  Analisi della sensibilità per output multidimensionali e funzionali  " , Electronic Journal of Statistics , vol.  8, n o  1,2014, p.  575-603 ( ISSN  1935-7524 , DOI  10.1214 / 14-EJS895 , letto online , accesso 20 novembre 2017 )
  13. Amandine Marrel , Bertrand Iooss , François Van Dorpe e Elena Volkova , "  Una metodologia efficiente per modellare codici di computer complessi con processi gaussiani  ", Computational Statistics & Data Analysis , vol.  52, n o  10,15 giugno 2008, p.  4731–4744 ( DOI  10.1016 / j.csda.2008.03.026 , letto online , accesso 20 novembre 2017 )
  14. (in) Amandine Marrel Bertrand Iooss , Sébastien Da Veiga e Mathieu Ribatet , "  Analisi della sensibilità globale di modelli stocastici con metamodelli collegati al computer  " , Statistics and Computing , vol.  22, n o  3,1 ° maggio 2012, p.  833-847 ( ISSN  0960-3174 e 1573-1375 , DOI  10.1007 / s11222-011-9274-8 , letto online , accesso 20 novembre 2017 )
  15. A. O'Hagan et al. , Giudizio incerto: Eliciting Experts 'Probabilities , Chichester, Wiley ,2006( leggi online )
  16. J. Sacks , WJ Welch , TJ Mitchell e HP Wynn , "  Design and Analysis of Computer Experiments  ", Statistical Science , vol.  4,1989, p.  409–435
  17. J. Campbell et al. , "  Controllo fotosintetico del solfuro di carbonile atmosferico durante la stagione di crescita  ", Science , vol.  322, n o  5904,2008, p.  1085–1088 ( PMID  19008442 , DOI  10.1126 / science.1164015 , Bibcode  2008Sci ... 322.1085C )
  18. R. Bailis , M. Ezzati e D. Kammen , "  Mortality and Greenhouse Gas Impacts of Biomass and Petroleum Energy Futures in Africa  ", Science , vol.  308,2005, p.  98-103 ( PMID  15802601 , DOI  10.1126 / science.1106881 , Bibcode  2005Sci ... 308 ... 98B )
  19. J. Murphy et al. , "  Quantificazione della modellazione delle incertezze in un ampio insieme di simulazioni di cambiamento climatico  ", Nature , vol.  430,2004, p.  768–772 ( PMID  15306806 , DOI  10.1038 / nature02771 , Bibcode  2004Natur.430..768M )
  20. Czitrom , "  One-Factor-at-a-time Versus Designed Experiments  " , American Statistician , vol.  53, n o  21999( leggi online )
  21. Dan G. Cacuci , Analisi della sensibilità e dell'incertezza: teoria , vol.  Io, Chapman e Hall
  22. Dan G. Cacuci , Mihaela Ionescu-Bujor e Michael Navon , Sensitivity and Uncertainty Analysis: Applications to Large-Scale Systems , vol.  II, Chapman & Hall ,2005
  23. A. Griewank , Evaluating Derivatives, Principles and Techniques of Algorithmic Differentiation , SIAM,2000
  24. Sobol ', I. (1990). Stime di sensibilità per modelli matematici non lineari. Matematicheskoe Modelirovanie 2 , 112–118. in russo, tradotto in inglese in Sobol ', I. (1993). Analisi di sensitività per modelli matematici non lineari. Mathematical Modeling & Computational Experiment ( English Transl. ) , 1993, 1 , 407–414.
  25. T. Homma e A. Saltelli , "  Misure di importanza nell'analisi di sensibilità globale di modelli non lineari  ", Ingegneria dell'affidabilità e sicurezza del sistema , vol.  52,1996, p.  1–17 ( DOI  10.1016 / 0951-8320 (96) 00002-6 )
  26. Saltelli, A., K. Chan e M. Scott (a cura di) (2000). Analisi della sensibilità . Serie di Wiley in probabilità e statistica. New York: John Wiley and Sons.
  27. Alexandre Janon , Thierry Klein , Agnès Lagnoux e Maëlle Nodet , "  Normalità asintotica ed efficienza di due stimatori dell'indice di Sobol  ", ESAIM: Probability and Statistics , vol.  18,gennaio 2014, p.  342-364 ( ISSN  1292-8100 e 1262-3318 , DOI  10.1051 / ps / 2013040 , letto online , accesso 20 novembre 2017 )
  28. Andrea Saltelli , Paola Annoni , Ivano Azzini e Francesca Campolongo , “  Analisi della sensibilità basata sulla varianza dell'output del modello. Progettazione e stima per l'indice di sensibilità totale  ", Computer Physics Communications , vol.  181, n o  21 ° febbraio 2010, p.  259-270 ( DOI  10.1016 / j.cpc.2009.09.018 , letto online , accesso 20 novembre 2017 )
  29. Art B. Owen , "  Better Stimation of Small Sobol 'Sensitivity Indices  " , ACM Trans. Modello. Comput. Simul. , vol.  23, n o  2maggio 2013, p.  11: 1-11: 17 ( ISSN  1049-3301 , DOI  10.1145 / 2457459.2457460 , letto online , accesso 20 novembre 2017 )
  30. Max D. Morris , "  Factorial Sampling Plans for Preliminary Computational Experiments  " , Technometrics , vol.  33, n o  21 ° maggio 1991, p.  161–174 ( ISSN  0040-1706 , DOI  10.1080 / 00401706.1991.10484804 , letto online , accesso 20 novembre 2017 )
  31. Bruno Sudret , "  Analisi della sensibilità globale utilizzando espansioni caos polinomiali  ", Reliability Engineering & System Safety , bayesian Networks in Dependability, vol.  93, n o  7,1 ° luglio 2008, p.  964–979 ( DOI  10.1016 / j.ress.2007.04.002 , letto online , accesso 20 novembre 2017 )

link esterno

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">