|
Projection
Pursuit esplorativa
La
ricerca sul metodo projection pursuit è confluita inzialmente in una
rassegna critica delle soluzioni proposte in letteratura per la scelta dei
diversi indici di proiezione (nella interpretazione più diffusa della
projection pursuit rivolta alla ricerca delle proiezioni massimamente
distanti dalla normalità distributiva) accompagnata da alcuni
controesempi, sviluppati su dati reali e su dati simulati, che hanno
mostrato l'inconsistenza di alcune soluzioni correntemente adottate. Dalla
constatazione della parziale inefficienza della versione classica della
projection pursuit per il riconoscimento di cluster nei dati, ho poi
proposto una reinterpretazione del metodo come ricerca delle proiezioni
non unimodali introducendo nella metodologia della projection pursuit
alcune note statistiche per il controllo dellipotesi di unimodalità. Più
recentemente
sfruttando l’insensibilità
alla presenza di variabili non informative del metodo Projection
Pursuit, ho suggerito un suo impiego quale criterio di selezione delle
variabili nell’ambito di problemi di classificazione (CSDA). Mi sono poi
occupata del ruolo della projection pursuit nell’analisi discriminante
lineare proponendo un nuovo criterio che si avvale della probabilità di
transvariazione di Gini quale misura della separazione tra due gruppi.
Analisi
delle componenti indipendenti (ICA)
L'analisi
delle componenti indipendenti (ICA) è un recente metodo di analisi
multivariata proposto nella
letteratura ingegneristica per lo studio dei processi di segnale. Uno
dei contributi più recenti riguarda riguarda
lo studio critico di analogie e differenze concettuali fra il metodo
projection pursuit, nella sua accezione classica. A fronte della convergenza delle soluzioni tecniche
adottate dai due metodi ho evidenziato differenze sostanziali nel loro
significato: strumento per la trasformazione delle variabili il primo,
modello a variabili latenti per di esse il secondo.
Analisi
dei fattori indipendenti (IFA)
Il modello ICA presuppone tante variabili latenti
quante sono le variabili osservate e questo risulta un forte limite in
molti contesti applicativi. Per ovviare a ciò è stato recentemente
proposto, sempre nell’ambito dei processi di segnale, un modello a
fattori indipendenti IFA che
presenta notevoli legami con il modello fattoriale classico. Un
ampio lavoro recente è stato dedicato a una rilettura in ottica
statistica del modello a fattori indipendenti, con particolare attenzione
agli aspetti di identificazione e stima, e ad alcuni sviluppi sulla scelta del numero dei fattori.
Analisi
discriminanti lineare e transvariazione
In
un lavoro recente mi sono occupata del
ruolo della projection pursuit nell’analisi discriminante lineare
proponendo un nuovo criterio che si avvale della probabilità di
transvariazione di Gini quale misura della separazione tra due gruppi. In
particolare ho mostrato come le direzioni discriminanti lineari rispetto
alle quali le misure di transvariazione raggiungono il minimo coincidano
con quelle ottenute ottimizzando il criterio di Fisher sotto particolari
modelli distributivi, e come alcune di esse mostrino una migliore capacità
discriminatoria, quando le condizioni che garantiscono l’ottimalità
della funzione di Fisher vengono meno e in presenza di dati anomali.
Corrado
Gini e l'analisi statistica multivariata
Dallo
studio delle misure di transvariazione in particolare, e più in generale
delle opere di Corrado Gini, è nata l’idea di rintracciare, nella vasta
bibliografia, i contributi dell’Autore che possono trovare, o hanno
trovato, impiego nell’ambito dell’analisi multivariata moderna
caratterizzata, in larga misura, dal tentativo di superare il problema
dello spazio vuoto (molte variabili osservate) attraverso la scomposizione
di un problema multivariato in una sequenza di particolari problemi
univariati. I primi risultati di questo studio critico sono stati oggetto
di una relazione invitata alla 26th
Annual Conference of the Gesellschaft fur Klassification, Mannheim, luglio
2002, e pubblicati negli atti del convegno per i tipi della Springer; una
versione estesa è stata sottoposta
per la pubblicazione.
Metodi
di partizione ricorsiva
Una
ulteriore linea di ricerca ha riguardato l’impiego dei metodi di
partizione ricorsiva, ampiamente illustrati nella letteratura per
affrontare problemi di regressione e classificazione, anche nello studio
di dati multidimensionali longitudinali con covariate tempo dipendenti,
per l’analisi della sopravvivenza e per la costruzione di modelli di
regressione non parametrica.
|