Project Work in R - Un’indagine sui Musei in Italia nel 2022

Introduzione

L’indagine su “Musei e le istituzioni similari” è stata realizzata nella cornice del “Protocollo d’intesa per lo sviluppo del sistema informativo integrato su istituti e luoghi di cultura” siglato dall’Istat, il Ministero della Cultura (MiC), le Regioni e le Province autonome di Trento e di Bolzano il 06.12.2017. La rilevazione, a carattere censuario, è stata effettuata attraverso la compilazione di questionari online da parte dei responsabili di ciascuna unità presente nella lista di partenza ed ha interessato tutti gli istituti pubblici e privati, statali e non statali, di diversa tipologia e dimensione, aperti al pubblico nell’anno 2022 purché con modalità di fruizione regolamentata e organizzata. In particolare, per definire le unità statistiche oggetto d’analisi occorre far riferimento alla definizione dell’International Council of Museums (ICOM), secondo la quale “Il museo è un’istituzione permanente, senza scopo di lucro, al servizio della società, e del suo sviluppo, aperta al pubblico, che effettua ricerche sulle testimonianze materiali ed immateriali dell’uomo e del suo ambiente, le acquisisce, le conserva, e le comunica e specificatamente le espone per scopi di studio, educazione e diletto”. Ai fini dell’indagine è stata considerata eleggibile ogni struttura che possiede i seguenti requisiti: 1) Espone in modo permanente beni e/o collezioni di interesse culturale, artistico, storico e/o naturalistico; 2) È aperta al pubblico nell’anno di riferimento; 3) È dotata di forme organizzate di fruizione.

1. Raccolta dei Dati, Data Exploration e Data Cleaning

1.1 Raccolta dei Dati

Sulla base dei dati ufficiali messi a disposizione da Istat, sono state contattate diverse migliaia di strutture museali e istituzioni similari presenti sul territorio nazionale, al fine di definire l’universo di osservazione per l’indagine statistica dell’anno 2022. Tra queste, risultavano eleggibili, ossia in possesso dei requisiti necessari per rientrare nel perimetro della rilevazione, circa 4.900 strutture. A tale numero contribuivano anche le realtà rilevate autonomamente dalla Conferenza Episcopale Italiana, per quanto riguarda le strutture ecclesiastiche, e dall’Astat. Una parte delle strutture contattate non è stata inclusa nell’universo osservato perché non rispondente ai criteri richiesti, in quanto non aperta al pubblico, non musealizzata o ancora in fase progettuale. Al termine delle operazioni di verifica e validazione, risultavano effettivamente attive e aperte alla pubblica fruizione 4.416 strutture relative a istituzioni museali su scala nazionale. L’Istat ha condotto la rilevazione a carattere censuario tra fine marzo e fine giugno 2023, inviando le credenziali e le password del questionario online, tramite invio postale, per posta certificata o per mail, ai direttori/responsabili dei musei e istituti similari a carattere museale: l’a rilevazione’indagine è stata condotta attraverso questionari a risposta chiusa, con opzioni predefinite codificate in formato alfanumerico, al fine di garantire l’omogeneità e la standardizzazione dei dati raccolti. Il dataset risultante è un file in formato .txt liberamente consultabile attraverso il sito ufficiale dell’Istat (https://www.istat.it).

1.2 Data Exploration

Il dataset originale comprende 4.416 osservazioni relative a 113 variabili. Ciascuna unità statistica corrisponde a una singola struttura museale presente sul territorio italiano. Le colonne del dataset, in linea con la struttura dei questionari somministrati, sono prevalentemente di tipo alfanumerico, in quanto riportano le codifiche delle risposte chiuse, fatta eccezione per alcune variabili numeriche come il numero di visitatori e le percentuali di visitatori italiani e stranieri. Un primo controllo esplorativo tramite le funzioni summary(), dim() e str() rivela la presenza di formati incoerenti o errati, che compromettono la corretta interpretazione delle variabili e generano statistiche descrittive non affidabili. Tale situazione conferma la necessità di un accurato processo di pulizia preliminare del dataset.

1.3 Scelta delle variabili e Data Cleaning

La selezione preliminare delle variabili si concentra su quelle ritenute più rilevanti ai fini dell’analisi, in quanto forniscono informazioni di contesto territoriale (Regione, Provincia, Comune), identificative (Denominazione del museo), strutturali (Tipologia, Categoria, Gestione) e relative alla fruizione (gratuità, digitalizzazione) e al numero di visitatori. Inoltre -da un primo confronto con le altre escluse- tali variabili presentano una percentuale di valori mancanti contenuta rispetto alla dimensione complessiva del dataset, garantendo una base informativa più solida per le successive elaborazioni. Le variabili scelte vengono quindi rinominate con etichette più intuitive e leggibili. Successivamente si interviene sulla formattazione dei dati, uniformando i formati e trattando correttamente i valori mancanti: in particolare, vengono ricodificati come NA i valori non disponibili o errati (come “.” o “N.D.”), le variabili categoriali vengono convertite in fattori e le variabili numeriche in formato intero, previa rimozione di eventuali spazi o simboli anomali. Inoltre, a partire dalle percentuali rilevate, abbiamo creato due nuove variabili (numero di visitatori italiani e stranieri per ciascuna struttura). La correttezza della trasformazione viene infine verificata tramite le funzioni str() e sapply() per controllare il tipo di variabili e la gestione dei valori mancanti, assicurandosi che siano riconosciuti correttamente da R come NA.

Vengono infine applicate etichette descrittive alle variabili, al fine di facilitare la lettura e l’interpretazione dei dati, nonché per consentire la corretta conversione delle codifiche alfanumeriche in fattori, migliorando così la qualità e la comprensione del dataset per le analisi successive.

2. Esplorazione della variabile quantitativa Visitatori Totali

2.1 Analisi della distribuzione della variabile Visitatori Totali

La distribuzione della variabile Visitatori Totali nei musei analizzati evidenzia una forte concentrazione di valori bassi, con pochissimi casi estremamente elevati. Il primo quartile si attesta su 500 visitatori, il che significa che il 25% dei musei ha accolto meno di 500 persone. La mediana è pari a 2.252 visitatori. La media, collocandosi su un valore molto più elevato della mediana e pari a 24.782 visitatori, segnala un’importante asimmetria: poche strutture con afflussi eccezionalmente elevati influenzano in modo significativo la media complessiva. Il valore elevatissimo della deviazione standard (168.937,8), a fronte di una media relativamente molto più bassa, è coerente con la presenza di alta variabilità nella distribuzione (range: 5,8 milioni). Il terzo quartile (pari a 9.211 visitatori) è ancora molto lontano dal valore massimo osservato.

L’analisi grafica conferma quanto emerso dai dati numerici: - Il boxplot risulta fortemente compresso nella parte bassa del grafico, con numerosi outlier visibili sopra il limite superiore, a testimonianza dell’estrema variabilità e della presenza di valori anomali molto elevati e distanti dai quartili. - L’istogramma con curva di densità evidenzia una distribuzione con coda lunga verso destra, caratteristica tipica delle variabili con concentrazione di valori bassi e pochi picchi elevati.

Dal punto di vista statistico, i valori calcolati di asimmetria (Skewness) e Curtosi confermano questa lettura: la Skewness è pari a 21,84, un valore estremamente elevato, che indica una distribuzione fortemente sbilanciata a destra, con pochi musei che registrano numeri di visitatori eccezionali rispetto alla media, mentre la Curtosi, pari 603,38, rivela una distribuzione con code molto pesanti e una forte presenza di valori estremi, ben oltre i normali limiti di una distribuzione gaussiana. D’altra parte, all’estremo opposto, la presenza di alcuni piccoli musei attestati a 0 visitatori potrebbe segnalare chiusure temporanee dovute a eventi particolari (restauro, manutenzione) o errori nella rilevazione/raccolta dati alla fonte con perdita d’informazione.

In sintesi, i dati mostrano una situazione in cui la maggior parte dei musei registra afflussi contenuti, mentre poche strutture di richiamo internazionale attraggono volumi di visitatori enormemente superiori alla media, generando così una distribuzione estremamente asimmetrica e con forte presenza di outlier.

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##       0     500    2252   24782    9211 5832996      62
## Deviazione standard: 168937.8
## Minimo: 0
## Massimo: 5832996
## Range (Max - Min): 5832996

2.2 Suddivisione del dataset in 5 classi di grandezza

Fatte le precisazioni del paragrafo precedente, abbiamo perciò ritenuto opportuno suddividere il dataset in cinque sottogruppi, accorpando i musei in: musei piccoli, musei medio-piccoli, musei medi, musei medio-grandi e musei grandi. La scelta del numero di classi è stata arbitraria, così come lo sono state anche le soglie che determinano l’appartenenza di un museo a una classe piuttosto che a un’altra. Abbiamo cercato di bilanciare il numero di musei per classe, limitando al contempo la presenza di outlier. L’obiettivo era ottenere classi il più possibile omogenee dal punto di vista della distribuzione. Questo, naturalmente, risulta più difficile per le classi agli estremi: musei piccoli include diversi casi con visitatori pari a zero, mentre musei grandi comprende i principali musei italiani, con numeri che arrivano a milioni di visitatori.

In parallelo, abbiamo anche creato una variabile logaritmica del numero di visitatori, nel tentativo di rendere la distribuzione dei dati più vicina alla normalità.

La trasformazione logaritmica del numero di visitatori migliora la distribuzione, ma non risolve del tutto il problema degli outlier. Tuttavia, contribuisce in modo significativo a ridurre la varianza, rendendo i dati più gestibili per le analisi statistiche.

3 Distribuzione dei Musei sul Territorio nazionale

3.1 Distribuzione dei Musei nelle Regioni con evidenza della Città con più Musei per ciascuna Regione

Il grafico mostra la distribuzione totale dei musei per ciascuna Regione italiana, evidenziando in modo distinto il contributo della città con il maggior numero di musei all’interno di ogni Regione. La barra grigia rappresenta il totale dei musei presenti nella Regione, mentre la porzione colorata indica il contributo della città con più musei (qui rinominata Top Città) rispetto al totale regionale.

Dalla tabella e dal grafico emerge che, salvo poche eccezioni, la città con il maggior numero di musei coincide con il capoluogo di Regione. Roma è la città con più musei in Italia e registra anche il contributo più rilevante sul totale regionale: 101 musei su 302 presenti nel Lazio. La Toscana, prima Regione per numero complessivo di musei (530), mostra invece una distribuzione più diffusa sul territorio, con Firenze che ospita 63 musei, pari a una quota meno concentrata rispetto ad altre Regioni.

Distribuzione dei Musei per Regione e per Città principale
Regione Città principale Totale Musei N. Musei nella Top Città Numero Musei nelle altre Città
Toscana Firenze 530 63 467
Emilia-Romagna Bologna 456 43 413
Lombardia Milano 401 51 350
Piemonte Torino 358 37 321
Lazio Roma 302 101 201
Veneto Venezia 290 36 254
Sardegna Cagliari 263 15 248
Marche Pesaro 258 11 247
Campania Napoli 213 40 173
Sicilia Palermo 211 26 185
Trentino-Alto Adige Bolzano 194 16 178
Liguria Genova 165 32 133
Umbria Perugia 156 21 135
Friuli-Venezia Giulia Trieste 149 31 118
Puglia Bari 131 9 122
Calabria Reggio di Calabria 127 7 120
Abruzzo L’Aquila 91 6 85
Valle d’Aosta/Vallee d’Aoste Aosta 48 6 42
Basilicata Matera 38 8 30
Molise Campobasso 35 4 31

3.2 Distribuzione dei Musei nelle Regioni: frequenze relative percentuali

In termini percentuali, la Toscana è la Regione con il maggior numero di musei, rappresentando circa il 12% del totale nazionale, seguita da Emilia-Romagna e Lombardia. La Campania risulta la prima Regione del Sud, posizionandosi al nono posto complessivo.

3.3 Distribuzione dei Musei nelle Top Città: distribuzione delle frequenze relative percentuali regionali.

In termini percentuali, Roma è la città con il maggior numero di musei rispetto al totale della propria Regione, seguita da Matera, Trieste e Genova. In questi casi, la concentrazione di musei nella principale città regionale è particolarmente elevata, indicando una forte centralizzazione dell’offerta culturale. Al contrario, le città con il minor contributo percentuale al totale regionale risultano essere Cagliari, Reggio Calabria e Pesaro, dove la distribuzione dei musei è più diffusa sul territorio o il capoluogo ha un peso meno rilevante.

3.4 Distribuzione dei Musei nelle Top Città: frequenze relative percentuali.

In termini di frequenze relative percentuali, il contributo delle singole Top Città sul totale nazionale dei musei mostra che Roma detiene la quota più alta con il 2,29%, seguita da Firenze con l’1,43% e Milano con l’1,15%. L’aggregato delle 20 Top Città copre complessivamente il 12,76% dell’intera offerta museale italiana, evidenziando una significativa concentrazione di musei in alcune aree urbane di rilievo.

Distribuzione Percentuale dei Musei: Contributo delle Top Città e Altri Comuni
Top Città % Musei nella Top Città su Totale Italia % Musei negli Altri Comuni su Totale Italia
Roma 2.29% 4.55%
Firenze 1.43% 10.58%
Milano 1.15% 7.93%
Bologna 0.97% 9.35%
Napoli 0.91% 3.92%
Torino 0.84% 7.27%
Venezia 0.82% 5.75%
Genova 0.72% 3.01%
Trieste 0.70% 2.67%
Palermo 0.59% 4.19%
Perugia 0.48% 3.06%
Bolzano 0.36% 4.03%
Cagliari 0.34% 5.62%
Pesaro 0.25% 5.59%
Bari 0.20% 2.76%
Matera 0.18% 0.68%
Reggio di Calabria 0.16% 2.72%
L’Aquila 0.14% 1.92%
Aosta 0.14% 0.95%
Campobasso 0.09% 0.70%

4 Distribuzione dei Visitatori museali sul Territorio nazionale

4.1 Distribuzione dei Visitatori nelle Regioni con evidenza della Città più visitata per ciascuna Regione

In termini di numero di visitatori, il Lazio si conferma nettamente la prima Regione italiana. Come evidenziato dalla tabella e dal grafico, il contributo di Roma risulta determinante, rappresentando una quota pressoché esclusiva del totale regionale. È interessante notare come, considerando il parametro dei visitatori, alcune Top Città siano cambiate rispetto alla classificazione basata sul numero di musei. Ad esempio, Andria in Puglia, Bard in Valle d’Aosta e Orvieto in Umbria emergono ora come le città con il maggior numero di visitatori nelle rispettive regioni. Questa alternativa definizione di Top Città, basata sul maggior numero di visitatori per Regione, offre una visione più precisa e aggiornata dell’importanza culturale delle città all’interno del territorio.

Distribuzione dei Visitatori per Regione e per Città principale
Regione Città principale Totale Visitatori Visitatori nella Top Città Visitatori nelle altre Città
Lazio Roma 25.803.001 23.305.990 2.497.011
Toscana Firenze 18.433.094 9.568.232 8.864.862
Campania Napoli 11.545.349 5.406.420 6.138.929
Lombardia Milano 9.034.736 5.031.697 4.003.039
Veneto Venezia 8.643.756 4.096.499 4.547.257
Piemonte Torino 6.884.598 3.514.342 3.370.256
Emilia-Romagna Ravenna 6.356.267 1.835.023 4.521.244
Sicilia Palermo 5.566.072 1.009.810 4.556.262
Trentino-Alto Adige Trento 2.954.736 497.222 2.457.514
Friuli-Venezia Giulia Trieste 2.298.074 1.495.511 802.563
Umbria Orvieto 1.906.823 727.074 1.179.749
Sardegna Arzachena 1.868.448 139.460 1.728.988
Marche Urbino 1.368.639 296.497 1.072.142
Liguria Genova 1.206.545 653.673 552.872
Valle d’Aosta/Vallee d’Aoste Bard 1.152.773 516.000 636.773
Puglia Andria 1.091.492 224.136 867.356
Calabria Reggio di Calabria 906.177 226.823 679.354
Abruzzo L’Aquila 439.254 59.711 379.543
Basilicata Matera 311.079 131.124 179.955
Molise Campobasso 129.039 39.443 89.596

4.2 Distribuzione dei Visitatori nelle Regioni: frequenze relative percentuali

Analizzando la distribuzione percentuale dei visitatori museali, emerge chiaramente come oltre la metà del flusso totale sia concentrata nelle regioni Lazio, Toscana e Campania, a testimonianza del forte richiamo culturale e turistico di queste aree. Al contrario, il contributo delle regioni Abruzzo, Basilicata e Molise risulta molto contenuto, rappresentando una quota decisamente marginale nel panorama complessivo della fruizione museale italiana.

4.3 Distribuzione dei Visitatori nelle Top Città: distribuzione delle frequenze relative percentuali regionali

Come già intuibile, la maggior parte dei visitatori nel Lazio è concentrata a Roma, che da sola attrae nove visitatori su dieci nella Regione. Particolarmente rilevante è anche il contributo di città come Trieste e Milano, che si distinguono nelle rispettive Regioni per il numero di visitatori museali. Invece, tra le Top Città per visitatori, Arzachena in Sardegna registra il contributo più contenuto.

4.4 Distribuzione dei Visitatori nelle Top Città: frequenze relative percentuali

Infine, analizzando le frequenze relative percentuali dei visitatori sul territorio nazionale, emerge un quadro piuttosto diverso rispetto alla distribuzione dei musei nelle Top Città (paragrafo 3.4). In questo caso, la concentrazione è fortemente sbilanciata a favore di Roma, che da sola rappresenta il 21,6% del totale dei visitatori museali in Italia, seguita a distanza da Firenze e Milano. Un aspetto interessante riguarda la distribuzione interna alla Regione: mentre nel Lazio il turismo museale è quasi esclusivamente concentrato nella Capitale, in regioni come Toscana e Campania la percentuale di visitatori che scelgono le Top Città è più bilanciata rispetto a quella di chi preferisce altre mete culturali all’interno della stessa Regione. Questo suggerisce dinamiche diverse di attrattività e di domanda culturale tra le diverse aree territoriali.

Distribuzione Percentuale dei Visitatori: Contributo della Città Principale e degli Altri Comuni
Città Principale % Visitatori nella Città Principale su Totale Italia % Visitatori negli Altri Comuni su Totale Italia
Roma 21.60% 2.31%
Firenze 8.87% 8.22%
Napoli 5.01% 5.69%
Milano 4.66% 3.71%
Venezia 3.80% 4.21%
Torino 3.26% 3.12%
Ravenna 1.70% 4.19%
Trieste 1.39% 0.74%
Palermo 0.94% 4.22%
Orvieto 0.67% 1.09%
Genova 0.61% 0.51%
Bard 0.48% 0.59%
Trento 0.46% 2.28%
Urbino 0.27% 0.99%
Reggio di Calabria 0.21% 0.63%
Andria 0.21% 0.80%
Arzachena 0.13% 1.60%
Matera 0.12% 0.17%
L’Aquila 0.06% 0.35%
Campobasso 0.04% 0.08%

5. Distribuzione dei Musei Pubblici e Privati per Modalità di Accesso (Gratuito o a Pagamento)

Per quanto riguarda questa analisi, il mosaic plot mostra già in maniera chiara che sebbene la quota di musei pubblici sia differente dalla quota di musei privati, la proporzione di musei con accesso gratuito o a pagamento è abbastanza simile tra le due gestioni. Questa visualizzazione ci aiuta a capire che non c’è una forte differenza tra i musei pubblici e privati riguardo alla modalità di accesso: la distribuzione tra gratuito e pagamento è sostanzialmente equilibrata all’interno di entrambe le categorie.

5.1 Test del Chi-quadro per approfondire la relazione tra Musei Pubblici-Privati e Modalità di Accesso

Per approfondire l’analisi, eseguiamo un test del Chi-quadro che mostra il seguente risultato:

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tab_gestione_accesso
## X-squared = 0.37204, df = 1, p-value = 0.5419
Frequenze attese: accesso x gestione
Accesso completamente gratuito Previste forme di pagamento
Pubblico 1235 1618
Privato 658 862

L’alto p-value (0.5419) e il basso valore del Chi-quadro indicano che non c’è evidenza di una relazione significativa tra la gestione (pubblica/privata) e il tipo di accesso (gratuito/a pagamento). In altre parole, il test conferma che la distribuzione dei musei pubblici e privati non differisce in modo statisticamente significativo per quanto riguarda la gratuità o meno dell’accesso.

6 Relazione tra Distribuzione dei Musei Pubblici-Privati e Categoria

Il grafico a barre mostra la distribuzione dei musei suddivisi per categoria e tipologia di gestione. Si osserva chiaramente come le aree archeologiche siano principalmente gestite da enti pubblici, rappresentando la maggior parte delle barre in questa categoria per la gestione pubblica. Al contrario, le altre categorie di musei tendono a essere più bilanciate. Questa distribuzione suggerisce che la tipologia di gestione varia sensibilmente in base alla categoria museale, con alcune categorie fortemente associate alla gestione pubblica, mentre altre mostrano una composizione più equilibrata tra pubblico e privato.

6.1 Test del Chi-quadro per approfondire la relazione tra la Distribuzione dei Musei Pubblici-Privati e Categoria

Per approfondire l’analisi, eseguiamo un test del Chi-quadro che mostra il seguente risultato:

## 
##  Pearson's Chi-squared test
## 
## data:  tab_gestione_categoria
## X-squared = 121.03, df = 2, p-value < 2.2e-16
Frequenze attese: gestione x categoria
Museo/Galleria Area Archeologica Monumento
Pubblico 2204.5 193.7 471.8
Privato 1187.5 104.3 254.2

Il test del Chi-quadro mostra un’associazione statisticamente significativa tra la tipologia di gestione (pubblica o privata) e la categoria del museo (χ² = 121.03, df = 2, p < 0.05). Questo indica che la distribuzione delle categorie museali non è indipendente dalla gestione.

La forte predominanza pubblica delle aree archeologiche contribuisce in modo rilevante all’associazione osservata, suggerendo — in linea con le informazioni emerse dal grafico precedente — che alcune categorie di musei tendano ad essere gestite quasi esclusivamente da enti pubblici.

7 Distribuzione dei Musei Pubblici-Privati per Tipologia

Ogni categoria museale è suddivisa in ulteriori tipologie. Quando un museo non rientra perfettamente in nessuna delle tipologie elencate, l’Istat lo colloca in “Altro Tipo”, indicando tra parentesi la categoria di appartenenza. Per rendere il grafico più leggibile, abbiamo quindi scelto di posizionare tutte le voci “Altro Tipo” in fondo all’elenco.

Dal grafico emerge una netta predominanza della gestione pubblica nelle tipologie legate all’ambito archeologico, come le aree archeologiche e i parchi archeologici. Al contrario, si osserva una prevalenza di musei a gestione privata nelle categorie legate al patrimonio religioso e al culto, confermando una distinzione nella gestione in funzione della natura e della finalità dei musei stessi.

8 Distribuzione delle Categorie per Visitatori nelle varie classi di grandezza museale

Il grafico seguente mostra la distribuzione delle tre categorie in ciascuna classe dimensionale del dataset. Da un’analisi visiva preliminare emerge una differenza tra le distribuzioni dei visitatori nelle tre categorie all’interno dei musei di dimensioni piccole e grandi. In particolare, nei musei piccoli la categoria “Area/Parco Archeologico” presenta una distribuzione con valori di visitatori tendenzialmente più elevati, evidenziata da una mediana che si avvicina maggiormente al terzo quartile rispetto alle altre due categorie.

8.1 Test della normalità

Per avere una immagine più chiara della eventuale differenza nella distribuzione dei musei per categoria all’interno delle varie classi, attuiamo un’analisi preliminare che capire la distribuzione dei dati per poi scegliere l’analisi statistica più appropriata.

Per il test sulla normalità preliminare all’ANOVA, utilizziamo il test Kolmogorov-Smirnov perchè il dataset non è sufficientemente piccolo per utilizzare il test Shapiro.

Visualizziamo i risultati graficamente:

Nonostante il tentativo di normalizzazione applicato il precedenza, i risultati del test Kolmogorov-Smiknov rifiutano l’ipotesi della normalità della distribuzione per ogni campione del sottogruppo di riferimento. La visualizzazione grafica del QQ-plot aiuta a comprendere visivamente che non c’è normalità in nessuna delle categorie di ciascun sottogruppo.

Venendo a mancare il primo presupposto per applicare una ANOVA, dovremo procedere con un test non parametrico.

8.2 Test dell’omogeneità delle varianze

Per completezza, calcoliamo anche il test sull’omogeneità delle varianze (Bartlett test).

## 
##  Bartlett test of homogeneity of variances
## 
## data:  musei_grandi$Visitatori_Totali by musei_grandi$Categoria
## Bartlett's K-squared = 92.77, df = 2, p-value < 2.2e-16
## 
##  Bartlett test of homogeneity of variances
## 
## data:  musei_medio_grandi$Visitatori_Totali by musei_medio_grandi$Categoria
## Bartlett's K-squared = 1.2081, df = 2, p-value = 0.5466
## 
##  Bartlett test of homogeneity of variances
## 
## data:  musei_medi$Visitatori_Totali by musei_medi$Categoria
## Bartlett's K-squared = 2.6834, df = 2, p-value = 0.2614
## 
##  Bartlett test of homogeneity of variances
## 
## data:  musei_medio_piccoli$Visitatori_Totali by musei_medio_piccoli$Categoria
## Bartlett's K-squared = 2.8373, df = 2, p-value = 0.242
## 
##  Bartlett test of homogeneity of variances
## 
## data:  musei_piccoli$Visitatori_Totali by musei_piccoli$Categoria
## Bartlett's K-squared = 3.7559, df = 2, p-value = 0.1529

I risultati del test di Bartlett indicano un quadro abbastanza omogeneo, con un’unica eccezione rilevante. L’elevato numero di visitatori nei musei più importanti fa sì che nel sottogruppo musei grandi si verifica una varianza eccessivamente disomogenea tra ogni categoria perché si soddisfino l’ipotesi di omogeneità delle varianze per il test di Bartlett. Il p‑value estremamente piccolo (< 0,05) segnala che le varianze dei visitatori totali differiscono in modo marcato fra le tre categorie (museo/galleria, parco archeologico, monumento). In questa fascia, quindi, l’assunzione di omogeneità delle varianze richiesta dall’ANOVA classica non è soddisfatta. In tutte le altre classi dimensionali i p‑value sono ben al di sopra della soglia di 0,05. Di conseguenza non abbiamo evidenza statistica di varianze differenti tra le categorie: l’ipotesi di omogeneità non viene rifiutata e l’ANOVA standard resterebbe teoricamente appropriata se ci fosse stata normalità nella distribuzione.

Verificato che mancano i prerequisiti necessari all’applicazione dell’ANOVA, proseguiamo con un test non parametrico.

8.3 Kruskal-Wallis

## 
##  Kruskal-Wallis rank sum test
## 
## data:  musei_grandi$Visitatori_Totali by musei_grandi$Categoria
## Kruskal-Wallis chi-squared = 3.1176, df = 2, p-value = 0.2104
## 
##  Kruskal-Wallis rank sum test
## 
## data:  musei_medio_grandi$Visitatori_Totali by musei_medio_grandi$Categoria
## Kruskal-Wallis chi-squared = 1.8557, df = 2, p-value = 0.3954
## 
##  Kruskal-Wallis rank sum test
## 
## data:  musei_medi$Visitatori_Totali by musei_medi$Categoria
## Kruskal-Wallis chi-squared = 11.244, df = 2, p-value = 0.003617
## 
##  Kruskal-Wallis rank sum test
## 
## data:  musei_medio_piccoli$Visitatori_Totali by musei_medio_piccoli$Categoria
## Kruskal-Wallis chi-squared = 0.64693, df = 2, p-value = 0.7236
## 
##  Kruskal-Wallis rank sum test
## 
## data:  musei_piccoli$Visitatori_Totali by musei_piccoli$Categoria
## Kruskal-Wallis chi-squared = 11.621, df = 2, p-value = 0.002996

È stato applicato il test non parametrico di Kruskal-Wallis per confrontare le distribuzioni del numero totale di visitatori tra le diverse categorie museali (Museo/Galleria, Area Archeologica, Monumento) all’interno di ciascuna classe di grandezza.

I risultati indicano che:

  • Per le classi “medi” e “piccoli”, si osserva una differenza statisticamente significativa tra le distribuzioni dei visitatori nelle tre categorie museali (p < 0.05). Questo suggerisce che, in queste classi dimensionali, la categoria museale influisce in modo rilevante sulla frequenza di visita.

  • Per le altre classi (grandi, medio-grandi, medio-piccoli), il test non evidenzia differenze statisticamente significative (p > 0.05). Non possiamo perciò rifiutare l’ipotesi di uguaglianza tra le mediane tra le categorie museali.

8.4 Pairwise Wilcoxon Test

Proseguiamo andando a esplorare le differenze tra categoria, nelle classi musei “medi” e “piccoli”, dove il test precedente ha evidenziato differenze tra mediane.

## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_medi$Visitatori_Totali and musei_medi$Categoria 
## 
##                   Museo/Galleria Area Archeologica
## Area Archeologica 1.0000         -                
## Monumento         0.0026         0.1607           
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_piccoli$Visitatori_Totali and musei_piccoli$Categoria 
## 
##                   Museo/Galleria Area Archeologica
## Area Archeologica 0.0025         -                
## Monumento         1.0000         0.0066           
## 
## P value adjustment method: bonferroni

Per i “Musei medi” si osserva una differenza significativa nel numero di visitatori tra Musei/Gallerie e Monumenti/Complessi Monumentali, suggerendo una diversa attrattività tra queste due categorie. Non emergono invece differenze significative tra Musei e Aree Archeologiche, né tra Aree Archeologiche e Monumenti.

Per quanto riguarda i “Musei piccoli” le Aree/ Parchi Archeologici si distinguono sia dai Musei/Gallerie sia dai Monumenti, indicando che il loro numero di visitatori segue una distribuzione mediana diversa. Nessuna differenza significativa tra Musei e Monumenti.

8.5 Visualizzazione grafica differenze del pairwise

9 Distribuzione Pubblico-Privato per Visitatori

Confronto visuale del numero visitatori per gestione Pubblica e Privata per ciascuna classe di grandezza di museo.

9.1 Welch test su numero visitatori per gestione Pubblica o Privata

Per avere una immagine più chiara della eventuale differenza nella distribuzione dei musei per tipo di gestione all’interno delle varie classi applichiamo un Welch Two Sample t-test, che mostra se esistono differenze tra le medie all’interno di ogni sottoclasse di dimensione del museo.

Dato che la dimensione dei campioni per ogni sottoclasse è sufficientemente grande, grazie al Teorema del Limite Centrale la distribuzione della media campionaria tende ad essere approssimativamente normale, anche se i dati originali non lo sono. Pertanto, si può procedere con l’applicazione del Welch Two Sample t-test, che è appropriato anche quando le varianze e le dimensioni dei campioni sono diverse o non note.

## 
##  Welch Two Sample t-test
## 
## data:  musei_grandi_priv$Visitatori_Totali and musei_grandi_pubb$Visitatori_Totali
## t = -1.8696, df = 156.95, p-value = 0.06341
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -354598.958    9740.794
## sample estimates:
## mean of x mean of y 
##  318924.6  491353.7
## 
##  Welch Two Sample t-test
## 
## data:  musei_medio_grandi_priv$Visitatori_Totali and musei_medio_grandi_pubb$Visitatori_Totali
## t = 1.1308, df = 213.67, p-value = 0.2594
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -1772.047  6541.649
## sample estimates:
## mean of x mean of y 
##  52866.78  50481.98
## 
##  Welch Two Sample t-test
## 
## data:  musei_medi_priv$Visitatori_Totali and musei_medi_pubb$Visitatori_Totali
## t = 0.24651, df = 648.14, p-value = 0.8054
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -720.9917  928.0041
## sample estimates:
## mean of x mean of y 
##  11981.94  11878.43
## 
##  Welch Two Sample t-test
## 
## data:  musei_medio_piccoli_priv$Visitatori_Totali and musei_medio_piccoli_pubb$Visitatori_Totali
## t = 0.3831, df = 536.8, p-value = 0.7018
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -101.2778  150.3502
## sample estimates:
## mean of x mean of y 
##  3148.381  3123.845
## 
##  Welch Two Sample t-test
## 
## data:  musei_piccoli_priv$Visitatori_Totali and musei_piccoli_pubb$Visitatori_Totali
## t = -0.54233, df = 1571.9, p-value = 0.5877
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -59.16873  33.53666
## sample estimates:
## mean of x mean of y 
##  629.4823  642.2983

Il test t di Welch non evidenzia alcuna differenza significativa nel numero medio di visitatori tra musei pubblici e privati in nessuna delle classi di grandezza in cui era stato suddiviso il dataset originale. L’intervallo di confidenza è ampio e comprende lo zero, il che non permette di escludere che la differenza tra le medie di visitatori tra musei pubblici e privati sia nulla.

Come dal grafico precedente non si evidenzia particolare differenza nella distribuzione e nel valore delle mediane per ogni sottoclasse di grandezza, ugualmente il test t di Welch suggerisce che anche il numero medio di visitatori per le due tipologie di gestione (pubblico - privato) non differisce in maniera significativa, il che indica che non si può escludere che le differenze osservate siano dovute al caso.

10 T-test su percentuale stranieri per classe dimensionale museo

Nell’ambito dell’analisi dei flussi turistici museali, la percentuale di visitatori stranieri rappresenta un indicatore rilevante per comprendere il grado di attrattività internazionale delle strutture. Al fine di approfondire il ruolo delle diverse tipologie museali rispetto al pubblico estero, si è condotto un confronto statistico tra gruppi di musei classificati per caratteristiche dimensionali o funzionali.

In particolare, l’obiettivo è verificare se esistono differenze significative nella media della percentuale di visitatori stranieri tra le diverse classi di musei. A tal fine, si è applicato un t test ad una coda per confrontare la percentuale media di turisti stranieri nei musei italiani con le percentuali medie calcolate nei vari sottogruppi.

## [1] "Media delle percentuali di visitatori stranieri per museo in Italia è: 21.49714"
## 
##  One Sample t-test
## 
## data:  musei_grandi$Percentuale_Stranieri
## t = 12.742, df = 170, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 21.49714
## 95 percent confidence interval:
##  36.8401     Inf
## sample estimates:
## mean of x 
##  39.12865
## 
##  One Sample t-test
## 
## data:  musei_medio_grandi$Percentuale_Stranieri
## t = 12.788, df = 316, p-value < 2.2e-16
## alternative hypothesis: true mean is greater than 21.49714
## 95 percent confidence interval:
##  31.89528      Inf
## sample estimates:
## mean of x 
##  33.43533
## 
##  One Sample t-test
## 
## data:  musei_medi$Percentuale_Stranieri
## t = 5.5967, df = 984, p-value = 1.416e-08
## alternative hypothesis: true mean is greater than 21.49714
## 95 percent confidence interval:
##  23.50807      Inf
## sample estimates:
## mean of x 
##  24.34619
## 
##  One Sample t-test
## 
## data:  musei_medio_piccoli$Percentuale_Stranieri
## t = -3.5471, df = 722, p-value = 0.9998
## alternative hypothesis: true mean is greater than 21.49714
## 95 percent confidence interval:
##  18.51701      Inf
## sample estimates:
## mean of x 
##  19.46196
## 
##  One Sample t-test
## 
## data:  musei_piccoli$Percentuale_Stranieri
## t = -11.699, df = 1826, p-value = 1
## alternative hypothesis: true mean is greater than 21.49714
## 95 percent confidence interval:
##  16.41861      Inf
## sample estimates:
## mean of x 
##  17.04488

Nei musei grandi, medio-grandi e medi, la percentuale media di visitatori stranieri è significativamente maggiore della media complessiva (circa 21.5%), con valori medi rispettivamente intorno al 39%, 33% e 24% (intervallo di confidenza al 95%). I p-value molto bassi confermano questa differenza.

Al contrario, per i musei medio-piccoli e piccoli, il test non rileva differenze significative in senso maggiore (p-value vicino a 1), quindi non si può rifiutare l’ipotesi nulla che afferma che la percentuale di stranieri sia minore o uguale di 21.5% in questi gruppi.

11 Digitalizzazione nei Musei e quota di Visitatori italiani e stranieri

I grafici seguenti mostrano la distribuzione di visitatori italiani e stranieri per livello di digitalizzazione dei beni esposti nei vari musei. Da una prima analisi emerge una situazione molto variegata che cambia a seconda delle dimensione dei musei.

11.1 Verifica prerequisti ANOVA

Per analizzare la relazione tra il numero di visitatori italiani e stranieri e la digitalizzazione, iniziamo verificando la normalità della distribuzione in ciascuna classe di grandezza, in modo da valutare la possibilità di applicare il test ANOVA.

Poiché anche in questo caso non viene soddisfatto il requisito della normalità, non possiamo procedere con l’ANOVA.

11.2 Kruskal-Wallis per visitatori stranieri

Per questa analisi, i dati sono stati suddivisi in due gruppi distinti: visitatori italiani e visitatori stranieri. Il test di Kruskal-Wallis è stato quindi applicato separatamente a ciascun gruppo per verificare se la digitalizzazione dei musei influisce in modo diverso sul numero medio di visitatori italiani rispetto a quello degli stranieri. Questa distinzione consente di valutare l’effetto della digitalizzazione in modo più preciso e mirato.

## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 12.327, df = 3, p-value = 0.006342
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 9.9903, df = 3, p-value = 0.01865
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 3.6439, df = 3, p-value = 0.3026
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 7.9363, df = 3, p-value = 0.04735
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 3.3244, df = 3, p-value = 0.3443

Analizzando i visitatori stranieri con il test di Kruskal-Wallis, emergono differenze significative nel numero medio di visitatori tra i vari livelli di digitalizzazione per alcune classi di musei. In particolare, per i musei di dimensioni piccole, medio-piccole e medio-grandi, il p-value è inferiore alla soglia di significatività convenzionale (0.05), indicando che la digitalizzazione ha un impatto rilevante sul numero di visitatori stranieri in queste categorie. Questo significa che almeno un livello di digitalizzazione si discosta significativamente dagli altri in termini di attrattività per i visitatori stranieri.

Al contrario, per i musei medi e grandi, il test non ha rilevato differenze significative, suggerendo che in queste categorie la digitalizzazione non modifica in modo significativo il numero di visitatori stranieri.

11.3 Kruskal-Wallis per visitatori italiani

## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 15.402, df = 3, p-value = 0.001503
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 13.448, df = 3, p-value = 0.003762
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 7.3197, df = 3, p-value = 0.06238
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 14.997, df = 3, p-value = 0.001819
## 
##  Kruskal-Wallis rank sum test
## 
## data:  Totale by Digitalizzazione
## Kruskal-Wallis chi-squared = 44.582, df = 3, p-value = 1.135e-09

L’analisi tramite il test di Kruskal-Wallis sui visitatori italiani evidenzia differenze significative nel numero medio di visitatori tra i diversi livelli di digitalizzazione per la maggior parte delle classi di musei considerate. In particolare, per le categorie piccoli, medio-piccoli, medio-grandi e grandi, i p-value risultano inferiori alla soglia convenzionale di significatività (0.05), indicando che la digitalizzazione influenza in modo rilevante il numero medio di visitatori italiani. Questo suggerisce che almeno uno dei livelli di digitalizzazione differisce significativamente dagli altri in termini di attrattività per il pubblico italiano.

Per la categoria dei musei medi, invece, il test non ha rilevato differenze significative (p-value > 0.05), indicando che in questa classe di musei la digitalizzazione non sembra influenzare il numero medio di visitatori italiani in modo statisticamente significativo.

11.4 Pairwise Wilcoxon test

Poiché il test di Kruskal-Wallis ha evidenziato differenze significative nel numero medio di visitatori per alcune categorie di musei, è utile approfondire l’analisi con confronti a coppie (pairwise) tra i diversi livelli di digitalizzazione.

## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_piccoli %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Totale) and musei_digitalizzazione_piccoli %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              0.018           -            
## No, non ancora                             0.164           1.7e-08      
## No, non disponeva di beni da digitalizzare 0.064           3.3e-07      
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 1.000         
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_piccoli %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Totale) and musei_digitalizzazione_piccoli %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              1.0             -            
## No, non ancora                             1.0             0.5          
## No, non disponeva di beni da digitalizzare 1.0             1.0          
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 1.0           
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_medio_piccoli %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Totale) and musei_digitalizzazione_medio_piccoli %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              1.000           -            
## No, non ancora                             0.076           0.002        
## No, non disponeva di beni da digitalizzare 0.925           0.183        
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 1.000         
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_medio_piccoli %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Totale) and musei_digitalizzazione_medio_piccoli %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              1.000           -            
## No, non ancora                             1.000           0.937        
## No, non disponeva di beni da digitalizzare 0.231           0.032        
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 0.709         
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_medi %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Totale) and musei_digitalizzazione_medi %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              1.000           -            
## No, non ancora                             0.441           0.041        
## No, non disponeva di beni da digitalizzare 1.000           1.000        
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 0.841         
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_medi %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Totale) and musei_digitalizzazione_medi %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              1.00            -            
## No, non ancora                             1.00            1.00         
## No, non disponeva di beni da digitalizzare 0.77            0.38         
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 1.00          
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_medio_grandi %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Totale) and musei_digitalizzazione_medio_grandi %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              0.406           -            
## No, non ancora                             0.029           0.722        
## No, non disponeva di beni da digitalizzare 0.022           0.177        
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 1.000         
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_medio_grandi %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Totale) and musei_digitalizzazione_medio_grandi %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              0.560           -            
## No, non ancora                             0.243           1.000        
## No, non disponeva di beni da digitalizzare 1.000           0.133        
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 0.025         
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_grandi %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Totale) and musei_digitalizzazione_grandi %>% filter(Nazionalita == "Totale_Italiani") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              1.0000          -            
## No, non ancora                             0.0047          0.0138       
## No, non disponeva di beni da digitalizzare 0.1476          0.2739       
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 1.0000        
## 
## P value adjustment method: bonferroni
## 
##  Pairwise comparisons using Wilcoxon rank sum test with continuity correction 
## 
## data:  musei_digitalizzazione_grandi %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Totale) and musei_digitalizzazione_grandi %>% filter(Nazionalita == "Totale_Stranieri") %>% pull(Digitalizzazione) 
## 
##                                            Si, interamente Si, una parte
## Si, una parte                              0.4707          -            
## No, non ancora                             0.0054          0.5234       
## No, non disponeva di beni da digitalizzare 0.1105          1.0000       
##                                            No, non ancora
## Si, una parte                              -             
## No, non ancora                             -             
## No, non disponeva di beni da digitalizzare 1.0000        
## 
## P value adjustment method: bonferroni

Dall’analisi dei risultati emerge un quadro articolato ma coerente, che permette di avanzare alcune ipotesi interpretative sul ruolo della digitalizzazione nei musei italiani e sulla sua relazione con la presenza di visitatori, sia italiani che stranieri.

In generale, la digitalizzazione appare associata a un aumento nel numero di visitatori italiani in quasi tutte le classi dimensionali considerate: dai musei piccoli a quelli medio-grandi. Questo suggerisce che la digitalizzazione delle opere abbia un impatto positivo sull’attrattività dell’istituzione per il pubblico nazionale.

Per quanto riguarda il turismo internazionale, tuttavia, la relazione positiva con la digitalizzazione emerge solo nei musei di dimensioni medio-grandi e grandi. Nei musei più piccoli o di dimensione intermedia, l’effetto sui visitatori stranieri è assente o non significativo. Questo dato può essere interpretato ipotizzando che l’effetto della digitalizzazione sul turismo straniero sia condizionato dalla notorietà pregressa del museo. In altre parole, la digitalizzazione di per sé può facilitare e incentivare l’ingresso, ma è verosimilmente efficace solo quando il museo è già noto al pubblico internazionale. I musei piccoli, spesso a carattere locale o poco pubblicizzati all’estero, non riescono a beneficiare appieno dei vantaggi della digitalizzazione in termini di attrazione turistica internazionale.

Si delinea dunque un’interpretazione secondo cui la digitalizzazione ha effetti differenti a seconda della scala e della visibilità del museo: nei piccoli e medio-piccoli rafforza l’afflusso interno, mentre nei grandi può contribuire concretamente all’attrazione di un pubblico internazionale. Non si tratta quindi di un effetto uniforme, ma piuttosto di una dinamica che dipende dalla sinergia tra strumenti digitali e condizioni strutturali preesistenti.

Occorre infine ricordare che i dati osservati indicano associazioni, non necessariamente rapporti di causa-effetto. È possibile, ad esempio, che musei già frequentati e ben finanziati siano anche quelli più propensi o capaci di digitalizzare.

Conclusioni

L’indagine statistica condotta sul dataset ISTAT 2022 ha permesso di analizzare in profondità il sistema museale italiano, mettendone in evidenza la complessità e le numerose variabili strutturali e territoriali che ne influenzano la fruizione. È emersa una forte disomogeneità nella distribuzione dei musei e dei visitatori, con concentrazioni marcate in alcune regioni e città, a conferma della centralizzazione dell’offerta culturale.

Le analisi inferenziali hanno evidenziato come la categoria museale e il livello di digitalizzazione abbiano un impatto statisticamente significativo sui flussi di visitatori. In particolare, la digitalizzazione rappresenta un potenziale fattore di valorizzazione, soprattutto nei musei medio-grandi e grandi, dove contribuisce ad attrarre un pubblico più ampio, anche internazionale. Al contrario, nei musei di dimensioni più ridotte, la digitalizzazione sembra influenzare in misura maggiore il pubblico italiano, senza incidere significativamente sulla componente straniera.

Il lavoro ha inoltre confermato che la differenza nei flussi di visitatori tra musei pubblici e privati non è statisticamente rilevante, a testimonianza del fatto che l’attrattività museale dipende più dalla categoria e dalle caratteristiche dell’offerta che dalla natura giuridica della gestione.

I risultati ottenuti offrono spunti utili per riflessioni future in ambito culturale, turistico e gestionale, contribuendo alla comprensione dei fattori che incidono sulla fruizione del patrimonio museale italiano.