venerdì 10 aprile 2020

Il modello SIR spiegato a mio figlio

Qualche giorno fa, come riempitivo della quarantena da coronavirus, ho spiegato a mio figlio il modello di diffusione delle epidemie denominato SIR. E' stata una buona esperienza, che ho cercato di utilizzare un po' per spiegare quanto sta avvenendo nei vari focolai dell'infezione che piano piano si stanno creando in quasi tutto il pianeta, e un po' per riflettere sul concetto di modello matematico per la descrizione di un fenomeno. Il modello in questione consiste sostanzialmente in un problema differenziale che risulta essere anche un buon esempio nell'uso delle derivate che mio figlio a scuola ha già avuto modo di incontrare, anche se in modo non rigoroso.

Ho proceduto grosso modo con queste considerazioni.

Dal punto di vista matematico un fenomeno che evolve nel tempo, come il caso di un'epidemia, viene descritto sostanzialmente individuando delle grandezze che lo caratterizzano e scrivendo delle relazioni che ne esprimano gli andamenti temporali. Le grandezze non possono essere tante, pena la complessità delle equazioni che ne possono derivare e la loro intrattabilità, ma ovviamente devono essere in numero sufficiente (e quelle giuste) perché si riesca a tirar fuori un'analisi significativa. In tal modo si è creato un modello, ovvero uno strumento matematico in grado di rappresentare con un certo grado di accuratezza il fenomeno che ci interessa. Spesso la costruzione di un modello non è la traduzione di principi fisici generali come succede ad esempio nel problema del moto di una massa in un campo gravitazionale (i principi generali qui sarebbero la legge di gravitazione universale e la seconda legge della dinamica) bensì considerazioni meno rigorose, giustificate da osservazioni dirette sul fenomemo specifico. E' il caso appunto del modello SIR.

Il modello SIR prende il nome dalle tre variabili che vengono scelte per descrivere l'andamento nel tempo di un'epidemia in una popolazione: i Suscettibili (S), gli Infetti (I), i Rimossi (R). I Suscettibili sono gli individui sani che possono in qualsiasi momento contrarre l'infezione, gli Infetti sono i malati portatori dell'infezione e quindi contagiosi, i Rimossi sono gli individui guariti dall'infezione (o eventualmente morti). Queste tre variabili non sono indipendenti poichè dividono la popolazione in tre insiemi disgiunti, dunque la loro somma è la popolazione totale (N): S+I+R=N.

Un modello deve poter permettere di arrivare a delle relazioni matematiche trattabili in qualche modo, se non proprio esattamente risolvibili. Per questo motivo deve rimanere sufficientemente semplice (anche se non banale, questo è il rischio). Ciò significa che oltre ad introdurre un numero piccolo di variabili andranno introdotte anche delle assunzioni semplificatrici che ci permetteranno di trascurare dei dettagli e che ovviamente renderanno il modello meno generale e meno potente (con una capacità predittiva più ristretta). Nel nostro caso si assume
- che la popolazione sia in numero costante (trascurando cioè nascite e morti naturali),
- che chi è nei rimossi sia definitivamente immunizzato e non possa più riammalarsi,
- che non ci siano scambi della popolazione con l'esterno (immigrazioni ed emigrazioni),
- che il contrarre l'infezione determini contestualmente sia la malattia che lo stato di infettività.
Ovviamente dopo un primo studio del modello semplificato da tutte queste ipotesi è sempre possibile trovare il modo di rimuoverle, apportare le opportune modifiche e studiarne le conseguenze, allo scopo di tener conto di un maggior numero di elementi significativi e arrivare a delle predizioni più precise.

L'obiettivo del modello sarà quello di descrivere gli andamenti nel tempo delle tre grandezze tra di loro collegate. Le approssimazioni fatte ci permettono di scrivere un "flusso" nel tempo di elementi da un insieme all'altro, cioè nel tempo i Suscettibili diventeranno Infetti che a loro volta diventeranno Rimossi (guariti o morti). Il punto di partenza più fruttuoso è quello di cercare di scrivere le velocità con cui queste tre grandezze varieranno. La velocità con cui una grandezza varia nel tempo non è nient'altro che la sua derivata (si pensi alla "velocità" come grandezza fisica, cioè la velocità con cui varia lo spazio percorso da un corpo in movimento).

A questo punto tentiamo di scrivere le velocità di variazione delle nostre tre grandezze con considerazioni euristiche. La velocità con cui varia la S nel tempo sarà certamente negativa poichè ci aspettiamo che l'insieme S diminuirà in conseguenza della propagazione dell'infezione (vedi il flusso scritto sopra) e potrà essere scritta ragionevolmente come proporzionale al prodotto tra S e I, più è grande S e più ho persone che possono infettarsi, più è grande I e più aumenta la probabilità di infettare i rimanenti S. La velocità con cui varia R invece sarà certamente positiva poichè al passare del tempo aumenteranno i guariti o i deceduti (vedi anche in questo caso il flusso scritto sopra) e potrà essere scritta come proporzionale a I, poiché tanto più grande è l'insieme degli infetti tanto più grande sarà il numero dei guariti. La velocità con cui varia I sarà semplicemente dedotta dal fatto che se per ipotesi la somma delle tra variabili è pari alla dimensione N della popolazione assunta come costante, la somma delle loro derivate dovrà essere necessariamente pari a zero (la derivata rispetto al tempo di una grandezza costante nel tempo è nulla).

In formule si ottiene alla fine la seguente (la derivata della funzione è indicata con l'apice):

S' = -aIS = (-aI)S
I' = aSI-bI = (aS-b)I
R' = bI

Si noti che, come detto nelle ipotesi, S'+I'+R'=0.

Questo è il problema differenziale che esprime le poche e semplici considerazioni fatte nel modello. I parametri a e b introdotti sono le costanti di proporzionalità che aggiungono gradi di libertà al modello, i loro valori sono ignoti ma possono influenzare parecchio l'andamento delle soluzioni e quindi caratterizzare in modo significativo il particolare fenomeno descritto. Evidentemente su tali parametri sarà possibile fare delle ipotesi e, quando possibile, cercare di determinarli attraverso delle misure fatte sui dati empirici dell'epidemia reale che si sta studiando.

Cosa si può ricavare da un modello del genere? Si potrebbero calcolare esplicitamente le soluzioni, ammesso che si riesca a farlo. Molti problemi differenziali sono difficili da trattare e spesso le soluzioni analitiche generali non si riescono a scrivere. Ricordiamoci comunque che ormai esiste sempre la possibilità di trattare numericamente le soluzioni attraverso l'uso di calcolatori. Alternativamente si possono studiare per ricavarne considerazioni più qualitative ma spesso altrettanto importanti. Proviamo a fare le più semplici.

1. Il parametro b indica la percentuale di infetti che guarisce (o muore) nell'unità di tempo. Questo chiaramente è un fattore che dipende dall'andamento naturale della malattia in un malato e può essere chiaramente influenzata (aumentata) dall'uso di terapie efficaci, se ce ne sono.

2. Il parametro a è un termine che tiene conto della capacità (o probabilità) che ha un individuo sano (S) di contrarre la malattia quando "incontra" un individuo infetto (I). Questa capacità di infettare dipende ovviamente dalle caratteristiche intrinseche dell'infezione e chiaramente può essere influenzata (diminuita) da opportune pratiche igieniche e dalla messa in quarantena degli individui infetti (ed eventualmente dall'uso di un vaccino, se disponibile).

3. Le prime due equazioni del modello (quella per S' e per I') sono del tipo F'(t)=kF(t) che ha come soluzione una funzione esponenziale, una funzione cioè che cresce se k è positivo e decresce se k è negativo, la velocità di crescita o decrescita essendo determinata dal suo valore assoluto. Quindi:

3a. Per la variazione dell'insieme S si ha k=-aI, coefficiente chiaramente negativo (anche se non costante poichè dipende anche da I) per l'ipotesi già fatta in precedenza che S deve diminuire progressivamente all'espandersi dell'infezione.

3b. Per la variazione dell'insieme I, la grandezza che ci interessa di più, si ha k=aS-b che non ha un segno definito. Anzi, possiamo dire che se all'inizio dell'epidemia i coefficienti si combinano in modo da rendere negativo k, l'epidemia si arresta subito (esponenziale negativo). Se, al contrario, rendono k positivo l'epidemia si espanderà all'inizio con velocità esponenziale, provocando il momento più critico per la popolazione (quello che attualmente stiamo ancora vivendo in gran parte del mondo).

4. Durante la fase espansiva dell'epidemia il coefficiente k, partito con valore positivo, è destinato ad un certo punto a cambiare di segno (S diminuisce), determinando dunque un massimo di I e l'inversione di tendenza. Da questo momento in poi l'infezione è destinata ad estinguersi.

5. Spesso nei modelli conviene introdurre parametri comodi e significativi per la descrizione del fenomeno. In questo caso al posto di k si preferisce introdurre il parametro r = aS/b. L'innesco dell'epidemia è determinato da r maggiore di 1, l'inversione di tendenza da r minore di 1. Questo parametro può essere interpretato come il numero medio di suscettibili che vengono contaminati da un infetto (Basic Reproduction Ratio).

6. L'ultima cosa interessante è che attraverso misure specifiche prese sulla popolazione e sui suoi comportamenti (vedi quanto già detto sopra) è possibile controllare il parametro r e di conseguenza la forma complessiva della curva epidemica, che può passare da una campana ripidissima e velocissima ad una campana molto più appiattita e distribuita su tempi lunghi. I due comportamenti non sono certo equivalenti. Controllare la crescita della campana e il livello raggiunto dal suo massimo può consentire alle strutture sanitarie della popolazione colpita di reggere l'impatto delle inevitabili ospedalizzazioni e cure intensive indotte dalle forme più gravi dell'infezione, e diminuire il più possibile il tasso di mortalità. Che è esattamente la cosa che stanno cercando di fare più o meno tutti gli stati mondiali attualmente colpiti dalla infezione del coronavirus.

La spiegazione mi è sembrata molto istruttiva, per diversi motivi. Spero che lo sia stata anche per mio figlio.

Nessun commento: