LA COMPLESSITA’ DELLE FORME NATURALI

Il matematico polacco Benoit Mandelbrot studiando la geometria delle forme che si trovavano in Natura si accorse dell’autosomiglianza di molte figure ovvero che certi schemi si ripetevano su ordini di grandezza decrescenti. Se si prende un cavolfiore e si stacca via via un piccolo pezzo da quello staccato in precedenza si nota che ogni frammento ha la forma della pianta intera. Le rocce di una montagna sono a loro volta simili a piccole montagne, le ramificazioni di un fulmine sono simili all’intero fulmine, ingrandendo i bordi di una nuvola si vedono ancora gli stessi profili, le continue diramazioni dei vasi sanguigni ripetono lo stesso schema, le venature di una foglia si diramano in altre venature sempre più sottili, la spirale del guscio delle lumache o certi semi delle piante infestanti i giardini presentano forme autosomiglianti. Mandelbrot creò la geometria frattale per descrivere le forme naturali. Le forme frattali, spesso senza rendercene conto, appartengono alla nostra esperienza ma notiamo veramente la loro complessità quando tentiamo di riprodurle fisicamente. Se volessimo ricostruirle matematicamente utilizzando le semplici equazioni della geometria analitica dovremmo scrivere migliaia di migliaia di equazioni. Se utilizziamo la matematica complessa ci si stupisce di quanto sia semplice generare una forma frattale, infatti basta iterare un’operazione partendo da determinate condizioni iniziali e mappare ogni volta il nuovo valore nel piano complesso.

 felce frattale fronda frattale  cactus frattale cavolfiore nautilus neve (images http://mathpaint.blogspot.com)

Figura 1 – Forme frattali che somigliano a forme naturali

Semplicemente variando le condizioni iniziali e le costanti complesse dell’equazione generatrice delle forme si ottengono una gran varietà di figure diverse. Quello che stupisce è che molte figure così ottenute sono simili alle forme naturali perché rappresentano germogli, viticci, spirali dentro spirali, cavallucci marini, vortici e forme organiche che germogliano ed esplodono in frammenti. Inoltre esse sono ottenute con un’operazione non lineare su una formula composta di pochi termini ovvero nella matematica della complessità equazioni semplici possono generare strutture molto complicate. Tali evidenze possono far assomigliare la Natura a un computer che segue delle leggi simili ad algoritmi. Ma la fisica ha già dimostrato che le leggi della Natura sono matematiche, ora la matematica sta suggerendo che la Natura si manifesta eseguendo gli algoritmi più semplici cioè quelli ricorsivi. Anche la genetica ha dimostrato che la Natura adotta i programmi più semplici, infatti, nel genoma di un millepiedi non ci sono mille insiemi di geni in cui ogni insieme serve a costruire una zampa, ma esiste un solo set di istruzioni per costruire la zampa, utilizzato migliaia di volte nei diversi segmenti del corpo. Allo stesso modo gli animali non hanno tanti set di geni quanti sono i loro occhi ma un solo set espresso in posizioni diverse. La formazione del cervello non è diretta da migliaia di geni ma da pochi geni utilizzati in modo reiterato così come la struttura delle impronte digitali con la sua alternanza di creste e valli. La Natura sembra agire come un programmatore che scrive la lista di istruzioni da far eseguire al calcolatore ottimizzando il codice cioè racchiudendo in procedure e funzioni i gruppi di istruzioni che vanno richiamati più volte.

 

L’INTERPRETAZIONE DELLA TEORIA DELL’INFORMAZIONE

Fin qui si è detto che la Natura sembra utilizzare poche regole genetiche reiterate in forte analogia con la matematica frattale. Da un punto di vista della teoria dell’informazione la matematica frattale è un tipo di codifica, ovvero un modo per specificare l’informazione che ricrea la forma. Potremmo chiederci quali vantaggi e svantaggi offre la codifica frattale e trasportare le considerazioni al caso biologico. Pensiamo di dover dettare al telefono le informazioni per far sì che il nostro interlocutore riesca a disegnare esattamente la foglia della pianta di vite senza averla mai vista. Questo esercizio sembra inutile, ma è quello che la Natura esegue in ogni istante durante la generazione delle forme animali e vegetali incluse le strutture a noi non visibili come il cervello, composto da una miriade di elementi interconnessi. Nel nostro caso, dopo aver misurato la posizione di tutti gli spigoli della foglia dovremmo trascorrere ore al telefono a descrivere la forma nei minimi dettagli dettando tutte le coordinate. In modo molto più rapido, potremmo dettare l’equazione frattale e le condizioni iniziali che generano la forma della foglia. Il secondo metodo sembra indubbiamente più vantaggioso per via del ridotto numero di istruzioni da trasmettere e quindi si dice che con esso si realizza una compressione dei dati da trasmettere ovvero una codifica di sorgente. Noi eseguiamo una codifica di sorgente ogni volta che comprimiamo un file per ridurne le dimensioni e ogni volta che parliamo al cellulare, poiché esso tramite un dispositivo detto ‘vocoder’ riduce i dati da inviare alla stazione radio base assicurando ancora l’intelleggibilità della nostra voce. La compressione riveste un interesse pratico perché fa risparmiare spazio nel caso della memorizzazione e tempo nel caso della trasmissione. Miglioramenti alle tecniche di compressione riuscirebbero a far entrare un maggior numero di canzoni in un CD, più film in un DVD e a trasferire più velocemente i dati su internet. La matematica dei frattali è molto interessante perché riassume figure complesse in una notazione molto compatta cioè in una formula e nelle condizioni iniziali, perciò essa rappresenta la frontiera estrema della compressione.
Anche il genoma umano è un supporto fisico che deve memorizzare le informazioni per generare la vita e trasmetterle durante i processi di duplicazione e trascrizione. In esso ci sono le istruzioni per specificare le strutture, le forme, costruire diversi tipi di cellule, assicurare le funzioni biochimiche, la risposta immunitaria, il metabolismo e la biosintesi, la propria replicazione e autocorrezione, la comunicazione tra cellule e l’omeostasi. Pensando alla complessità umana ci si aspetterebbe che essa sia stata generata da un numero elevatissimo di geni invece stupisce il fatto che il genoma umano ne contiene solo circa 30 mila. Va detto che a tali geni corrispondono circa due o tre cento mila proteine perché grazie al processo di splicing alternativo l’eliminazione delle sequenze introniche dai geni può avvenire secondo più schemi, ma non sembrano ancora numeri tali da spiegare la complessità umana. Ancora più sorprendente era stata la scoperta che i geni deputati al controllo delle forme, come ad esempio i geni Hox, erano solo alcune decine. Come già detto, quest’ultima evidenza è spiegabile ipotizzando che la Natura genererebbe le proprie forme attraverso interazioni complesse tra pochi elementi (proteine) e quindi utilizzerebbe la compressione. Nei genomi emerge la necessità di risparmiare spazio? Dal punto di vista biologico, utilizzare una compressione estrema per conservare le informazioni nel genoma non sembra necessario, poiché in esso c’è molto spazio libero, infatti, il genoma umano contiene tanti caratteri quanti ce ne sono in mille volumi dell’Enciclopedia Britannica, ma solo il 2 – 3% del genoma è utilizzato ovvero contiene i geni. Non si vede un vantaggio nel condensare l’informazione in brevi tratti e lasciare il 97% del genoma inutilizzato tanto che quest’ultimo è chiamato DNA spazzatura. Chissà che questa spazzatura in realtà non abbia una funzione, proprio come si è scoperto che alcuni introni contengono corti geni, sequenze regolative e microRNA.

 

LA COMPRESSIONE E’ SEMPRE UN VANTAGGIO?

Ora possiamo chiederci se la compressione delle informazioni sia sempre vantaggiosa e per comprenderlo riprendiamo l’esempio della comunicazione telefonica per descrivere al nostro interlocutore la forma della foglia di vite. Immaginiamo che a causa del rumore di fondo il destinatario interpreti una parola per un’altra e annoti dei dati lievemente diversi da quelli che stiamo dettando. Un solo errore nelle coordinate dei bordi sarebbe quasi ininfluente ai fini della ricostruzione della figura e al massimo genererebbe poche e piccole imprecisioni in corrispondenza di un bordo. Alternativamente pensiamo che l’errore sia avvenuto durante la trascrizione della formula frattale. In questo caso un solo errore farebbe ricostruire una figura completamente diversa da quella che avremmo voluto indicare ovvero l’informazione si è completamente degradata. Si può pensare che nel primo caso l’informazione sia distribuita su molti simboli, nel secondo caso sia affidata a pochissimi simboli e ciascuno di essi ha una maggior densità di informazione, quindi l’errore a carico di uno di essi non è tollerabile. In altre parole, il vantaggio della compressione frattale viene pagato con la perdita di robustezza ovvero con l’intolleranza agli errori. Se le informazioni biologiche fossero codificate nel genoma con il solo obiettivo di risparmiare spazio, ci sarebbe lo svantaggio che le mutazioni geniche avrebbero effetti catastrofici. Ripensando all’esempio del millepiedi, se una mutazione genica provocasse la deformazione di una zampa, tutte le zampe sarebbero deformate allo stesso modo. Una mutazione a carico di un gene che controlla lo sviluppo cerebrale ha un’alta probabilità di essere patologica. La soluzione adottata dall’uomo nei linguaggi artificiali è quella di raggiungere un equilibrio tra compattezza e robustezza codificando in modo più ridondante le informazioni più preziose o quelle trasmesse in ambienti più rumorosi.
A livello di linguaggio in cui sono scritti i geni nel genoma, l’elemento che contribuisce alla robustezza della codifica è la degenerazione del codice genetico grazie alla quale alcune mutazioni non variano l’amminoacido specificato dai codoni, quindi sono tollerate dal sistema. Le mutazioni che non alterano le proteine si dicono neutre e i codoni modificati si dicono sinonimi. In realtà negli ultimi anni lo scenario è cambiato e sembra che il punto di equilibrio sia più a favore della compattezza ovvero le informazioni sembrano specificate in modo meno robusto di come si credeva. Si è scoperto che nei geni coesistono più linguaggi: quello per specificare gli amminoacidi, per la rimozione degli introni (splicing), per il ripiegamento dell’mRNA, per l’efficienza di traduzione e per il tempo di sopravvivenza dell’mRNA. Gli esperimenti hanno dimostrato che una parte delle mutazioni neutre dal punto di vista del codice genetico, producono effetti a livello di altri sistemi cellulari, primo tra tutti il meccanismo di splicing. Alcune mutazioni geniche neutre, e perciò mai imputate di causare patologie, alterano pesantemente lo schema di splicing e producono proteine mancanti di un dominio funzionale o aventi parti aggiuntive che causano un ripiegamento anomalo. In molti geni tra cui quelli coinvolti nella fibrosi cistica (CFTR), nel tumore al seno (BRCA1 e 2), nell’atrofia muscolare spinale (SMN) e nella neurofibromatosi (NF1) alcune mutazioni neutre, anche da sole, causano l’errata eliminazione di un esone o il mantenimento di un introne o di un’estremità di esso.

 

SE LA NATURA SEGUISSE LOGICHE FRATTALI

Se i processi di crescita cellulare seguissero dinamiche iterative allora potrebbero essere modellizzati con l’aiuto della geometria frattale e riusciremmo a predire le configurazioni del sistema biologico conoscendo l’equazione del differenziamento e le sue condizioni iniziali. Più in generale potremmo ottenere predizioni dell’evoluzione di sistemi apparentemente caotici quali ad esempio la crescita tumorale e la formazione di metastasi. In parte già oggi si osserva il frastagliamento dei bordi dei tumori della pelle quale indicatore di malignità e tale frastagliamento assomiglia al procedere delle iterazioni di un frattale. I modelli di crescita frattale potrebbero suggerire più efficacemente di altri, quali parametri morfologici, biochimici o molecolari misurare in una formazione tumorale per predire se essa sarà benigna o maligna ed eventualmente quale sarà il suo schema di diffusione.

 

LA NATURA USA IL PI GRECO, L’UNITÀ IMMAGINARIA, IL NUMERO DI NEPERO E I NUMERI PRIMI

Il π è semplicemente il rapporto tra il perimetro della circonferenza del cerchio e il suo diametro. La sua importanza deriva dal fatto che lo si trova ovunque: in matematica, fisica, elettronica, telecomunicazioni, fisica quantistica, statistica, aerodinamica, nella formula della relatività generale, nella formula di indeterminazione di Heisenberg... quasi come facesse parte del mondo, come se fosse codificato nell’algoritmo che la Natura esegue. Ad esempio la probabilità che due interi scelti a caso siano primi fra loro è 6/π2, il numero di primi presenti nell'intervallo compreso tra 0 e n è π(n), il numero medio di modi in cui è possibile scrivere un intero positivo come somma di due quadrati perfetti è π/4. Esso è un numero un po’ strano: è un numero trascendente, cioè un numero irrazionale (non può essere scritto come rapporto di due interi) che non è soluzione di alcuna equazione algebrica a coefficienti razionali, ma che compare come limite di molti procedimenti infiniti. Le cifre decimali di π sono verosimilmente infinite e nessuno conosce una regola per generarle tutte e semplicemente. Nel 2002 si è arrivati a calcolare 1012 cifre decimali. E’ curioso chiedersi se la successione delle cifre decimali del π segua una regola o sia del tutto casuale.
Il metodo per calcolare il π si basava sulla determinazione della lunghezza della circonferenza del cerchio e tale calcolo era eseguito sommando gli archi di poligoni aventi un numero di lati sempre maggiore così il perimetro tendeva sempre più precisamente ad un cerchio e il π si poteva calcolare con maggiore precisione. Una svolta a tale calcolo fu data da Laplace che utilizzando il metodo di Montecarlo calcolava π come rapporto tra le aree del cerchio inscritto nel quadrato e del quadrato stesso. Il metodo usa un generatore di numeri casuali per stimare l’area del cerchio e del quadrato. Ma più si aumentava la precisione del calcolo e più tale numero sembrava avere cifre decimali. Da allora la frase secondo la quale la quadratura del cerchio è impossibile. In seguito si sono sviluppate molte relazioni matematiche che permettono di ottenere π tramite iterazioni infinite. Eulero trovò una relazione di un’eleganza formale unica per mettere in relazione il numero di Nepero, l’unità, l’unità immaginaria e i numeri negativi:


  e = - 1

Tale identità dimostra anche che π non è algebrico, quindi non era possibile trovare il quadrato equivalente ad un cerchio. Guardando l’identità di Eulero è sorprendente vedere che due numeri (e, π) che probabilmente hanno infinite cifre decimali, che sono ottenuti in modi completamente diversi, impossibili da conoscere con precisione, se elevati l'uno come potenza dell'altro in presenza dell’unità immaginaria, sono in relazione ed equivalgano banalmente a -1. Altra osservazione: ‘i’ non ha senso fisico eppure lo troviamo a mettere in relazione numeri reali che si originano dalla misura di entità reali. Ma soprattutto tale identità lega insieme entità fondamentali presenti in tutte le discipline. Riemann trovò una relazione esatta tra π e i numeri primi stabilendo legando in questo modo cinque entità matematiche fondamentali ma di origine assolutamente diversa. Lo studio dei numeri primi ha un particolare fascino perché sono stati definiti dall’uomo in modo semplice, ma si sono rivelati misteriosi e coinvolti in molte applicazioni. Oggi non si conoscono tutti i numeri primi e quelli noti sono stati ottenuti con notevole dispendio computazionale, non si sa se ci siano infiniti numeri primi e neppure se essi seguano uno schema. Man mano che si avanza nella ricerca di numeri primi sempre più grandi, aumenta anche la grandezza degli interi da testare per verificare che essi siano divisibili solo per uno e per se stessi. E’ intuitivo che al crescere degli interi i numeri diventano più grandi e si trovano meno numeri primi tra essi perchè e' più probabile che un numero molto grande possa essere diviso senza resto da un numero più piccolo. Ci si aspetterebbe che oltre un certo numero non ci siano più numeri primi e che tutti i numeri siano divisibili per altri più piccoli. Invece comunque si scelga un numero, esiste un numero primo più grande, ossia esistono infiniti numeri primi. Trovare una formula ovvero la generatrice per calcolare tutti i numeri primi avrebbe grandi risvolti pratici. Riemann mostrò che si potrebbe calcolare la posizione dei numeri primi studiando quando la funzione zeta di Riemann si annulla e questo è attuale oggetto di studio. E’ sorprendente che l'irregolarità nella successione dei numeri primi sia in relazione a una funzione continua di variabile complessa.
Conoscere tutti i numeri primi permetterebbe di risolvere un problema inverso noto come fattorializzazione, per il quale ora si va per tentativi: determinare i numeri primi il cui prodotto origini un dato numero. Questa difficoltà assicura l’inattaccabilità di molti sistemi di sicurezza per il criptaggio delle informazioni. Cerchiamo di capirne a grandi linee il motivo. Nella crittografia tradizionale esiste un'unica chiave sia per codificare che per decodificare le informazioni. La chiave e l'algoritmo con i quali si realizzano le operazioni di criptaggio e decriptaggio, devono essere noti sia al mittente sia al destinatario. Tali persone devono essersi incontrate o contattate almeno una volta per scambiarsi la chiave e l'algoritmo e questo già espone a rischi di intercettazione. I recenti algoritmi per il criptaggio delle informazioni posseggono una chiave pubblica e una privata. La chiave privata è personale e segreta, serve solo a decodificare il documento criptato; la chiave pubblica è distribuita, serve solo a criptare l’informazione destinata alla persona che possiede la relativa chiave privata. Il metodo di generazione delle chiavi si basa sull'utilizzo di due numeri primi di grandi dimensioni (attualmente di almeno 300 cifre) che vengono moltiplicati tra loro. Il prodotto è distribuito come chiave pubblica. La sicurezza dell'algoritmo si basa sul fatto che dalla conoscenza della chiave pubblica e dal messaggio criptato è molto difficile risalire alla chiave privata perché si tratta di affrontare il problema inverso della fattorializzazione. L’abbattimento della sicurezza delle informazioni potrebbe portare a una grande crisi economica perché coglierebbe impreparati tutti i sistemi basati sulla sicurezza: pensiamo alle carte di credito, ai metodi di pagamento su internet, all’accesso ai nostri dati personali e alle comunicazioni militari. Ma potrebbero esserci anche implicazioni più profonde e positive: la comprensione dell’idrodinamica di una stella, la fisica quantistica dei nuclei atomici, la teoria del caos, del caos quantistico, la struttura dei vetri ed addirittura la comprensione del DNA. In questa trattazione abbiamo visto come entità matematiche apparentemente diverse in realtà siano tutte correlate fra loro, legate alla conoscenza del mondo che ci circonda e alle dinamiche dei sistemi economici. Quando questi misteri saranno chiariti si avrà un’unificazione enormemente maggiore di quella nell’elettromagnetismo portata da Maxwell o di quella delle forze fondamentali nella fisica. Il fatto che ci siano entità matematiche comuni a tutte le discipline e che addirittura tali entità potrebbero essere la diversa espressione di un contenuto universale rafforza l’idea che il programma della Natura sia scritto in linguaggio matematico e che le discipline che oggi studiamo a compartimenti stagni, sono strettamente correlate tra loro, forse come i cicli catalitici del pianeta Gaia.

 

BIBLIOGRAFIA

Piva F. Analisi computazionale di sequenze del genoma umano. Tesi di dottorato. 2006