|
|
13/02/2001
Computer e Genoma
 Tra i campi del progresso tecnologico che stanno rivoluzionando l'economia moderna abbiamo Internet e le nuove tecnologie telematiche, e le biotecnologie. Se da un lato si lavora con hardware, software e sistemi di telecomunicazioni, dall'altro il materiale di base è... la vita.
La biotecnologia è l'utilizzo delle conoscenze portate dalla biologia molecolare per sfruttare i processi biologici, anche manipolando il codice genetico, che è ciò che racchiude tutte le informazioni riguardandi la struttura, lo sviluppo, il funzionamento e la riproduzione di un organismo vivente. Dove si incontrano le due cose? Per capire l'interesse sia di software specifici per la biologia molecolare che l'utilizzo della rete, sono costretto a dare alcune nozioni fondamentali di biologia molecolare.
Il codice genetico è composto di una molecola chiamata DNA. Senza entrare in dettagli di biochimica, si tratta di un lunghissimo "filo" composto da quattro molecole chiamate "basi" legate a catena: l'Adenina (A), la Citosina (C), la Guanina (G) e la Timina (T). Esse costituiscono un vero e proprio alfabeto, nel quale ogni gruppo di tre basi costituisce un'istruzione. Ad esempio, AAG significa qualcosa, mentre CTG qualcos'altro. Ogni gruppo di tre, chiamato "codone", corrisponde a un "aminoacido", cioè a uno dei costituenti base delle proteine.
Ci sono poi stringhe che indicano dove inizia e dove finisce la "lettura"; alcuni codoni per esempio sono un'istruzione di "stop". Se una base è sostituita da un'altra, allora la proteina avrà un aminoacido diverso, il che può avere conseguenze drammatiche: alcune malattie ereditarie gravissime sono dovute a una differenza di una sola base, famosa tra queste è l'emofilia, che ha colpito all'inizio del secolo metà delle famiglie reali europee.
Ora vediamo ciò che ci interessa: dopo sudore e fatica, il biologo emerge dal laboratorio con il seguente dato in mano, su carta o, grazie ai nuovi strumenti, fortunatamente su disco (si tratta dell'inizio di un gene dello lievito della birra): GATCCTCCAT ATACAACG GTATCT CCACCTCAGGTTTAG ATCTCAACAAC GGAACCATT GCCGACATGAG ACAGTTAGGTA TCGTCGAGAGTTAC AAGCTAAAACGA GCAGTA GTCAGCTC TGCATCTG AAGCCGCTGAAGT TCTACT AAGGGTGGATAACATCAT CCGTGCAAGACC AAGAACCGCCAATAGACAA CATATGTAA CATATTTA GGATATACCTC GAAAATAATAA ACCGCCAC ACTGTCATTATT TAATTAGAAACAGA ACGCAAAAATT ATCCACTA TATAATTCAA e così per due pagine... Ecco dove intervengono i software: identificano le sequenze di inizio e di fine della proteina, saranno in grado di disegnarla, di prevedere cosa succede se si modifica una base, e andare molto più avanti in quest'ordine di idee, dall'unione di parti di geni fino a disegnarne nel vero senso del termine uno nuovo riuscendo poi a dare un'idea virtuale del prodotto che si ottiene (e qui si apre tutto il campo delle manipolazioni genetiche e delle biotecnologie).
Si possono poi trovare sequenze particolari di vario interesse, confrontare sequenze simili fra di loro, fare infiniti studi di ogni genere, e vedere se una breve sequenza fa parte di un'altra più lunga. Ed è qui che internet è uno strumento preziosissimo: infatti le sequenze possono essere messe in rete e scaricate, e ci sono siti che contengono vere e proprie banche genetiche; le più conosciute sono GenBank, EMBL, SWISS-PROT, e VectorBank.
E qui la cosa diventa interessante: Si può impostare nel motore di ricerca la propria sequenza, magari composta di poche basi, e grazie alla rete di può rapidamente scoprire se detta sequenza assomiglia a qualcosa di noto. In ottobre scorso, Genbank aveva nel suo database 10,336,000,000 basi suddivise in 9,103,000 records di sequenze.
Uno dei progetti più pazzeschi degli ultimi anni è stato l'"Human Genome Project", cioè la decodifica della totalità del genoma umano. La decodifica è a buon punto, e i geni umani, man mano che vengono decodificati, vengono messi in rete. Il genoma umano è lungo tre miliardi di basi, e per darvi un'idea di cosa significa, se si leggead alta voce il codice ad una velocità di dieci basi al secondo (provate a pronunciare TAACATCATC in un secondo) senza mai fermarsi, per leggere la totalità del genoma umano occorrono 9,5 anni. In termini informatici, un milione di basi è all'incirca l'equivalente di 1 Mb di spazio disco, quindi per la totalità del genoma sono necessari tre gigabytes (sequenza pura, niente annotazioni o altro). Perciò sull'hard disk di un Mac o un PC attuali ci sta senza problemi, anche se una volta aggiunte le annotazioni, le sequenze di alcune proteine, le mutazioni, variazioni, e le mille altre cose che i software di cui sopra possono fare, più i software stessi, si superano allegramente i 20 Gb. Comunque, ciò per dire che l'analisi può essere effettuata tranquillamente con macchine da pochi milioni; non c'è bisogno di grossi mainframes.
Per informazioni su alcune società che producono software di analisi genetica, andate a vedere i seguenti siti:
http://www.genecodes.com
http://www.dnastar.com
Il sito di GenBank è:
http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html
Chi è interessato al Progetto Genoma Umano vada a vedere qui:
http://www.ornl.gov/TechResources/Human_Genome/home.html
Ed ecco un ottimo sito di links su biologia molecolare e biotecnologie:
http://trishul.sci.gu.edu.au/sites.html

|
| Roberto Sallier De La Tour Redattore |
Da questo autore
|
|
|
| Apple, Mac, iPhone, iPod, MacBook, Google, Microsoft, Ecosistema, Time&Mind, web 2.0, staminali, network, wireless, wifi, community, iHair, Fotografia |
|