|  home | news | focus on | articoli | contatti | redazione | collaborazioni | feed | 
13/02/2001

Computer e Genoma

Bookmark and Share
Tra i campi del progresso tecnologico che stanno rivoluzionando l'economia moderna abbiamo Internet e le nuove tecnologie telematiche, e le biotecnologie. Se da un lato si lavora con hardware, software e sistemi di telecomunicazioni, dall'altro il materiale di base è... la vita.

La biotecnologia è l'utilizzo delle conoscenze portate dalla biologia molecolare per sfruttare i processi biologici, anche manipolando il codice genetico, che è ciò che racchiude tutte le informazioni riguardandi la struttura, lo sviluppo, il funzionamento e la riproduzione di un organismo vivente. Dove si incontrano le due cose? Per capire l'interesse sia di software specifici per la biologia molecolare che l'utilizzo della rete, sono costretto a dare alcune nozioni fondamentali di biologia molecolare.

Il codice genetico è composto di una molecola chiamata DNA. Senza entrare in dettagli di biochimica, si tratta di un lunghissimo "filo" composto da quattro molecole chiamate "basi" legate a catena: l'Adenina (A), la Citosina (C), la Guanina (G) e la Timina (T). Esse costituiscono un vero e proprio alfabeto, nel quale ogni gruppo di tre basi costituisce un'istruzione. Ad esempio, AAG significa qualcosa, mentre CTG qualcos'altro. Ogni gruppo di tre, chiamato "codone", corrisponde a un "aminoacido", cioè a uno dei costituenti base delle proteine.

Ci sono poi stringhe che indicano dove inizia e dove finisce la "lettura"; alcuni codoni per esempio sono un'istruzione di "stop". Se una base è sostituita da un'altra, allora la proteina avrà un aminoacido diverso, il che può avere conseguenze drammatiche: alcune malattie ereditarie gravissime sono dovute a una differenza di una sola base, famosa tra queste è l'emofilia, che ha colpito all'inizio del secolo metà delle famiglie reali europee.

Ora vediamo ciò che ci interessa: dopo sudore e fatica, il biologo emerge dal laboratorio con il seguente dato in mano, su carta o, grazie ai nuovi strumenti, fortunatamente su disco (si tratta dell'inizio di un gene dello lievito della birra): GATCCTCCAT ATACAACG GTATCT CCACCTCAGGTTTAG ATCTCAACAAC GGAACCATT GCCGACATGAG ACAGTTAGGTA TCGTCGAGAGTTAC AAGCTAAAACGA GCAGTA GTCAGCTC TGCATCTG AAGCCGCTGAAGT TCTACT AAGGGTGGATAACATCAT CCGTGCAAGACC AAGAACCGCCAATAGACAA CATATGTAA CATATTTA GGATATACCTC GAAAATAATAA ACCGCCAC ACTGTCATTATT TAATTAGAAACAGA ACGCAAAAATT ATCCACTA TATAATTCAA e così per due pagine... Ecco dove intervengono i software: identificano le sequenze di inizio e di fine della proteina, saranno in grado di disegnarla, di prevedere cosa succede se si modifica una base, e andare molto più avanti in quest'ordine di idee, dall'unione di parti di geni fino a disegnarne nel vero senso del termine uno nuovo riuscendo poi a dare un'idea virtuale del prodotto che si ottiene (e qui si apre tutto il campo delle manipolazioni genetiche e delle biotecnologie).

Si possono poi trovare sequenze particolari di vario interesse, confrontare sequenze simili fra di loro, fare infiniti studi di ogni genere, e vedere se una breve sequenza fa parte di un'altra più lunga. Ed è qui che internet è uno strumento preziosissimo: infatti le sequenze possono essere messe in rete e scaricate, e ci sono siti che contengono vere e proprie banche genetiche; le più conosciute sono GenBank, EMBL, SWISS-PROT, e VectorBank.
E qui la cosa diventa interessante: Si può impostare nel motore di ricerca la propria sequenza, magari composta di poche basi, e grazie alla rete di può rapidamente scoprire se detta sequenza assomiglia a qualcosa di noto. In ottobre scorso, Genbank aveva nel suo database 10,336,000,000 basi suddivise in 9,103,000 records di sequenze.

Uno dei progetti più pazzeschi degli ultimi anni è stato l'"Human Genome Project", cioè la decodifica della totalità del genoma umano. La decodifica è a buon punto, e i geni umani, man mano che vengono decodificati, vengono messi in rete. Il genoma umano è lungo tre miliardi di basi, e per darvi un'idea di cosa significa, se si legge ad alta voce il codice ad una velocità di dieci basi al secondo (provate a pronunciare TAACATCATC in un secondo) senza mai fermarsi, per leggere la totalità del genoma umano occorrono 9,5 anni. In termini informatici, un milione di basi è all'incirca l'equivalente di 1 Mb di spazio disco, quindi per la totalità del genoma sono necessari tre gigabytes (sequenza pura, niente annotazioni o altro). Perciò sull'hard disk di un Mac o un PC attuali ci sta senza problemi, anche se una volta aggiunte le annotazioni, le sequenze di alcune proteine, le mutazioni, variazioni, e le mille altre cose che i software di cui sopra possono fare, più i software stessi, si superano allegramente i 20 Gb. Comunque, ciò per dire che l'analisi può essere effettuata tranquillamente con macchine da pochi milioni; non c'è bisogno di grossi mainframes.

Per informazioni su alcune società che producono software di analisi genetica, andate a vedere i seguenti siti:

http://www.genecodes.com
http://www.dnastar.com

Il sito di GenBank è:
http://www.ncbi.nlm.nih.gov/Genbank/GenbankOverview.html

Chi è interessato al Progetto Genoma Umano vada a vedere qui:
http://www.ornl.gov/TechResources/Human_Genome/home.html

Ed ecco un ottimo sito di links su biologia molecolare e biotecnologie:
http://trishul.sci.gu.edu.au/sites.html
Cerca nel sito
Apple, Mac, iPhone, iPod, MacBook, Google, Microsoft, Ecosistema, Time&Mind, web 2.0, staminali, network, wireless, wifi, community, iHair, Fotografia
Newsletter
Per ricevere automaticamente la nostra newsletter inserisci la tua email nel campo sottostante.

Potrai disiscriverti in qualsiasi momento direttamente dall'email inviata.

Banner/Partner
|  home | news | focus on | articoli | contatti | redazione | collaborazioni | feed |