Inicio
 
  Acerca de Por Qué Biotecnología (Programa Educativo)
 
  La Biotecnología
 
  Recursos para la enseñanza de la biotecnología
 
  El Cuaderno
 
  Trabajos Prácticos
 
  Glosario de términos de biotecnología
 
  Links recomendados
 
  Cursos y capacitaciones docentes
 
  Dónde estudiar biotecnología
 
  Suscríbase a publicaciones
 
  Contáctenos
 
  facebook  
Cuaderno Nº 123  

Síntesis de proteínas
  Colágeno, insulina, hemoglobina,  bilirrubina… resultan nombres conocidos. Son proteínas que forman parte de la vida cotidiana. De hecho, son uno de los componentes principales de las células y más de la mitad de su peso seco. La cantidad de funciones diferentes que realizan las proteínas es enorme: son parte de la estructura celular, regulan, transportan, defienden, aceleran reacciones, entre otras. ¿Cómo se descubrió la estructura de las proteínas? Corría la década de 1940 y genetistas de la época revelaban los primeros indicios de que los genes determinaban la estructura de proteínas individuales. Sin embargo, no fue sino hasta principio de los años ‘50 que el bioquímico británico Frederick Sanger descubrió, estudiando la insulina, cómo se formaban las proteínas a partir de la unión de moléculas más pequeñas.

Así como el descubrimiento de la estructura del ADN ejerció una gran influencia sobre el conocimiento de la base molecular de la herencia y de la genética, la determinación de la secuencia de la insulina constituyó la clave para comprender la estructura y la función de las proteínas.
Era lógico pensar que si la insulina tenía una secuencia definida y genéticamente determinada, también la tuvieran las demás proteínas. El mecanismo por el cual se fabrican o sintetizan las proteínas es tan fascinante como complejo y su conocimiento proporciona una parte importe de las herramientas básicas de la biología molecular.

Todo empieza en el ADN

La información genética está almacenada en moléculas de ADN (ver cuadernos nº 3, 32, 65). Esta información se transmite mediante un flujo unidireccional, que va del ADN hacia el ARN y de éste a las proteínas. Este enunciado constituye el Dogma Central de la Biología (ver cuadernos nº 3, 32, 100) y fue expresado por el científico inglés Francis Crick, famoso además por proponer junto a James Watson  un modelo de estructura para el ADN y por ganar el Premio Nobel en 1962 por ese trabajo.

Figura 1: Dogma Central de la Biología. El flujo de información genética es unidireccional y va desde al ADN hacia las proteínas.
Fuente: ArgenBio

El dogma enuncia lo siguiente: cuando en una célula se requiere la síntesis de una proteína específica, la porción de ADN que la codifica será copiada en forma de ARN, mediante un proceso denominado transcripción. Luego el ARN formado, que se denomina ARN mensajero, es utilizado como molde para la síntesis de proteínas por un mecanismo llamado traducción. Esta información finalmente llega de manera unidireccional a las proteínas, y son ellas quienes llevan a cabo la mayor parte de las actividades celulares.

Utilizando un vocabulario informático, se podría decir que el ADN representa el software (instrucciones que las células reciben de sus progenitores), mientras que las proteínas constituyen el hardware (aparato físico que ejecuta el programa almacenado en la memoria). Actualmente, y aunque se sigue respetando este dogma como una generalidad, se sabe que hay excepciones para este postulado (retrovirus, ARN con actividad catalítica, etc.; ver cuadernos nº 3 y 115).

La síntesis de proteínas, paso a paso
Denominamos, entonces, síntesis proteica al mecanismo por el cual la información contenida en el ADN (ver cuadernos nº 3 y 32), se traduce en proteínas. Es un proceso complejo, que se realiza en distintos compartimientos celulares, en el que intervienen variadas moléculas y que se produce básicamente en dos pasos:
Paso 1: La transcripción
La transcripción ocurre dentro del núcleo celular (en las células eucariotas), y en el citoplasma en las procariotas (ver Cuaderno nº 80). 
En esta primera etapa los genes, que serían “palabras” escritas en el ADN mediante la combinación de cuatro “letras” o nucleótidos A, T, C y G, se copian o transcriben a otro lenguaje, el del ARN denominado ARN mensajero (ARNm). En este proceso, denominado transcripción, la síntesis de una molécula de ARNm es catalizada por una enzima llamada ARN polimerasa (ARNpol). El proceso se inicia cuando dicha enzima reconoce un lugar específico del ADN llamado promotor.  Luego de unirse al promotor, la ARNpol desenrolla aproximadamente una vuelta completa de la hélice del ADN poniendo al descubierto un fragmento de una sola hebra. Esta hebra de ADN, llamada hebra codificante, sirve de molde para que la ARNpol vaya agregando nucleótidos complementarios uno tras otro, a medida que se desplaza en una dirección específica sobre el ADN (Figura 2). Los nucleótidos que adiciona la ARNpol para formar el ARNm son ribonucleótidos, es decir, nucleótidos que poseen en su estructura el azúcar ribosa (a diferencia de la desoxirribosa presente en los nucleótidos del ADN). Además, la complementariedad de nucleótidos se realiza de la siguiente manera:

si en el ADN hay:

la ARNpol agrega:

C (citosina)

G

G (guanina)

C

T (timina)

A

A (adenina)

U (uracilo)


Tabla 1
: Apareamiento de nucleótidos que realiza la ARNpol para sintetizar el ARNm a partir de la hebra molde del ADN.

En la tabla se puede ver que en el ARNm no existen las bases Timina (T), y son reemplazadas por la base U o Uracilo (ver cuaderno nº 32). La enzima seguirá transcribiendo hasta que encuentre la señal de terminación que le indica que allí debe detenerse (ver figura 2). Tan pronto como se ha completado la copia de ARNm, la hélice original de ADN se pliega nuevamente, y la molécula de ARNm se separa.

Figura 2: Proceso de transcripción. A partir del ADN doble cadena, la enzima ARN polimerasa sintetiza un ARN mensajero simple cadena.
Fuente: http://www.geosfera.es/monograficos/DNA/Adn/14-25.jpg

Una vez finalizada la transcripción, el ARNm está casi listo para la siguiente etapa. Pero aún esta “inmaduro” y para madurar debe ser protegido de manera de evitar que pueda degradarse en su viaje al citoplasma. Para ello, unas enzimas específicas  se encargan de ponerle una “caperuza” o CAP en uno de sus extremos y una cadena corta de adeninas (colita de poliA) en el otro. Una  vez completada la maduración (que involucra otros procesos que aquí no mencionamos), el ARNm parte hacia el citoplasma a través de los poros de la membrana nuclear en las células eucariotas.
Paso 2: La traducción
Una vez en el citoplasma, la secuencia del ARNm debe ser decodificada a proteína. Este es el proceso de traducción y puede dividirse en tres fases: iniciación, elongación y terminación (Figura 3)



Ampliar Imagen

Figura 3: Proceso de traducción. A partir del ARN mensajero y mediante un complejo mecanismo, se sintetizan las proteínas
Fuente: http://www.monografias.com/trabajos/
sinteproteinas/Image172.gif

-Iniciación: en este punto es importante destacar que la forma en que el ARNm es leído es diferente a lo sucedido en la transcripción, ya que en la traducción los nucleótidos del ARNm son leídos de a tres, es decir que un triplete de nucleótidos,  también llamado codón, codifica para un aminoácido determinado. Es decir que cada codón determina qué aminoácido se agregará a la futura proteína.
La traducción se inicia cuando el ARNm se une a una organela celular compleja denominada ribosoma. Los ribosomas están formados por dos subunidades, una mayor y otra menor, y es esta última la que reconoce y se une en primer lugar al ARN mensajero (ver figura 3).

Los codones de ARNm no reconocen directamente a los aminoácidos, sino que la traducción utiliza moléculas “adaptadoras” que unen el aminoácido con su correspondiente triplete o codón. Estos adaptadores son un grupo de pequeñas moléculas de ARN, conocidas como ARN de transferencia (ARNt), cada una de las cuales tiene solo entre 70 y 90 nucleótidos de longitud. Esta molécula tiene una conformación tridimensional característica, denominada “hoja de trébol”, que le permite llevar a cabo su función de adaptador (Figura 4).

Figura 4: Estructura del ARN de transferencia. Conformación tridimensional del ARNt, conocida como “hoja de trébol”.
Fuente: http://img.tfd.com/dorland/thumbs/RNA_
transfer-RNA.jpg

En la estructura del ARNt existen dos zonas de gran importancia para el proceso de síntesis proteica: un triplete de secuencia variable llamado anticodón, cuyas bases son complementarias al  codón de la molécula de ARNm; el otro triplete está ubicado al otro extremo, y unido covalentemente a un aminoácido específico (ver figura 4). Esta unión del aminoácido específico con el ARNt la cataliza una enzima llamada aminoacil-tRNA sintetasa.
Una vez que la subunidad pequeña del ribosoma se encuentra en posición, un ARNt llamado iniciador (que porta el aminoácido metionina), reconoce el primer codón (AUG) en el ARNm y se carga sobre la subunidad pequeña, para luego unirse la subunidad mayor del ribosoma. De esta manera se forma un ribosoma funcional completo, que así ensamblado posee dos sitios de unión diferentes para moléculas de ARNt: el sitio P y el sitio A (ver figura 3).
-Elongación: una vez que el ARNt de iniciación unido a metionina se ubica en el sitio A, otro ARNt con su correspondiente aminoácido debe ubicarse en el sitio P, adyacente al sitio A. Con los dos ARNt en su sitio, comienza  el proceso de alargamiento o elongación de la cadena polipeptídica: existen 20 aminoácidos esenciales diferentes, todos con una estructura básica común, constituida por un carbono central al que se le unen un grupo químico carboxilo, uno amino y otro grupo químico que es particular para cada aminoácido y que se conoce como “cadena lateral o R” (Figura 5).

Figura 5: Estructura básica de los aminoácidos
Todos los aminoácidos poseen un carbono central, al cual se le unen un grupo carboxilo, un grupo amino y una cadena lateral (cadena R).
Fuente:http://www.argenbio.org/adc/uploads/imagenes_
doc/composicion_%20delas_%20celulas/aminoacido.JPG

Para la elongación de la cadena de polipeptídica, el extremo carboxilo del  aminoácido del sitio P se une mediante un enlace covalente al extremo amino del aminoácido ubicado en el sitio A.  Este enlace entre aminoácidos se denomina unión peptídica y es catalizado por la peptidil-transferasa, una enzima firmemente unida al ribosoma. El ARNt del sitio A, ahora sin su aminoácido, es liberado al citoplasma; seguidamente, el ribosoma se desplaza exactamente 3 nucleótidos a lo largo de la molécula de ARNm -translocación ribosomal- y de esta manera quedará el sitio P ocupado por el ARNt que tiene unida la cadena de aminoácidos en formación, quedando el sitio A libre para recibir al siguiente ARNt con su correspondiente aminoácido. Este proceso se  repetirá  casi tantas  veces como número de aminoácidos intervengan en la síntesis de la cadena polipeptídica (ver figura 3).
-Terminación: de los 64 diferentes codones que existen (4 nucleótidos  agrupados de a tres = 4x4x4=64), hay 3 que no codifican para ningún aminoácido, sino que son codones que indican la finalización de la cadena polipeptídica. Son los llamados codones stop (UAA, UAG, UGA) y a ellos se unen directamente factores de terminación o de liberación en el sitio A. Esta unión perturba la acción de la enzima peptidil-transferasa, haciendo que la traducción termine y liberando el ribosoma y el polipéptido completo (ver figura 3).
Una vez finalizada la síntesis de la proteína, el ARN mensajero queda libre y puede ser leído de nuevo. De hecho, es muy frecuente que antes de que finalice la síntesis de una proteína ya está comenzando otra, con lo cual, una misma molécula de ARN mensajero, está siendo utilizada por varios ribosomas simultáneamente. A este complejo de ARNm con múltiples ribosomas y sus respectivas cadenas polipeptídicas en crecimiento se lo denomina polisoma y es frecuente observarlo en las células activas.

Finalmente, las proteínas
Con lo visto hasta ahora, se puede definir a las proteínas como macromoléculas (es decir, moléculas grandes) formadas por polímeros de aminoácidos, una cadena formada a partir de aminoácidos. Sin embargo, las proteínas poseen distintos niveles estructurales: el resultado inmediato de la síntesis proteica, es lo que se denomina estructura primaria, es decir, la secuencia lineal y ordenada de aminoácidos (Figura 6a). A partir de esta secuencia básica, las características físico-químicas de los grupos laterales (cadena R) de los aminoácidos hacen que éstos, aunque se encuentren alejados en el collar, puedan acercarse y adoptar múltiples conformaciones tridimensionales. Una de estas conformaciones es el plegamiento regular local entre residuos aminoacídicos cercanos de la cadena polipeptídica, gracias a la formación de enlaces químicos débiles, que da como resultado la estructura secundaria. Los motivos más comunes son la hélice alfa y la lámina plegada beta (Figura 6b). Luego, el modo en que la cadena polipeptídica se pliega en el espacio se denomina estructura terciaria (Figura 6c). Finalmente, y en algunos casos,  varias cadenas proteicas plegadas (o subunidades) pueden unirse entre sí por uniones no covalentes, constituyendo la estructura cuaternaria. (Figura 6d).


Ampliar imagen

Figura 6: Estructura proteica. Las proteínas poseen una estructura 1ria (a, cadena lineal de aminoácidos), y las estructuras tridimensionales: 2ria (b, lámina plegada beta y hélice alfa), 3ria (c, subunidad proteica)  y 4ria (d, proteína formada por más de una subunidad)
Fuente: http://4.bp.blogspot.com/_EdiSPJX1jg8/Sh23fpZSypI/
AAAAAAAABzU/zApnBrIJHUI/s400/estruc+1+prot.JPG

Código genético, universal y degenerado
Uno de los desafíos científicos del siglo XX consistió en descifrar cuál era la relación entre la secuencia de bases en el ADN y la secuencia de aminoácidos que forman las proteínas. Como se dijo anteriormente, el ARNm es leído cada tres nucleótidos (o codón), que corresponden a un aminoácido determinado. Este “diccionario” que permite traducir la información escrita en el lenguaje de los ácidos nucleicos (nucleótidos) al lenguaje de las proteínas (aminoácidos) se denomina código genético (ver cuaderno nº 3 y Figura 7).



Ampliar imagen

Figura 7: Código Genético. Es el “diccionario” que permite traducir el lenguaje de los ácidos nucleicos al de las proteínas.
Fuente: http://perso.wanadoo.es/sancayetano2000/biologia/
images/codigo.gif

El código genético fue elucidado por Marshall Nirenberg y Heinrich Matthaei, diez años después de que Watson y Crick describieran la estructura de doble hélice del ADN. Descubrieron que el ARN, independientemente del organismo del cual era aislado, podía iniciar la síntesis de proteínas cuando se lo incubaba junto a extractos celulares. Agregando un ARN sintético formado sólo por uracilos (poli-U), determinaron que el codón UUU (el único posible en el ARN poli-U) codificaba para el aminoácido fenilalanina, ya que el único producto que aparecía en el tubo era un polipéptido que contenía sólo este aminoácido. De la misma manera, un ARN artificial que consistía en nucleótidos A y C alternados originaba un polipéptido formado por histidinas y treoninas. Así, observando los productos formados luego de la incubación con una serie de ARN sintéticos, estos investigadores consiguieron descifrar completamente el código genético (ver cuadernos nº 3, 20, 32).

Una de las características más significativas de este código es su universalidad; esto significa que el mismo codón en diferentes especies codifica para el mismo aminoácido. Efectivamente, los seres humanos, los monos, las cucarachas, las plantas, las bacterias, los hongos, etc. compartimos este código, lo que lleva a meditar acerca de un origen común y único a todos los seres vivos. La mejor demostración de que el código genético es universal es la posibilidad, mediante las técnicas de ingeniería genética (ver cuaderno nº 4), de que al introducir el ADN de un organismo en otro, el organismo receptor sintetice las proteínas del organismo donante del ADN. Por otro lado, de los 64 codones que existen, 61 corresponden a aminoácidos (los otros 3 son codones de terminación). Como sólo existen 20 aminoácidos, hay más codones que aminoácidos, de forma que un determinado aminoácido puede estar codificado por más de un triplete (por ejemplo, a la  glicina le corresponden los codones GGU, GGC, GGA y GGG). Es por eso que se dice que la otra característica del código genético es ser degenerado.

Regulación de la expresión génica
Todas las células de un organismo poseen la misma información genética y sin embargo, las proteínas expresadas en cada tipo celular no son las mismas. Muchas  veces, ni siquiera en una misma célula se expresa el mismo tipo de proteína, puesto que su síntesis depende de muchos factores, tanto internos como señales o factores externos. Es decir que la producción de proteínas a partir de los genes esta regulada, y este control es central para que una célula sea lo que es.
En términos generales, cuál gen se expresa y cuál no, está determinado por un control que se ejerce principalmente a nivel de la transcripción. En ella, moléculas proteicas especializadas son las encargadas de reprimir (regulación negativa) o de activar (regulación positiva) la expresión de determinado gen (ver cuaderno nº 115). En la regulación negativa, una proteína denominada represor bloquea la región de unión de la ARNpol al ADN. En el caso de la regulación positiva, las proteínas activadoras favorecen la unión de la ARNpol a zonas del ADN a las que normalmente la enzima no es muy afín.
Otro punto de control muy importante que puede ocurrir tanto en la etapa de transcripción como en la de traducción, y tanto en el núcleo como en el citoplasma de la célula, es el silenciamiento génico (ver cuaderno nº 115): a nivel de transcripción, el silenciamiento se produce por la modificación del ADN mediante el agregado de un grupo químico llamado metilo. La metilación de bases impide el reconocimiento de los promotores por las polimerasas, y por lo tanto que se exprese ese gen. En cambio, en el silenciamiento génico postranscripcional sí hay transcripción del gen silenciado. Lo que ocurre es que el ARN mensajero sintetizado es degradado de forma específica, en función de su secuencia. En este caso tampoco habrá síntesis proteica del gen que esta siendo “silenciado” (ver cuaderno nº 115).

¿Cada gen codifica para una proteína?
Hasta hace no mucho tiempo, la idea de que cada gen produce una proteína específica –conocida como la hipótesis «un gen, una proteína»– fue un hito en el desarrollo de la biología moderna. Sin embargo, y en base a estudios que se vienen realizando en el área de la biología molecular, ingeniería genética y las “ómicas” (ver cuadernos nº 4, 65, 114), este concepto fue cambiando.  ¿Cómo explicar la complejidad de la biología humana con un número de genes no mucho mayor al de la mosca de la fruta o con menos del doble que un simple gusano? Todo indicaba que la complejidad del organismo humano está más allá del número de genes. La respuesta se encontró en un proceso de modificación postranscripcional denominado "splicing alternativo". Es un mecanismo de modificación del ARN mensajero que genera diversidad proteica a partir de un número limitado de genes, en el cual múltiples zonas del ARNm, denominadas intrones, son eliminadas del ARN mensajero maduro, mientras que otras regiones, llamadas exones, son cortadas y re-empalmadas de distintas formas. Es algo así como la edición que puede hacerse de un video para obtener versiones  más cortas y diferentes al video original.
Ha ido extendiéndose la idea de que el splicing alternativo, que antes se consideraba excepcional, es cosa común. Generalmente, un gen sólo permite unos pocos splicings alternativos, pero en ciertos casos esto no es así. En los humanos, un buen ejemplo es el gen de la tropomiosina, una proteína estructural. El splicing alternativo produce cinco versiones distintas de esta molécula que se expresan en cinco tejidos diferentes del cuerpo: el músculo esquelético, el músculo liso, los fibroblastos, el hígado y el cerebro. Las células, en cada tipo de tejido, ensamblan de forma diferente los 11 exones que conforman el gen, produciendo las distintas formas de la proteína. Hay un  ejemplo excepcional en la mosca de la fruta: posee un gen que puede generar 38.000 versiones diferentes a partir del mismo ARNm, una cantidad que excede de lejos la cantidad total de genes (~14.500) en dicho organismo. En conjunto, esto significa que hay mucha más información codificada en el genoma de lo que se creía anteriormente. La cantidad de proteínas funcionalmente distintas que podrían estar codificadas por el genoma es inmensa, siendo el splicing alternativo una de las principales fuentes de la diversidad de proteínasen los eucariotas pluricelulares.

La síntesis de proteínas y la biotecnología
La posibilidad de aislar un gen de una especie, insertarlo en otra y lograr que ésta  sintetice una nueva proteína, o proteína recombinante (ver Cuaderno nº 49) es lo que se conoce como ingeniería genética o tecnología del ADN recombinante y es parte fundamental de la biotecnología moderna (ver cuadernos nº 4, 20, 65, 67). Así, y tras el trascendental descubrimiento de las enzimas de restricción en los años ´70 (ver cuadernos nº 34 y 49) y luego de varios años de experimentación y desarrollo de nuevas tecnologías, hoy es posible, por ejemplo,  producir en diversos sistemas biológicos proteínas potencialmente terapéuticas y en grandes cantidades (ver Cuaderno nº 21, 25). La insulina fue el primer caso de proteína producida por ingeniería genética  aprobada para uso en humanos. En la actualidad, varios laboratorios farmacéuticos producen insulina humana, tanto a partir de bacterias como de levaduras, y sin ningún riesgo para la salud. Existen más de 30 proteínas recombinantes aprobadas para su uso clínico y esperan en la gatera otras cientas a ser testeadas en su adecuación clínica (ver cuaderno nº 49). Vacunas contra la hepatitipis B, hormona de crecimiento humano, enzimas utilizadas en polvos para lavar la ropa y para la industria alimenticia, plantas resistentes a enfermedades, a herbicidas, al frío o a la sequía, vacas productoras de medicamentos, son algunos de los muchos logros desarrollados hasta el momento y, sin embargo, son sólo la punta del iceberg de lo que puede alcanzarse a partir del conocimiento de procesos y mecanismos tan básicos y esenciales como el código genético, el ADN y la síntesis  proteica.

 
 

Ver cuaderno anterior

 
 
 

  Secciones de
El Cuaderno Nº123:
 
     
  Teoría  
     
  Consideraciones
Metodológicas
 
     
  Actividades  
     
  Material de consulta  
 
     
  Ediciones destacadas de "El Cuaderno"
 
El Cuaderno N° 43:
Datos de adopción y beneficios de cultivos GM 2015.2016
 
El Cuaderno N° 100:
Biotecnología, una historia...
 
 
® Copyright ArgenBio 2007 - Todos los derechos reservados - Términos y Condiciones