Inicio
 
  Acerca de Por Qué Biotecnología (Programa Educativo)
 
  La Biotecnología
 
  Recursos para la enseñanza de la biotecnología
 
  El Cuaderno
 
  Trabajos Prácticos
 
  Glosario de términos de biotecnología
 
  Links recomendados
 
  Cursos y capacitaciones docentes
 
  Dónde estudiar biotecnología
 
  Suscríbase a publicaciones
 
  Contáctenos
 
  facebook  
Cuaderno Nº 38  

Bioestadística
 

La estadística es el área de las matemáticas que permite recoger, organizar, resumir, presentar y analizar datos sobre fenómenos y procesos. Pero, el trabajo del especialista en estadística no consiste sólo en reunir y tabular los datos, sino sobre todo en el proceso de interpretación de esa información para obtener conclusiones y tomar decisiones basadas en esos análisis. Su aplicación es muy amplia, por ejemplo, en la interpretación de fenómenos físicos, meteorológicos, biológicos, de las ciencias sociales y de las organizaciones. El avance de la computación numérica y el desarrollo de la teoría de la probabilidad ha aumentado el alcance de las aplicaciones de la estadística. Hoy en día, la bioestadística ayuda a investigar en todas las áreas de las Ciencias de la vida (biología, ecología, medicina, entre otras) en donde los datos observados presentan una gran variabilidad.

Los inicios de la estadística
Desde el año 3000 a.C. han existido formas sencillas de estadísticas, pues ya se utilizaban representaciones gráficas y otros símbolos tallados en distintos materiales (piedras, pieles, maderas) para contar el número de personas o animales. Por ejemplo, los babilonios usaban pequeñas tablillas de arcilla para recopilar datos sobre la producción agrícola y los egipcios analizaban los datos de su población. En China existían registros numéricos similares con anterioridad al año 2000 a.C. Los griegos clásicos realizaban censos cuya información se utilizaba hacia el año 600 a.C. para cobrar impuestos. Muchos años después, en 1662, apareció el primer estudio estadístico importante de una población titulado Observations on the London Bills of Mortality (Observaciones sobre las partidas de defunción en Londres).
Con la divulgación del método científico en el siglo XIX, para estudiar los fenómenos de las ciencias naturales y sociales, los investigadores comenzaron a reducir la información a valores numéricos para una mayor comprensión de los fenómenos observados.

Algunos conceptos básicos
El mundo presenta una enorme variabilidad. Por ejemplo, los seres vivos son distintos entre sí, y aportan diversidad a la población. Muchas son las características que pueden variar entre individuos (en el ser humano: altura, color de pelo, sexo, edad, respuesta a tratamientos, entre muchos otros). Se las llama variables y se las puede clasificar como se indica en la siguiente tabla:  

Ampliar imagen

La estadística se aplica sobre la variabilidad, y se puede utilizar de dos maneras: 
- la estadística descriptiva se dedica a la  presentación, organización y resumen de los datos observados.
- la estadística inferencial permite generalizar los datos de las muestras a un número más grande de individuos (población).
Cuando se estudia el comportamiento de una variable en una población (conjunto sobre el que se desea obtener conclusiones o hacer inferencias) hay que tener en cuenta que ésta normalmente es demasiado grande para poder abarcarla. Entonces, se toma una muestra formada por miembros “seleccionados” de la población (individuos o unidades experimentales) y que es suficientemente representativa (en cantidad y diversidad).

¿Cómo se analizan los datos?
Cuando se toman datos de una muestra, éstos son inicialmente compilados en bases de datos (tablas de frecuencias), para luego ser presentados en forma gráfica. Esto ayuda a visualizar e interpretar la variación de los datos.
La distribución de frecuencia es la representación estructurada, en forma de tabla, de la información que se ha recogido sobre la variable en estudio, como se muestra en la siguiente tabla, en donde  X son los distintos valores que puede tomar la variable, n es el número de veces que se repite cada valor, y f es el porcentaje (en relación con el total) en el  que se repite dicho valor.

Ampliar imagen

Por ejemplo, al medir la altura de los niños de una clase, se obtienen los siguientes resultados (en metros)

Ampliar imagen

Extraído de: 
http://www.aulafacil.com/CursoEstadistica/Lecc-2-est.htm

A partir de estos datos, se puede obtener la siguiente tabla de frecuencias:

Las frecuencias simples se obtienen contando cuántos niños tienen determinado valor (por ejemplo hay 1 niño que mide 1,20m y 4 que miden 1,22 m.).

Las frecuencias relativas simples consideran cada valor en relación con el total: por ejemplo para el valor 1,20, hay 1 solo niño (de un total de  30) que posee esa altura,  entonces la frecuencia (en %) es: 1/30*100= 3,3%

Si los valores que toma la variable son muy diversos y cada uno de ellos se repite muy pocas veces, entonces es conveniente agruparlos por intervalos, como muestra el histograma (ver más adelante), ya que de otra manera se obtendría una tabla de frecuencia muy extensa.

Una vez obtenida una tabla de frecuencias, se puede representar mediante un gráfico. En estadística se denominan gráficos a aquellas imágenes que, combinando la utilización de colores, puntos, líneas, símbolos, números, texto y un sistema de referencia (coordenadas), permiten presentar información cuantitativa. La utilidad de los gráficos es doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también constituyen por sí mismos una poderosa herramienta para el análisis de los datos, siendo en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino también para visualizarla y analizarla.


Tipos de gráficos


• Gráficos para variables cualitativas

Diagramas de barras: se representan en el eje de ordenadas (X) las modalidades, y en abscisas (Y) las frecuencias absolutas o relativas.
Por ejemplo: el porcentaje de personas que pertenecen a los distintos grupos sanguíneos son: B: 7%; A: 44%; AB: 3%; 0: 46%.


Diagramas de sectores (también llamados tortas): Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa. Para los datos del ejemplo anterior se muestra el gráfico de torta correspondiente.

• Gráficos para variables numéricas
Hay diferentes tipos de gráficos, dependiendo de si las variables son discretas o continuas. En estos gráficos se pueden representar tanto frecuencias absolutas como relativas.

Diagramas de barras para variables discretas
Se deja un hueco entre barras para indicar los valores que no son posibles (por ejemplo, números decimales de  hijos)

Histogramas para variables continuas
El área que hay bajo el histograma entre dos puntos cualesquiera indica la cantidad (porcentaje o frecuencia) de individuos en el intervalo.
Tomando el ejemplo de las tablas anteriores, se representan la frecuencia de alumnos según su estatura (agrupada en clases o intervalos)

Cada unos de los diagramas anteriores, puede tener su correspondiente diagrama integral, el cual se construye a partir de las frecuencias acumuladas, ya sean absolutas o relativas. Indican, para cada valor de la variable,  la cantidad (frecuencia) de individuos que poseen un valor inferior o igual al mismo (ver tabla anterior).
Generalmente, tras la elaboración de la tabla y su gráfica, en la mayoría de las ocasiones resulta más eficaz resumir la información en algunos números que la expresen de forma clara y concisa.


Probabilidades. Algunos conceptos básicos
Si se quieren representar los resultados de un experimento, los métodos de la estadística descriptiva son suficientes. Sin embargo, si lo que se pretende es utilizar la información obtenida para extraer conclusiones generales sobre todos los objetos del mismo tipo de los estudiados, entonces estos métodos constituyen sólo el principio del análisis, y se debe recurrir a métodos de inferencia estadística, los cuales implican el uso de la teoría de la probabilidad.
La probabilidad es la posibilidad de que algo pase. Se expresa como fracciones o como decimales que toman valores entre cero y uno. Tener una probabilidad de 0 (cero) significa que algo nuca va a suceder, mientras que una probabilidad de 1 (uno) indica que algo va a suceder siempre.
En la teoría de la probabilidad, un evento es uno o más de los posibles resultados de algo. La actividad que origine uno de dichos eventos se conoce como experimento aleatorio. Al conjunto de todos los resultados posibles de un experimento se le llama espacio muestral del experimento.

Tipos de probabilidad

Existen tres maneras básicas de clasificar la probabilidad:

1. Frecuencia relativa de presentación
En el siglo XIX, los estadísticos británicos comenzaron a recoger datos sobre nacimientos y defunciones para poder calcular el riesgo de pérdidas en las pólizas de seguros de vida. En la actualidad, a este proceso se lo llama frecuencia relativa de presentación de un evento y define la probabilidad como: La frecuencia relativa observada de un evento durante un gran número de intentos, o la fracción de veces que un evento se presenta a la larga, cuando las condiciones son estables.
Con este método se determina qué tan frecuente ha sucedido algo en el pasado y se usa esa cifra para predecir la probabilidad de que suceda de nuevo en el futuro. Aquí, el número que se obtiene como probabilidad adquirirá mayor precisión a medida que aumentan las observaciones.

2. Probabilidades subjetivas
Las probabilidades subjetivas están basadas en las creencias de las personas que efectúan la estimación de probabilidad. La probabilidad subjetiva se puede definir como la probabilidad asignada a un evento por parte de un individuo, basada en la evidencia que se tenga disponible. Las asignaciones de probabilidad subjetiva se dan con más frecuencia cuando los eventos se presentan sólo una vez o un número muy reducido de veces.

3. Probabilidad clásica
Se define la probabilidad de que un evento X ocurra como:
P(X) = Número de resultados favorables / número total de resultados posibles

La probabilidad clásica es conocida como probabilidad a priori, debido a que si se utilizan ejemplos previsibles (como al arrojar monedas o dados), se puede establecer la respuesta de antemano, sin necesidad de lanzar una moneda o un dado. No tenemos que efectuar experimentos para poder llegar a conclusiones. Así, la probabilidad de que salga “cara” al tirar una moneda es de 50% o 0,5, ya que es 1 de 2 posibilidades (cara o ceca).
En la resolución de problemas de probabilidad clásica, se debe tener en cuenta si los sucesos son incompatibles, condicionados o independientes.

Dos sucesos X e Y son incompatibles si el hecho de que uno ocurra conlleva la imposibilidad de que lo haga el otro. Un ejemplo muy conocido es el lanzamiento de un dado: cuando sale una de sus caras no puede salir otra al mismo tiempo. Entonces, la probabilidad de que se produzca X o Y  es la probabilidad de X más la probabilidad de Y (Ley de la suma)
P (X o Y) = P (X) + P (Y), donde P es la abreviatura estadística de probabilidad.
Por ejemplo,  la probabilidad de que salga un 4 o un 6 al arrojar un dado es:
P(4) + P(6)= 1/6 + 1/6 = 2/3
Dos sucesos X e Y con condicionados si el hecho de que ocurra Y depende de lo que haya hecho X, o al revés.  La probabilidad de que ambos ocurran simultáneamente es la probabilidad de X multiplicada por al probabilidad de Y, suponiendo que ya haya sucedido X (Ley de multiplicación).
P (X eY)= P(X) x P(Y/X), donde P(Y/X) designa la probabilidad de Y condicionado a X.
Hay muchos sucesos que no son condicionados ni incompatibles, sino que son independientes entre sí.  La probabilidad de que dos sucesos independientes ocurran, viene dado por la multiplicación de las probabilidades de cada uno de ellos.
P(X e Y)= P(X) x P(Y)
Por ejemplo, la probabilidad de que al arrojar un dado salga un 4 y un 6 es: P(4) x P(6)= 1/6 x 1/6= 1/36

Las probabilidades y la genética
Una parte importante en el trabajo de un genetista es predecir el tipo de progenie que se originará de una cierta cruza y poder calcular la proporción de los mismos, es decir, determinar sus probabilidades.
Los estudios de uno de los genetistas más famosos, Gregor Mendel,  son un ejemplo de una correcta utilización del método científico. Eligió el material de investigación más indicado para resolver el problema propuesto (la herencia de caracteres), diseñó los experimentos cuidadosamente, recolectó una enorme cantidad de datos y utilizó un análisis estadístico (probabilidades) para demostrar que los resultados obtenidos confirmaban sus hipótesis. Las predicciones de las hipótesis eran posteriormente chequeadas en una nueva serie de experimentos.
Los experimentos y las conclusiones obtenidas en los experimentos de Mendel se desarrollan en los Cuadernos Nº 40 y 41.

 
 

Ver cuaderno anterior

 
 
 

  Secciones de
El Cuaderno Nº38:
 
     
  Teoría  
     
  Consideraciones
Metodológicas
 
     
  Actividades  
     
  Material de consulta  
 
     
  Ediciones destacadas de "El Cuaderno"
 
El Cuaderno N° 43:
Datos de adopción y beneficios de cultivos GM 2015.2016
 
El Cuaderno N° 100:
Biotecnología, una historia...
 
 
® Copyright ArgenBio 2007 - Todos los derechos reservados - Términos y Condiciones