UNIDAD TEMÁTICA 2: MEJORAMIENTO GENÉTICO ANIMAL … · El coeficiente de regresión (b) en la...

Introducción a la Producción Animal - FCV - UNNE

UT 2. Capítulo II. Tema 4. 1

UNIDAD TEMÁTICA 2: MEJORAMIENTO GENÉTICO ANIMAL

Capítulo II: Selección

Tema 4: Predicciones genéticas. Metodología general. Fuentes de información. Fenotipo del

individuo, genealogía, progenie. Tecnología de predicción genética: índice de selección y

mejor predicción lineal insesgada. Conceptos generales y usos.

Predicciones genéticas. Metodología general. Fuentes de información. Fenotipo del

individuo, genealogía, progenie.

Cuando se lleva a cabo la selección para cualquier carácter tratamos de elegir como

progenitores aquellos animales que presentan los mejores BV para ese carácter, de entre

todos aquellos candidatos disponibles a la selección, de modo de poder conseguir el �� más

alto para ese carácter en la descendencia de los individuos seleccionados. Si se conociera el BV

real de cada candidato se podría conseguir este objetivo con la máxima eficiencia simplemente

ordenando los candidatos de acuerdo a su BV real y luego seleccionar los que están en los

primeros lugares.

En la práctica, no es posible conocer el BV real para ningún carácter, en lugar de eso lo que

se puede hacer es estimar el BV a través de ciertos indicios o evidencias que reciben el nombre

de criterios de selección y que consisten en una o más medidas de los P tomados del animal

y/o de sus parientes.

Cuando se ordenan los animales de acuerdo el EBV para un determinado carácter se trata

de hacerlo de acuerdo a su BV real, por lo tanto, cuanto más precisa sea esa estimación más

precisa será la clasificación de los candidatos a la selección. La precisión en las estimaciones

puede ir de 0% donde los indicios no nos proporcionan información sobre el BV, al 100% que

sería el BV real; si la precisión es 0% los animales estarán en realidad ordenados al azar con lo

cual seleccionar aquellos que están en el principio de la lista no produce respuesta a la

selección. En el otro extremo, si la precisión fuera del 100% la respuesta a la selección será

máxima.

Existen muchos indicios o evidencias potenciales del BV real de un candidato, el más simple

y más comúnmente disponible es un único registro de su propio P para el carácter. Las

medidas de los P de los candidatos reciben el nombre de pruebas de rendimiento y la selección

en base a los resultados de estas recibe el nombre de selección individual, masal o fenotípica.

Otros indicios o evidencias potenciales del BV real de un candidato incluyen una medida del

carácter en un pariente del candidato, por ejemplo: un padre, un hermano o un hijo, o en un

grupo de parientes tales como hermanos completos (familia materna) o medios hermanos

(familia paterna). La selección basada en el rendimiento (P) de un antepasado recibe el

nombre de selección por pedigrí, y la basada en el rendimiento de hermanos se denomina

selección fraternal o por parientes colaterales. Al evaluar los candidatos en base al rendimiento

(P) de su descendencia se denomina prueba de descendencia o de progenie. En síntesis, la

información utilizada en el cálculo de las predicciones genéticas para un individuo proviene de

tres clases de fuentes:

1. Registros del P del propio individuo

2. Registros del P de antecesores y/o parientes colaterales de los individuos (datos de

pedigrí o genealógicos)

3. Los registros del P de los descendientes del individuo (datos de la progenie).

La precisión de la selección aumenta cuantos más indicios o evidencias se utilicen.



Selección fenotípica

Por ejemplo, si se estuviera realizando esta selección para peso corporal y se quisiera

determinar si una borrega en particular debe ser elegida para vientre, podría basarse

solamente en su propio peso corporal. En cada generación las borregas más pesadas son

elegidas para convertirse en madres, y el resultado a lo largo del tiempo es un incremento

general en el peso corporal. Las borregas de reemplazo son seleccionadas en base de su P para

el peso corporal con la expectativa de que este, es un indicador razonable de los genes que lo

afectan. En otras palabras, el P para el peso corporal en ovinos está relacionado con el BV para

ese carácter. Si no fuera así, la selección fenotípica para éste no daría resultados.

Como vimos esta relación entre P y BV es la heredabilidad. Cuando ésta es alta los fenotipos

son generalmente buenos indicadores de los BV subyacentes, y la selección fenotípica será

efectiva; cuando es baja, los P revelan poco acerca de los BV y la selección fenotípica no será

efectiva.

Selección basada en la información del pedigrí

En este tipo de selección se tiene en cuenta el rendimiento (P) para un determinado

carácter de los antepasados para calcular la probable capacidad que tendrá la descendencia,

basados en el conocimiento de que los individuos emparentados comparten genes en diversas

proporciones como se puede ver en la siguiente figura:

Como se vio en la Unidad 1, un árbol genealógico o pedigrí es un registro de los

antepasados de un individuo que están relacionados con él a través de sus progenitores. Este

tipo de selección adquiere importancia, cuando no se dispone de datos de producción o

cuando los animales son tan jóvenes que no se conocen sus BV individuales.

Al recurrir a este tipo de selección se debe tener en cuenta que los ascendientes más

próximos en el pedigrí son los importantes y no los que están separados por varias



generaciones. Por ejemplo, un antepasado sobresaliente a 3 ó 4 generaciones de distancia sólo

contribuye con un muy pequeño porcentaje de sus genes en ese descendiente, por lo tanto

tiene poca influencia sobre su tipo y producción.

Un ejemplo de esto es la selección de vaquillonas de reposición en los tambos, evaluando la

producción de leche de la “línea baja” (hembras), hasta la cuarta generación en los pedigríes.

Selección basada en información de parientes colaterales

Los parientes “colaterales” son todos los que no son “directos”, o sea antepasados o

descendientes, por ejemplo, hermanos, hermanas, medios hermanos, tíos, tías, etc.

Se evalúa el P de los parientes más cercanos, ya que es muy probable que tengan las

mismas combinaciones de genes que el individuo y que este los transmitirá a su descendencia.

Si la información sobre los parientes colaterales es completa nos da una idea de los genes y sus

combinaciones que el individuo en cuestión probablemente posea.

En los programas de certificación de cerdos para carne, esto puede ser utilizado ya que de

una camada entera pueden ser sacrificados algunos para evaluar la calidad de la canal. Lo

mismo sucede en la selección de toros lecheros, evaluando la producción de leche de sus

hermanas, que posiblemente se transmitirá por él a su descendencia.

Selección basada en información de la progenie

Consiste en seleccionar los animales sobre la base de los P de su progenie, por ejemplo, el

peso de sus hijos al nacer, el peso al destete, las ganancias diarias de peso, la eficiencia de

conversión alimenticia, su tipo corporal, la evaluación de sus reses, etc.

PREDICCION

Valores reales y predichos

Recordemos el modelo para caracteres cuantitativos y sus componentes denominados

valores:

P = µ + BV + GCV + E

Los componentes del modelo son llamados valores reales o verdaderos, atributos que

afectan el P de un animal para un carácter, otros valores verdaderos serían las diferencias de

progenie (DP), habilidad de producción (HP) y efectos permanentes (Ep) y temporarios (Et) del

ambiente.

Los valores reales, con la excepción de los P no son medibles directamente, con lo cual

debemos trabajar con las predicciones de dichos valores. Los valores predichos son calculados

a partir de los datos de P usando técnicas estadísticas. Los más comunes son el valor estimado

de cría (EBV), la diferencia esperada en la progenie (DEP) y la habilidad de producción más

probable (HPMP), como se vio anteriormente.

Es importante distinguir valor real y predicho, ya que las diferencias entre ambos pueden

ser bastante grandes, dependiendo de la cantidad y calidad de información utilizada para

calcular los valores predichos.

Ecuaciones de predicción

Los valores predichos se calculan mediante una simple ecuación o un conjunto de

ecuaciones de predicción. En su forma más simple una ecuación de predicción sería la

siguiente:



Valor predicho (I) = coeficiente de regresión (b) * “evidencia” (x)

I = b x

1. El valor predicho (I) puede ser una predicción de cualquier valor real de interés.

Típicamente predecimos BV, DP y HP, pero otros valores – por ejemplo, un P no medido

todavía – puede ser predicho también.

2. El coeficiente de regresión (b) en la ecuación, es la regresión del valor real sobre la

evidencia. En otras palabras, mide el cambio esperado en los valores reales por unidad de

cambio en la evidencia.

3. La evidencia (x) en este contexto usualmente se refiere a una medida de P de algún tipo.

Podría ser un simple registro de P para un individuo para quien estamos tratando de predecir

su BV, o podrían ser los registros de los promedios de los P de su progenie, medios hermanos,

etc.

La ecuación de predicción en su forma matemática

Matemáticamente, una ecuación de predicción sencilla aparece como:

Y i = 𝝁𝒀 + 𝒃𝒀 . 𝑿 (Xi - 𝝁𝑿)

Donde,

Yi = un valor predicho para un animal

𝜇𝑌 = la media esperada de las predicciones para los animales en la población

𝑏𝑌 . 𝑋 = la regresión de los valores que son predichos (Y) en la evidencia (X)

Xi - 𝜇𝑋 = la evidencia de animales i, expresado como una desviación de la media poblacional

Ejemplo:

Vamos a predecir el peso al destete de un ternero basado en su peso al nacimiento.

Necesitamos la regresión fenotípica para peso al destete sobre el peso al nacimiento porque

estamos prediciendo un valor fenotípico – peso al destete – usando evidencia fenotípica, el

peso al nacimiento del ternero. Asuma lo siguiente:

µ𝑃𝑃𝐷 , nuestra mejor estimación de lo que será el peso al destete promedio en la población, =

200 kg

𝐵𝑃𝑃𝐷.𝑃𝑃𝑁, la regresión fenotípica del peso al destete sobre el peso al nacimiento (calculado

anteriormente) = 1,15 kg por kg

𝑃𝑃𝑁, el peso al nacimiento del ternero, = 40 kg

µ𝑃𝑃𝑁= el peso al nacimiento en la población, = 37 kg

Entonces,

𝑃𝑃𝐷 = 𝜇𝑃𝑃𝐷 + 𝐵𝑃𝑃𝐷.𝑃𝑃𝑁

+ ( 𝑃𝑃𝑁𝑖 - 𝜇𝑃𝑃𝑁

)

= 200+ 1,15 (40-37)

= 203,45 kg

Predecimos un peso al destete de 203,45 kg para este ternero.



Tecnología de predicción genética: índice de selección y mejor predicción lineal insesgada.

Conceptos generales y usos.

El MGA para determinados caracteres en una población depende en gran medida de la

precisión de los BV estimados.

Revisión

A los efectos de comprender coeficiente de regresión a continuación se hará una

revisión (ampliar en bioestadística).

Como se vio en “Parámetros poblacionales” existen básicamente tres medidas de

covariación, la covarianza y correlación (descriptas en dicho punto) y la regresión.

La regresión o coeficiente de regresión (by.x) es la cantidad de cambio en una variable

que puede ser esperada para un cambio dado en otra variable. Al igual que las covarianzas

y correlaciones, son medidas poblacionales – no valores individuales – y pueden

involucrar toda clase de valores en una población.

Se utiliza la regresión del BV para un carácter sobre el P del mismo para ayudar a

predecir el BV de un animal basado en su propio P.

Las regresiones pueden ser

1. Positivas: indican un aumento en una variable cuando la otra variable se incrementa.

2. Negativas: indican que una variable decrece cuando la otra aumenta.

Por ejemplo, si se quiere predecir el peso de vellón sucio de un cordero basado en su

peso al destete. El valor a predecir es el P para peso de vellón, la evidencia es el P del

cordero para peso al destete y la regresión es del P para el peso de vellón sobre el P para

peso al destete (estimado en 80 gramos por kg). Si un cordero al destete pesa 5 kg más

que la media, entonces se esperaría que su peso de vellón sucio sea 80 gramos más

pesado por cada kg de ventaja en el peso al destete o 80 * 5, esto es igual a 400 gramos

más pesado que la media. Si el cordero pesa 2,5 kg menos que el promedio al destete se

esperaría que el peso de su vellón fuera 80*(-2,5) = -200 gramos sobre la media o 200

gramos más liviano que la media.

Un ejemplo en porcinos, si un reproductor cuya área de ojo de bife (medida del

rendimiento de carne magra) medido por ultrasonido fue de 0,6 cm2 por debajo de la

media y se quiere predecir su BV para área de ojo de bife (AOB). En este caso el valor real

a ser predicho es el BV para AOB, la evidencia es el P para este carácter que presentó el

reproductor, la regresión y el coeficiente de regresión es el BV para AOB sobre el P para el

carácter. Estimaciones publicadas de ésta regresión promedio es de 0,5 cm2 x cm2. El EBV

del cerdo para el AOB sería entonces 0,5 * 0,6 = 0,3 cm2 por arriba de la media o como el

BV medio es definido como 0, simplemente + 0,3 cm2.

Algunas predicciones son muy precisas y otras no, en los ejemplos anteriores es muy

probable que sean imprecisas, debido a que la “evidencia” en ambos casos es demasiado

escasa. Un simple registro de P para peso al destete o área de ojo de bife no es mucha

información. Las predicciones precisas provienen de un gran número de datos de alta

calidad y por esta razón la recolección de datos y las técnicas estadísticas usadas para

hacer las predicciones genéticas a partir de esos datos son una parte importante en MGA.



Como se dijo, la precisión de la selección aumenta cuantos más indicios o evidencias se

utilicen. Para aumentar la precisión se requiere el uso de tanta información como sea posible y

ponderar cada una apropiadamente. Esto requiere el uso de la tecnología de predicción

genética.

Dos metodologías estrechamente relacionadas que se utilizan comúnmente para la

predicción genética son: el índice de selección y la mejor predicción linear insesgada. En este

apunte se pondrá énfasis en cuándo deberían ser usadas, cuáles son sus características

especiales y la presentación e interpretación de las predicciones genéticas producidas con

estas tecnologías.

El índice de selección

En los programas de selección reales se dispone a menudo de evidencias o indicios sobre el

BV de un candidato para un determinado carácter que proceden de más de una fuente, por

ejemplo al seleccionar gallinas para la producción de huevos normalmente se dispone de datos

sobre el P de las hembras, sobre el 𝑃 de la familia materna (hermanos enteros) y sobre el 𝑃 de

la familia paterna (medios hermanos). Los machos candidatos pueden ser clasificados de

acuerdo con los promedios de la familia paterna y materna pero evidentemente sin ningún P

propio.

En el cerdo con frecuencia se pueden clasificar según su propio P y el de sus hermanos, al

utilizar todas estas evidencias la precisión aumentará. Podemos tener x evidencias distintas:

x1 registro único del P del propio individuo o el promedio de medidas repetidas de un

candidato

x2 registro del P de antecesores y/o parientes colaterales del individuo

x3 registros de producción o P de los descendientes del individuo

En todos los casos puede ser una única medida o bien un promedio de medidas repetidas.

La estimación global del BV de un candidato para un determinado carácter que se obtiene

generalmente a partir de las distintas evidencias se denomina índice de selección. Esta es la

suma ponderada de las evidencias asignando a cada una un peso o ponderación que maximice

la precisión del índice como una estimación del BV del candidato.

Un índice de selección es esencialmente una combinación lineal de varios tipos de

información fenotípica y factores de ponderación apropiados.

Toma la siguiente forma:

I= b1x1 + b2x2 + … + bnxn

Dónde

I = un valor índice o predicción genética

b1= un factor de ponderación

X1= un simple ítem de información fenotípica – un registro de producción o el promedio de los

registros de producción de un grupo.

n= número total de ítems de información fenotípica.

I: valor de cría estimado para individuos procedentes de un grupo contemporáneo

genéticamente similar.

Una característica importante del índice de selección es que cada P (x1, x2, x3, etc.) es

normalmente expresado como el desvío de la media de un grupo contemporáneo (GC).



Un GC es un grupo de animales que han experimentado un ambiente similar para la

expresión de uno o varios caracteres. Un ambiente similar en este contexto significa que los

animales del grupo se desempeñan en el mismo lugar físico, son del mismo sexo, de edad

similar y han tenido un mismo manejo.

La ventaja de seleccionar en base a las desviaciones de la media de un GC cuando los

grupos de animales experimentan diferentes ambientes, es que se tienen en cuenta las

diferencias ambientales entre GC.

Otra característica importante para confeccionar un índice de selección es que todos los GC

deben ser genéticamente similares. Por ejemplo, un desvío de +10 unidades de peso en un GC

se asume como el equivalente genético de una desviación de +10 unidades en cualquier otro

GC. Si el 𝐵𝑉 en cada grupo es el mismo, (es decir si los GC son realmente genéticamente

similares) esta asunción es correcta. Sin embargo, si el 𝐵𝑉 de los GC difiere, el uso de las

desviaciones de las 𝐺𝐶 crea sesgos en los datos. Un sesgo es cualquier factor que causa la

distorsión de las predicciones genéticas. Los registros provenientes de los GC genéticamente

más pobres parecen mejores de lo que deberían, y viceversa.

Por esta razón, los índices de selección solo deberían ser usados para las predicciones

genéticas cuando los datos del P provienen de un GC que se piensa son genéticamente

similares. En la práctica, esto significa que probablemente deberían ser utilizados dentro de un

rodeo o majada de un mismo productor y no en toda una población (raza). Y si un determinado

rebaño ha experimentado cambios genéticos significativos en el tiempo, los datos

provenientes de los GC más antiguos – grupos con BV más “antiguos” y por lo tanto diferentes

– deberían ser excluidos del índice.

Registros de información fenotípica (x)

Las cantidades relativas de datos de las tres fuentes (propio P, del pedigrí, y los datos de

progenie) pueden variar. Animales no nacidos o muy jóvenes tienen solamente datos de

pedigrí aunque a medida que crecen irán adquiriendo datos propios y si son seleccionados

para convertirse en padres, ellos generarán datos de progenie.

Cualquiera de los tres tipos de registros se puede tomar de cualquier carácter para el cual

se calcularán las predicciones, también pueden ser datos de otros caracteres genéticamente

correlacionados. Por ejemplo, las predicciones para la susceptibilidad genética hacia la distocia

(dificultad al parto) pueden ser determinadas por la medida directa como grados de distocia,

por el peso al nacimiento (un carácter genéticamente correlacionado), o por ambos.

Como se vio más arriba, los datos utilizados en el índice de selección (x1) provienen de

muchas fuentes dentro de las categorías: del propio P, del pedigrí, y los datos de progenie. Por

ejemplo, x1 podría ser un registro de P individual propio para un carácter, x2 podría ser el

promedio de P de medios hermanos paternos del individuo para el mismo carácter, x3 podría

ser el promedio del P de la progenie del individuo, y x4, x5 y x6 podrían representar el P del

individuo, medio hermano, y progenie respectivamente para un carácter correlacionado. En

todos los casos cada x es un número correspondiente a un valor fenotípico.

Coeficiente de regresión (b)

Para ser utilizado en un índice se calculan sus valores numéricos por fórmulas bastantes

complicadas.



Con todos estos detalles, una definición más apropiada de índice de selección sería: es una

combinación lineal de información fenotípica y factores de ponderación que es usada para la

predicción genética cuando los datos del P provienen de GC genéticamente similares.

Predicción utilizando una sola fuente de información

Los índices de selección más simples son aquellos que involucran una sola fuente de

información x. Son de la siguiente forma:

I = b x

Como se llega de la ecuación de predicción vista más arriba al índice de selección con una sola

fuente. La ecuación simple de predicción se expresa como:

��𝑖 = ��𝑌 + 𝑏𝑌.𝑋 (𝑋𝑖 − ��𝑋)

Donde,

��𝑖 = un valor de predicción para el animal i

��𝑌 = la media de las medias esperadas para los animales de la población

𝑏𝑌.𝑋 = la regresión de los valores que se estan estimando sobre la evidencia

𝑋𝑖 − ��𝑋 = la evidencia del animal i, expresada como la desviación de la media poblacional

En el índice de selección más simple utilizando solo una fuente de evidencia, el valor predicho

es el valor índice, o

��𝑖 = 𝐼

Valor de cría, diferencia de progenie, etc., promedian cero en la población, asimismo sus

predicciones, entonces

��𝑌 = 0

El coeficiente de regresión es

𝑏𝑌.𝑋 = b

La evidencia en un índice de selección se expresa como desviación de la media de un grupo

contemporáneo, entonces

(𝑋𝑖 − ��𝑋) = x

Poniendo todo junto,

𝐼 = 0 + 𝑏𝑥

𝐼 = 𝑏𝑥

Los índices de selección utilizando una sola fuente de información son fáciles de calcular

porque se necesita solo una ecuación para resolver el coeficiente de regresión b. Algunas

fórmulas para b utilizadas en algunos índices de este tipo, se pueden ver en la tabla siguiente,



donde para cada valor predicho y de acuerdo a la evidencia será la fórmula a utilizar para b y

las precisiones de los valores estimados.

Las predicciones genéticas para un animal individual se acompañan frecuentemente de un

valor de precisión, una correlación entre los valores reales y sus predicciones, mide la fortaleza

de la relación entre valores reales y predicciones.

A continuación un ejemplo de predicción de un valor de HPMP para rendimiento lechero de

una vaca. La fuente de información o evidencia en este caso son el promedio de cinco registros

de lactación de 1072 kg por sobre la media de su GC. La fórmula para el coeficiente de

regresión apropiado, según la tabla, donde r es la repetibilidad del carácter y n el número de

observaciones:

nr

1 + (n − 1)r

La r del rendimiento lechero es de alrededor de 0,5 y el n es 5. Entonces



b = nr

1 + (n − 1)r

=5(0,5)

1 + (5 − 1)(0,5)

= 0,833

Por cada kg de aumento en la media de los 5 registros de la vaca, aumenta su expectativa

de su verdadera habilidad productiva en 0,833 kg.

Para calcular la HPMP se sustituye este coeficiente de regresión por el índice de selección:

I = bx

= 0,883 (+1072)

= +893 kg

La HPMP es + 893 kg. En otras palabras esperamos que produzca 893 kg más de leche que

la media de sus contemporáneas. Si los rendimientos promedio de lactación en este rodeo

fueran 14000 kg, la predicción del próximo registro de la vaca es de 14893 kg de leche.

Se puede calcular la precisión de esta predicción usando la fórmula de la última columna de

la tabla. Así:

rPA,PA = √nr

1 + (n − 1)r

= √5(0,5)

1 + (5 − 1)(0,5)

= √0,833

= 0,91

En algunos casos como el visto, el grado de ajuste de la predicción es el número de registros

y la repetibilidad de carácter. En otros casos, como aquellos que involucran EBVs o DEPs es una

función del número de registros, de la h2, de la r y de las relaciones de parentesco entre los

animales que están siendo medidos y el animal cuya predicción está siendo calculada.

El coeficiente de regresión utilizando mucha cantidad de información resulta en

predicciones insesgadas, esto significa que a mayor cantidad de información utilizada en las

predicciones futuras para el mismo animal estas pueden cambiar en una dirección positiva o

negativa. Debido a que son ajustadas de acuerdo a la cantidad de información, ellas son en

esencia ajustadas por la precisión.

Predicción usando múltiples fuentes de información

Podemos estar interesados en predecir un valor para un individuo basado en más de una

sola fuente de información o evidencia. Por ejemplo, podríamos querer predecir el BV de un

animal basado en su propio P, el 𝑃 de sus medios hermanos paternos y el 𝑃 de su progenie. El

índice de selección en este caso aparecería como:



I= b1x1 + b2x2 + … + bnxn

ó

EBV= b1P ind+ b2 𝑃 mh + b3𝑃 prog

P ind: valor fenotípico del individuo

𝑃 mh: valor fenotípico medio de medios hermanos

𝑃 prog: valor fenotípico medio de la progenie

Para calcular este EBV necesitamos valores para los tres factores de ponderación b1, b2 y b3,

eso requiere de la construcción y solución simultánea de tres ecuaciones, por lo cual los

cálculos para índices de selección que involucran más de dos fuentes de información se

realizan en computadora.

Los valores de bs, es decir los factores de ponderación necesarios para los índices de

selección que involucran fuentes de información múltiples, varían dependiendo de la cantidad

y relevancia de los datos de cada fuente.

Por ejemplo, si un animal tiene muchos datos de genealogía y registros de P propios, pero

pocos datos de progenie, esperamos que en el cálculo del EBV de ese animal el mayor énfasis

sea colocado en los datos de progenie y su propia información.

Por otra parte, si el mismo animal adquiere una gran cantidad de datos de progenie,

esperamos que el énfasis cambie a esa fuente de información. Los datos de la progenie,

después de todo, proveen la última prueba del BV de un individuo.

Cuando se usan ecuaciones simultáneas para resolver la ponderación en los índices de

selección, cada factor de ponderación automáticamente refleja la cantidad apropiada de

énfasis que se debería colocar en su correspondiente fuente de información.

El peso dado a cada fuente de información es proporcional al grado de parentesco con el

individuo cuyo BV queremos estimar.

Mejor predicción lineal insesgada (BLUP)

El índice de selección es un poderoso método para la predicción genética, cuando la

información del P utilizada proviene de GC genéticamente similares, en la práctica, animales

de un establecimiento o productor.

Una extensión de la metodología de los índices de selección conocida como mejor

predicción linear insesgada o BLUP por su sigla en inglés (Best Linear Unbiased Prediction) está

diseñada para evaluaciones genéticas de animales genéticamente diferentes, de distintos

productores, distintas épocas, etc.

La distinción entre índice de selección y BLUP refleja las diferencias históricas en la

aplicación de las dos tecnologías, ya que es posible construir índices de selección que podrían

tomar en cuenta las diferencias genéticas entre GC y que podrían ser para propósitos prácticos

tan buenos como la más sofisticada tecnología BLUP. Sin embargo, estos índices de selección

no han sido utilizados debido a que no tienen ventajas particulares sobre procedimientos BLUP

análogos.

BLUP es un método de predicción genética que es particularmente apropiado cuando los

datos del P provienen de GC genéticamente diversos.

La teoría estadística de este método es casi tan antigua como la del índice de selección, sin

embargo no fue hasta principios de 1980 que las computadoras y los algoritmos matemáticos



han avanzado hasta el punto de que la difusión de la aplicación del BLUP para las evaluaciones

genéticas fue factible, ya que requiere del uso intensivo de computadoras.

BLUP involucra la solución simultánea de un gran número de ecuaciones. Incorpora muchas

veces el número de ecuaciones que serían utilizadas por el correspondiente índice de

selección, en parte porque un análisis de este tipo provee predicciones para una población

entera de animales y no solo para un animal a la vez, que es el caso de la mayoría de las

aplicaciones del índice de selección. Considera la información disponible en todos los parientes

utilizando en la ponderación la matriz de parentesco.

Debido a su habilidad para tomar en cuenta las diferencias entre GC y debido a que provee

predicciones genéticas para muchos animales a la vez, BLUP es el método preferido para las

evaluaciones genéticas a gran escala es decir la evaluación genética de poblaciones grandes

como razas enteras. Los registros del P utilizados en dichas evaluaciones usualmente

provienen de datos de campo, datos que regularmente son reportados por productores

individuales a las asociaciones de cría de las razas o a otras instituciones como ser agencias

gubernamentales.

Tipos de modelos de BLUP

BLUP es una técnica que puede ser concebida como una familia de modelos estadísticos, es

decir, representaciones matemáticas del P animal que incluye varios efectos ambientales y

genéticos y que son usados para las predicciones genéticas.

Se trabaja con modelos lineales lo que supone expresar un dato como función lineal de los

efectos, es decir, simplemente sumar los valores de los efectos ocasionalmente multiplicados

por algún factor.

Existen distintos modelos de acuerdo a qué animales recibirán las predicciones genéticas

(solamente los padres, todos los progenitores, o todos los animales), el número y clase de

predicciones generadas y la dificultad computacional. En general cuanto más sofisticado el

modelo, involucra más ecuaciones y más cantidad de recursos informáticos requiere.

Hay modelos padre, modelos padre-abuelo materno, modelo animal, modelo de medidas

repetidas, modelos materno-directo, modelos multicarácter, etc.

Cada uno difiere del otro de una forma u otra, y dos de ellos no tienen exactamente las

mismas capacidades. El modelo particular al que se hará referencia en adelante es el más

básico, aunque el más avanzado y actualmente el tipo más popular de modelo BLUP, el

modelo animal, siendo este un modelo estadístico avanzado para la predicción genética que

es utilizado para evaluar todos los animales (y no solo a los machos) en una población.

Tiene una cantidad de cualidades deseables de las cuales la más obvia es su habilidad para

evaluar “todos los animales” (en contraposición a solo los machos) en una población.

El modelo animal es un modelo lineal mixto ya que incluye efectos fijos y efectos

aleatorios.

Un efecto es una causa de variabilidad que ha sido identificada y que será incluida en el

modelo como parte de la explicación de la variabilidad de un carácter. Por ejemplo, el sexo del

individuo, el ser macho o hembra, implica variabilidad en el peso adulto dado que

normalmente los machos pesan más que las hembras. Por ejemplo, si se desea conocer el BV

de los individuos para su peso adulto, ajustaremos el efecto genético en el modelo para hacer

inferencias sobre el mismo, pero también incluiremos el efecto sexo. Obsérvese que si no se

incluyese este efecto los machos aparecerían sistemáticamente mejor valorados que las



hembras al confundirse este efecto con el genético. En general, los efectos de los que depende

la variable de trabajo pertenecerán siempre a una de estas dos categorías, efectos fijos y

efectos aleatorios.

Efectos fijos: presentan pocos niveles (clases o categorías) en la población y todos aparecen

en nuestros datos. Un ejemplo de efecto fijo es el sexo de los animales en la variable peso al

nacimiento. Conceptualmente se asume que el pertenecer a una de las categorías del efecto

representa una diferencia fija con respecto a los otros niveles del efecto, aunque esta

diferencia es desconocida. Por ejemplo, se asume que las hembras pesarán sistemáticamente

k kilogramos menos que los machos. Por esta razón se suelen llamar también efectos

sistemáticos. Se dice que se va a estimar efectos fijos cuando se pretende obtener valores

aproximados de los efectos fijos. Los cuales pueden ser a su vez continuos o discontinuos:

1. Continuos: el efecto es una variable y por tanto puede tomar cualquier valor dentro de

su rango. Un ejemplo sería la edad en meses en relación al peso al destete. La relación

entre la variable de trabajo o variable dependiente y el efecto fijo continuo o variable

independiente es fácil de explicar, dado que es de esperar que los individuos de más edad

presenten mayores pesos al destete. La relación entre ambos es proporcional y suele

emplearse el coeficiente de regresión entre ambos.

2. Discontinuos: el efecto fijo agrupa las observaciones en clases de manera que una

observación puede pertenecer a una clase o a otra. El sexo es un ejemplo claro al poder

pertenecer el dato a un macho o a una hembra, sin que exista una relación de

proporcionalidad entre ambas. Un efecto fijo discontinuo presente en todos los modelos

lineales es la media general (μ) que agrupa a todas las observaciones dentro de su único

nivel o categoría.

Efectos aleatorios: presentan muchos niveles, hasta el punto de asumir conceptualmente

que hay infinitos en la población. El ejemplo más importante en nuestro contexto es el efecto

genético aditivo identificado por el individuo. En la muestra no están representados los

infinitos animales posibles sino que se escogen sólo unos cuantos. A diferencia de los efectos

fijos, los aleatorios no presentan valor constante único desconocido sino que son en sí mismos

una distribución estadística. Conceptualmente se asume que todos los niveles pertenecen a

una distribución, generalmente normal, con media y varianza, pero el valor esperado de cada

uno de los niveles no es un valor sistemático diferente de los otros niveles, sino que el valor

esperado de todos ellos es el mismo, el de la media de su distribución.

El modelo animal se expresa en notación matricial y puede ser representado de la siguiente

forma:

Y= Xb + Za +e

Y: es el vector de los datos o indicios de producción

b: es el vector de los efectos fijos (sexo, establecimiento, grupo contemporáneo, mes o

estación de parto, edad de la vaca, número de lactancia, número de ordeñe diario, tipo de

nacimiento, edad al destete, etc.)

X: es la matriz de incidencia de los efectos fijos

a: es el vector de los factores aleatorios (valor aditivo de los animales)

e: es el desvío aleatorio residual.



Ventajas del modelo animal

El modelo animal presenta innumerables ventajas en términos de evaluación genética,

siendo una de las principales que a través de la inclusión de la matriz de parentesco, el registro

de cada individuo contribuye para cada evaluación de todos sus parientes (con el peso

adecuado dado por la matriz de parentesco).

Podemos de esta forma obtener estimaciones de los BV de todos los individuos, también de

aquellos que no poseen registros.

En términos generales, se puede decir que el Modelo Animal es bastante flexible, porque

permite:

1. Utilización de información de todos los parientes.

2. Soluciones obtenidas en simultáneo para efectos fijos y aleatorios.

3. Inclusión de toda la información (efectos fijos, marcadores genéticos, grupos

genéticos, caracteres correlacionados, etc.) en un mismo modelo.

4. Fácil extensión a modelos más complejos (registros repetidos, caracteres con efectos

maternos, análisis multivariado, inclusión de efectos no-aditivos, etc.)

Por otro lado, el BLUP es bastante sensible al modelo utilizado, conexiones genéticas entre

efectos fijos, parámetros considerados, censura de los datos, etc. Y tiene el potencial

inconveniente de que la consanguinidad generada cuando se utiliza el BLUP puede ser

substancialmente superior a la obtenida en otros esquemas de selección.

UNIDAD TEMÁTICA 2: MEJORAMIENTO GENÉTICO ANIMAL … · El coeficiente de regresión (b) en la...

Documents

Transcript of UNIDAD TEMÁTICA 2: MEJORAMIENTO GENÉTICO ANIMAL … · El coeficiente de regresión (b) en la...