UNIDAD TEMÁTICA 2: MEJORAMIENTO GENÉTICO ANIMAL … · El coeficiente de regresión (b) en la...
Transcript of UNIDAD TEMÁTICA 2: MEJORAMIENTO GENÉTICO ANIMAL … · El coeficiente de regresión (b) en la...
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 1
UNIDAD TEMÁTICA 2: MEJORAMIENTO GENÉTICO ANIMAL
Capítulo II: Selección
Tema 4: Predicciones genéticas. Metodología general. Fuentes de información. Fenotipo del
individuo, genealogía, progenie. Tecnología de predicción genética: índice de selección y
mejor predicción lineal insesgada. Conceptos generales y usos.
Predicciones genéticas. Metodología general. Fuentes de información. Fenotipo del
individuo, genealogía, progenie.
Cuando se lleva a cabo la selección para cualquier carácter tratamos de elegir como
progenitores aquellos animales que presentan los mejores BV para ese carácter, de entre
todos aquellos candidatos disponibles a la selección, de modo de poder conseguir el �� más
alto para ese carácter en la descendencia de los individuos seleccionados. Si se conociera el BV
real de cada candidato se podría conseguir este objetivo con la máxima eficiencia simplemente
ordenando los candidatos de acuerdo a su BV real y luego seleccionar los que están en los
primeros lugares.
En la práctica, no es posible conocer el BV real para ningún carácter, en lugar de eso lo que
se puede hacer es estimar el BV a través de ciertos indicios o evidencias que reciben el nombre
de criterios de selección y que consisten en una o más medidas de los P tomados del animal
y/o de sus parientes.
Cuando se ordenan los animales de acuerdo el EBV para un determinado carácter se trata
de hacerlo de acuerdo a su BV real, por lo tanto, cuanto más precisa sea esa estimación más
precisa será la clasificación de los candidatos a la selección. La precisión en las estimaciones
puede ir de 0% donde los indicios no nos proporcionan información sobre el BV, al 100% que
sería el BV real; si la precisión es 0% los animales estarán en realidad ordenados al azar con lo
cual seleccionar aquellos que están en el principio de la lista no produce respuesta a la
selección. En el otro extremo, si la precisión fuera del 100% la respuesta a la selección será
máxima.
Existen muchos indicios o evidencias potenciales del BV real de un candidato, el más simple
y más comúnmente disponible es un único registro de su propio P para el carácter. Las
medidas de los P de los candidatos reciben el nombre de pruebas de rendimiento y la selección
en base a los resultados de estas recibe el nombre de selección individual, masal o fenotípica.
Otros indicios o evidencias potenciales del BV real de un candidato incluyen una medida del
carácter en un pariente del candidato, por ejemplo: un padre, un hermano o un hijo, o en un
grupo de parientes tales como hermanos completos (familia materna) o medios hermanos
(familia paterna). La selección basada en el rendimiento (P) de un antepasado recibe el
nombre de selección por pedigrí, y la basada en el rendimiento de hermanos se denomina
selección fraternal o por parientes colaterales. Al evaluar los candidatos en base al rendimiento
(P) de su descendencia se denomina prueba de descendencia o de progenie. En síntesis, la
información utilizada en el cálculo de las predicciones genéticas para un individuo proviene de
tres clases de fuentes:
1. Registros del P del propio individuo
2. Registros del P de antecesores y/o parientes colaterales de los individuos (datos de
pedigrí o genealógicos)
3. Los registros del P de los descendientes del individuo (datos de la progenie).
La precisión de la selección aumenta cuantos más indicios o evidencias se utilicen.
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 2
Selección fenotípica
Por ejemplo, si se estuviera realizando esta selección para peso corporal y se quisiera
determinar si una borrega en particular debe ser elegida para vientre, podría basarse
solamente en su propio peso corporal. En cada generación las borregas más pesadas son
elegidas para convertirse en madres, y el resultado a lo largo del tiempo es un incremento
general en el peso corporal. Las borregas de reemplazo son seleccionadas en base de su P para
el peso corporal con la expectativa de que este, es un indicador razonable de los genes que lo
afectan. En otras palabras, el P para el peso corporal en ovinos está relacionado con el BV para
ese carácter. Si no fuera así, la selección fenotípica para éste no daría resultados.
Como vimos esta relación entre P y BV es la heredabilidad. Cuando ésta es alta los fenotipos
son generalmente buenos indicadores de los BV subyacentes, y la selección fenotípica será
efectiva; cuando es baja, los P revelan poco acerca de los BV y la selección fenotípica no será
efectiva.
Selección basada en la información del pedigrí
En este tipo de selección se tiene en cuenta el rendimiento (P) para un determinado
carácter de los antepasados para calcular la probable capacidad que tendrá la descendencia,
basados en el conocimiento de que los individuos emparentados comparten genes en diversas
proporciones como se puede ver en la siguiente figura:
Como se vio en la Unidad 1, un árbol genealógico o pedigrí es un registro de los
antepasados de un individuo que están relacionados con él a través de sus progenitores. Este
tipo de selección adquiere importancia, cuando no se dispone de datos de producción o
cuando los animales son tan jóvenes que no se conocen sus BV individuales.
Al recurrir a este tipo de selección se debe tener en cuenta que los ascendientes más
próximos en el pedigrí son los importantes y no los que están separados por varias
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 3
generaciones. Por ejemplo, un antepasado sobresaliente a 3 ó 4 generaciones de distancia sólo
contribuye con un muy pequeño porcentaje de sus genes en ese descendiente, por lo tanto
tiene poca influencia sobre su tipo y producción.
Un ejemplo de esto es la selección de vaquillonas de reposición en los tambos, evaluando la
producción de leche de la “línea baja” (hembras), hasta la cuarta generación en los pedigríes.
Selección basada en información de parientes colaterales
Los parientes “colaterales” son todos los que no son “directos”, o sea antepasados o
descendientes, por ejemplo, hermanos, hermanas, medios hermanos, tíos, tías, etc.
Se evalúa el P de los parientes más cercanos, ya que es muy probable que tengan las
mismas combinaciones de genes que el individuo y que este los transmitirá a su descendencia.
Si la información sobre los parientes colaterales es completa nos da una idea de los genes y sus
combinaciones que el individuo en cuestión probablemente posea.
En los programas de certificación de cerdos para carne, esto puede ser utilizado ya que de
una camada entera pueden ser sacrificados algunos para evaluar la calidad de la canal. Lo
mismo sucede en la selección de toros lecheros, evaluando la producción de leche de sus
hermanas, que posiblemente se transmitirá por él a su descendencia.
Selección basada en información de la progenie
Consiste en seleccionar los animales sobre la base de los P de su progenie, por ejemplo, el
peso de sus hijos al nacer, el peso al destete, las ganancias diarias de peso, la eficiencia de
conversión alimenticia, su tipo corporal, la evaluación de sus reses, etc.
PREDICCION
Valores reales y predichos
Recordemos el modelo para caracteres cuantitativos y sus componentes denominados
valores:
P = µ + BV + GCV + E
Los componentes del modelo son llamados valores reales o verdaderos, atributos que
afectan el P de un animal para un carácter, otros valores verdaderos serían las diferencias de
progenie (DP), habilidad de producción (HP) y efectos permanentes (Ep) y temporarios (Et) del
ambiente.
Los valores reales, con la excepción de los P no son medibles directamente, con lo cual
debemos trabajar con las predicciones de dichos valores. Los valores predichos son calculados
a partir de los datos de P usando técnicas estadísticas. Los más comunes son el valor estimado
de cría (EBV), la diferencia esperada en la progenie (DEP) y la habilidad de producción más
probable (HPMP), como se vio anteriormente.
Es importante distinguir valor real y predicho, ya que las diferencias entre ambos pueden
ser bastante grandes, dependiendo de la cantidad y calidad de información utilizada para
calcular los valores predichos.
Ecuaciones de predicción
Los valores predichos se calculan mediante una simple ecuación o un conjunto de
ecuaciones de predicción. En su forma más simple una ecuación de predicción sería la
siguiente:
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 4
Valor predicho (I) = coeficiente de regresión (b) * “evidencia” (x)
I = b x
1. El valor predicho (I) puede ser una predicción de cualquier valor real de interés.
Típicamente predecimos BV, DP y HP, pero otros valores – por ejemplo, un P no medido
todavía – puede ser predicho también.
2. El coeficiente de regresión (b) en la ecuación, es la regresión del valor real sobre la
evidencia. En otras palabras, mide el cambio esperado en los valores reales por unidad de
cambio en la evidencia.
3. La evidencia (x) en este contexto usualmente se refiere a una medida de P de algún tipo.
Podría ser un simple registro de P para un individuo para quien estamos tratando de predecir
su BV, o podrían ser los registros de los promedios de los P de su progenie, medios hermanos,
etc.
La ecuación de predicción en su forma matemática
Matemáticamente, una ecuación de predicción sencilla aparece como:
Y i = 𝝁𝒀 + 𝒃𝒀 . 𝑿 (Xi - 𝝁𝑿)
Donde,
Yi = un valor predicho para un animal
𝜇𝑌 = la media esperada de las predicciones para los animales en la población
𝑏𝑌 . 𝑋 = la regresión de los valores que son predichos (Y) en la evidencia (X)
Xi - 𝜇𝑋 = la evidencia de animales i, expresado como una desviación de la media poblacional
Ejemplo:
Vamos a predecir el peso al destete de un ternero basado en su peso al nacimiento.
Necesitamos la regresión fenotípica para peso al destete sobre el peso al nacimiento porque
estamos prediciendo un valor fenotípico – peso al destete – usando evidencia fenotípica, el
peso al nacimiento del ternero. Asuma lo siguiente:
µ𝑃𝑃𝐷 , nuestra mejor estimación de lo que será el peso al destete promedio en la población, =
200 kg
𝐵𝑃𝑃𝐷.𝑃𝑃𝑁, la regresión fenotípica del peso al destete sobre el peso al nacimiento (calculado
anteriormente) = 1,15 kg por kg
𝑃𝑃𝑁, el peso al nacimiento del ternero, = 40 kg
µ𝑃𝑃𝑁= el peso al nacimiento en la población, = 37 kg
Entonces,
𝑃𝑃𝐷 = 𝜇𝑃𝑃𝐷 + 𝐵𝑃𝑃𝐷.𝑃𝑃𝑁
+ ( 𝑃𝑃𝑁𝑖 - 𝜇𝑃𝑃𝑁
)
= 200+ 1,15 (40-37)
= 203,45 kg
Predecimos un peso al destete de 203,45 kg para este ternero.
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 5
Tecnología de predicción genética: índice de selección y mejor predicción lineal insesgada.
Conceptos generales y usos.
El MGA para determinados caracteres en una población depende en gran medida de la
precisión de los BV estimados.
Revisión
A los efectos de comprender coeficiente de regresión a continuación se hará una
revisión (ampliar en bioestadística).
Como se vio en “Parámetros poblacionales” existen básicamente tres medidas de
covariación, la covarianza y correlación (descriptas en dicho punto) y la regresión.
La regresión o coeficiente de regresión (by.x) es la cantidad de cambio en una variable
que puede ser esperada para un cambio dado en otra variable. Al igual que las covarianzas
y correlaciones, son medidas poblacionales – no valores individuales – y pueden
involucrar toda clase de valores en una población.
Se utiliza la regresión del BV para un carácter sobre el P del mismo para ayudar a
predecir el BV de un animal basado en su propio P.
Las regresiones pueden ser
1. Positivas: indican un aumento en una variable cuando la otra variable se incrementa.
2. Negativas: indican que una variable decrece cuando la otra aumenta.
Por ejemplo, si se quiere predecir el peso de vellón sucio de un cordero basado en su
peso al destete. El valor a predecir es el P para peso de vellón, la evidencia es el P del
cordero para peso al destete y la regresión es del P para el peso de vellón sobre el P para
peso al destete (estimado en 80 gramos por kg). Si un cordero al destete pesa 5 kg más
que la media, entonces se esperaría que su peso de vellón sucio sea 80 gramos más
pesado por cada kg de ventaja en el peso al destete o 80 * 5, esto es igual a 400 gramos
más pesado que la media. Si el cordero pesa 2,5 kg menos que el promedio al destete se
esperaría que el peso de su vellón fuera 80*(-2,5) = -200 gramos sobre la media o 200
gramos más liviano que la media.
Un ejemplo en porcinos, si un reproductor cuya área de ojo de bife (medida del
rendimiento de carne magra) medido por ultrasonido fue de 0,6 cm2 por debajo de la
media y se quiere predecir su BV para área de ojo de bife (AOB). En este caso el valor real
a ser predicho es el BV para AOB, la evidencia es el P para este carácter que presentó el
reproductor, la regresión y el coeficiente de regresión es el BV para AOB sobre el P para el
carácter. Estimaciones publicadas de ésta regresión promedio es de 0,5 cm2 x cm2. El EBV
del cerdo para el AOB sería entonces 0,5 * 0,6 = 0,3 cm2 por arriba de la media o como el
BV medio es definido como 0, simplemente + 0,3 cm2.
Algunas predicciones son muy precisas y otras no, en los ejemplos anteriores es muy
probable que sean imprecisas, debido a que la “evidencia” en ambos casos es demasiado
escasa. Un simple registro de P para peso al destete o área de ojo de bife no es mucha
información. Las predicciones precisas provienen de un gran número de datos de alta
calidad y por esta razón la recolección de datos y las técnicas estadísticas usadas para
hacer las predicciones genéticas a partir de esos datos son una parte importante en MGA.
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 6
Como se dijo, la precisión de la selección aumenta cuantos más indicios o evidencias se
utilicen. Para aumentar la precisión se requiere el uso de tanta información como sea posible y
ponderar cada una apropiadamente. Esto requiere el uso de la tecnología de predicción
genética.
Dos metodologías estrechamente relacionadas que se utilizan comúnmente para la
predicción genética son: el índice de selección y la mejor predicción linear insesgada. En este
apunte se pondrá énfasis en cuándo deberían ser usadas, cuáles son sus características
especiales y la presentación e interpretación de las predicciones genéticas producidas con
estas tecnologías.
El índice de selección
En los programas de selección reales se dispone a menudo de evidencias o indicios sobre el
BV de un candidato para un determinado carácter que proceden de más de una fuente, por
ejemplo al seleccionar gallinas para la producción de huevos normalmente se dispone de datos
sobre el P de las hembras, sobre el 𝑃 de la familia materna (hermanos enteros) y sobre el 𝑃 de
la familia paterna (medios hermanos). Los machos candidatos pueden ser clasificados de
acuerdo con los promedios de la familia paterna y materna pero evidentemente sin ningún P
propio.
En el cerdo con frecuencia se pueden clasificar según su propio P y el de sus hermanos, al
utilizar todas estas evidencias la precisión aumentará. Podemos tener x evidencias distintas:
x1 registro único del P del propio individuo o el promedio de medidas repetidas de un
candidato
x2 registro del P de antecesores y/o parientes colaterales del individuo
x3 registros de producción o P de los descendientes del individuo
En todos los casos puede ser una única medida o bien un promedio de medidas repetidas.
La estimación global del BV de un candidato para un determinado carácter que se obtiene
generalmente a partir de las distintas evidencias se denomina índice de selección. Esta es la
suma ponderada de las evidencias asignando a cada una un peso o ponderación que maximice
la precisión del índice como una estimación del BV del candidato.
Un índice de selección es esencialmente una combinación lineal de varios tipos de
información fenotípica y factores de ponderación apropiados.
Toma la siguiente forma:
I= b1x1 + b2x2 + … + bnxn
Dónde
I = un valor índice o predicción genética
b1= un factor de ponderación
X1= un simple ítem de información fenotípica – un registro de producción o el promedio de los
registros de producción de un grupo.
n= número total de ítems de información fenotípica.
I: valor de cría estimado para individuos procedentes de un grupo contemporáneo
genéticamente similar.
Una característica importante del índice de selección es que cada P (x1, x2, x3, etc.) es
normalmente expresado como el desvío de la media de un grupo contemporáneo (GC).
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 7
Un GC es un grupo de animales que han experimentado un ambiente similar para la
expresión de uno o varios caracteres. Un ambiente similar en este contexto significa que los
animales del grupo se desempeñan en el mismo lugar físico, son del mismo sexo, de edad
similar y han tenido un mismo manejo.
La ventaja de seleccionar en base a las desviaciones de la media de un GC cuando los
grupos de animales experimentan diferentes ambientes, es que se tienen en cuenta las
diferencias ambientales entre GC.
Otra característica importante para confeccionar un índice de selección es que todos los GC
deben ser genéticamente similares. Por ejemplo, un desvío de +10 unidades de peso en un GC
se asume como el equivalente genético de una desviación de +10 unidades en cualquier otro
GC. Si el 𝐵𝑉 en cada grupo es el mismo, (es decir si los GC son realmente genéticamente
similares) esta asunción es correcta. Sin embargo, si el 𝐵𝑉 de los GC difiere, el uso de las
desviaciones de las 𝐺𝐶 crea sesgos en los datos. Un sesgo es cualquier factor que causa la
distorsión de las predicciones genéticas. Los registros provenientes de los GC genéticamente
más pobres parecen mejores de lo que deberían, y viceversa.
Por esta razón, los índices de selección solo deberían ser usados para las predicciones
genéticas cuando los datos del P provienen de un GC que se piensa son genéticamente
similares. En la práctica, esto significa que probablemente deberían ser utilizados dentro de un
rodeo o majada de un mismo productor y no en toda una población (raza). Y si un determinado
rebaño ha experimentado cambios genéticos significativos en el tiempo, los datos
provenientes de los GC más antiguos – grupos con BV más “antiguos” y por lo tanto diferentes
– deberían ser excluidos del índice.
Registros de información fenotípica (x)
Las cantidades relativas de datos de las tres fuentes (propio P, del pedigrí, y los datos de
progenie) pueden variar. Animales no nacidos o muy jóvenes tienen solamente datos de
pedigrí aunque a medida que crecen irán adquiriendo datos propios y si son seleccionados
para convertirse en padres, ellos generarán datos de progenie.
Cualquiera de los tres tipos de registros se puede tomar de cualquier carácter para el cual
se calcularán las predicciones, también pueden ser datos de otros caracteres genéticamente
correlacionados. Por ejemplo, las predicciones para la susceptibilidad genética hacia la distocia
(dificultad al parto) pueden ser determinadas por la medida directa como grados de distocia,
por el peso al nacimiento (un carácter genéticamente correlacionado), o por ambos.
Como se vio más arriba, los datos utilizados en el índice de selección (x1) provienen de
muchas fuentes dentro de las categorías: del propio P, del pedigrí, y los datos de progenie. Por
ejemplo, x1 podría ser un registro de P individual propio para un carácter, x2 podría ser el
promedio de P de medios hermanos paternos del individuo para el mismo carácter, x3 podría
ser el promedio del P de la progenie del individuo, y x4, x5 y x6 podrían representar el P del
individuo, medio hermano, y progenie respectivamente para un carácter correlacionado. En
todos los casos cada x es un número correspondiente a un valor fenotípico.
Coeficiente de regresión (b)
Para ser utilizado en un índice se calculan sus valores numéricos por fórmulas bastantes
complicadas.
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 8
Con todos estos detalles, una definición más apropiada de índice de selección sería: es una
combinación lineal de información fenotípica y factores de ponderación que es usada para la
predicción genética cuando los datos del P provienen de GC genéticamente similares.
Predicción utilizando una sola fuente de información
Los índices de selección más simples son aquellos que involucran una sola fuente de
información x. Son de la siguiente forma:
I = b x
Como se llega de la ecuación de predicción vista más arriba al índice de selección con una sola
fuente. La ecuación simple de predicción se expresa como:
��𝑖 = ��𝑌 + 𝑏𝑌.𝑋 (𝑋𝑖 − ��𝑋)
Donde,
��𝑖 = un valor de predicción para el animal i
��𝑌 = la media de las medias esperadas para los animales de la población
𝑏𝑌.𝑋 = la regresión de los valores que se estan estimando sobre la evidencia
𝑋𝑖 − ��𝑋 = la evidencia del animal i, expresada como la desviación de la media poblacional
En el índice de selección más simple utilizando solo una fuente de evidencia, el valor predicho
es el valor índice, o
��𝑖 = 𝐼
Valor de cría, diferencia de progenie, etc., promedian cero en la población, asimismo sus
predicciones, entonces
��𝑌 = 0
El coeficiente de regresión es
𝑏𝑌.𝑋 = b
La evidencia en un índice de selección se expresa como desviación de la media de un grupo
contemporáneo, entonces
(𝑋𝑖 − ��𝑋) = x
Poniendo todo junto,
𝐼 = 0 + 𝑏𝑥
𝐼 = 𝑏𝑥
Los índices de selección utilizando una sola fuente de información son fáciles de calcular
porque se necesita solo una ecuación para resolver el coeficiente de regresión b. Algunas
fórmulas para b utilizadas en algunos índices de este tipo, se pueden ver en la tabla siguiente,
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 9
donde para cada valor predicho y de acuerdo a la evidencia será la fórmula a utilizar para b y
las precisiones de los valores estimados.
Las predicciones genéticas para un animal individual se acompañan frecuentemente de un
valor de precisión, una correlación entre los valores reales y sus predicciones, mide la fortaleza
de la relación entre valores reales y predicciones.
A continuación un ejemplo de predicción de un valor de HPMP para rendimiento lechero de
una vaca. La fuente de información o evidencia en este caso son el promedio de cinco registros
de lactación de 1072 kg por sobre la media de su GC. La fórmula para el coeficiente de
regresión apropiado, según la tabla, donde r es la repetibilidad del carácter y n el número de
observaciones:
nr
1 + (n − 1)r
La r del rendimiento lechero es de alrededor de 0,5 y el n es 5. Entonces
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 10
b = nr
1 + (n − 1)r
=5(0,5)
1 + (5 − 1)(0,5)
= 0,833
Por cada kg de aumento en la media de los 5 registros de la vaca, aumenta su expectativa
de su verdadera habilidad productiva en 0,833 kg.
Para calcular la HPMP se sustituye este coeficiente de regresión por el índice de selección:
I = bx
= 0,883 (+1072)
= +893 kg
La HPMP es + 893 kg. En otras palabras esperamos que produzca 893 kg más de leche que
la media de sus contemporáneas. Si los rendimientos promedio de lactación en este rodeo
fueran 14000 kg, la predicción del próximo registro de la vaca es de 14893 kg de leche.
Se puede calcular la precisión de esta predicción usando la fórmula de la última columna de
la tabla. Así:
rPA,PA = √nr
1 + (n − 1)r
= √5(0,5)
1 + (5 − 1)(0,5)
= √0,833
= 0,91
En algunos casos como el visto, el grado de ajuste de la predicción es el número de registros
y la repetibilidad de carácter. En otros casos, como aquellos que involucran EBVs o DEPs es una
función del número de registros, de la h2, de la r y de las relaciones de parentesco entre los
animales que están siendo medidos y el animal cuya predicción está siendo calculada.
El coeficiente de regresión utilizando mucha cantidad de información resulta en
predicciones insesgadas, esto significa que a mayor cantidad de información utilizada en las
predicciones futuras para el mismo animal estas pueden cambiar en una dirección positiva o
negativa. Debido a que son ajustadas de acuerdo a la cantidad de información, ellas son en
esencia ajustadas por la precisión.
Predicción usando múltiples fuentes de información
Podemos estar interesados en predecir un valor para un individuo basado en más de una
sola fuente de información o evidencia. Por ejemplo, podríamos querer predecir el BV de un
animal basado en su propio P, el 𝑃 de sus medios hermanos paternos y el 𝑃 de su progenie. El
índice de selección en este caso aparecería como:
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 11
I= b1x1 + b2x2 + … + bnxn
ó
EBV= b1P ind+ b2 𝑃 mh + b3𝑃 prog
P ind: valor fenotípico del individuo
𝑃 mh: valor fenotípico medio de medios hermanos
𝑃 prog: valor fenotípico medio de la progenie
Para calcular este EBV necesitamos valores para los tres factores de ponderación b1, b2 y b3,
eso requiere de la construcción y solución simultánea de tres ecuaciones, por lo cual los
cálculos para índices de selección que involucran más de dos fuentes de información se
realizan en computadora.
Los valores de bs, es decir los factores de ponderación necesarios para los índices de
selección que involucran fuentes de información múltiples, varían dependiendo de la cantidad
y relevancia de los datos de cada fuente.
Por ejemplo, si un animal tiene muchos datos de genealogía y registros de P propios, pero
pocos datos de progenie, esperamos que en el cálculo del EBV de ese animal el mayor énfasis
sea colocado en los datos de progenie y su propia información.
Por otra parte, si el mismo animal adquiere una gran cantidad de datos de progenie,
esperamos que el énfasis cambie a esa fuente de información. Los datos de la progenie,
después de todo, proveen la última prueba del BV de un individuo.
Cuando se usan ecuaciones simultáneas para resolver la ponderación en los índices de
selección, cada factor de ponderación automáticamente refleja la cantidad apropiada de
énfasis que se debería colocar en su correspondiente fuente de información.
El peso dado a cada fuente de información es proporcional al grado de parentesco con el
individuo cuyo BV queremos estimar.
Mejor predicción lineal insesgada (BLUP)
El índice de selección es un poderoso método para la predicción genética, cuando la
información del P utilizada proviene de GC genéticamente similares, en la práctica, animales
de un establecimiento o productor.
Una extensión de la metodología de los índices de selección conocida como mejor
predicción linear insesgada o BLUP por su sigla en inglés (Best Linear Unbiased Prediction) está
diseñada para evaluaciones genéticas de animales genéticamente diferentes, de distintos
productores, distintas épocas, etc.
La distinción entre índice de selección y BLUP refleja las diferencias históricas en la
aplicación de las dos tecnologías, ya que es posible construir índices de selección que podrían
tomar en cuenta las diferencias genéticas entre GC y que podrían ser para propósitos prácticos
tan buenos como la más sofisticada tecnología BLUP. Sin embargo, estos índices de selección
no han sido utilizados debido a que no tienen ventajas particulares sobre procedimientos BLUP
análogos.
BLUP es un método de predicción genética que es particularmente apropiado cuando los
datos del P provienen de GC genéticamente diversos.
La teoría estadística de este método es casi tan antigua como la del índice de selección, sin
embargo no fue hasta principios de 1980 que las computadoras y los algoritmos matemáticos
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 12
han avanzado hasta el punto de que la difusión de la aplicación del BLUP para las evaluaciones
genéticas fue factible, ya que requiere del uso intensivo de computadoras.
BLUP involucra la solución simultánea de un gran número de ecuaciones. Incorpora muchas
veces el número de ecuaciones que serían utilizadas por el correspondiente índice de
selección, en parte porque un análisis de este tipo provee predicciones para una población
entera de animales y no solo para un animal a la vez, que es el caso de la mayoría de las
aplicaciones del índice de selección. Considera la información disponible en todos los parientes
utilizando en la ponderación la matriz de parentesco.
Debido a su habilidad para tomar en cuenta las diferencias entre GC y debido a que provee
predicciones genéticas para muchos animales a la vez, BLUP es el método preferido para las
evaluaciones genéticas a gran escala es decir la evaluación genética de poblaciones grandes
como razas enteras. Los registros del P utilizados en dichas evaluaciones usualmente
provienen de datos de campo, datos que regularmente son reportados por productores
individuales a las asociaciones de cría de las razas o a otras instituciones como ser agencias
gubernamentales.
Tipos de modelos de BLUP
BLUP es una técnica que puede ser concebida como una familia de modelos estadísticos, es
decir, representaciones matemáticas del P animal que incluye varios efectos ambientales y
genéticos y que son usados para las predicciones genéticas.
Se trabaja con modelos lineales lo que supone expresar un dato como función lineal de los
efectos, es decir, simplemente sumar los valores de los efectos ocasionalmente multiplicados
por algún factor.
Existen distintos modelos de acuerdo a qué animales recibirán las predicciones genéticas
(solamente los padres, todos los progenitores, o todos los animales), el número y clase de
predicciones generadas y la dificultad computacional. En general cuanto más sofisticado el
modelo, involucra más ecuaciones y más cantidad de recursos informáticos requiere.
Hay modelos padre, modelos padre-abuelo materno, modelo animal, modelo de medidas
repetidas, modelos materno-directo, modelos multicarácter, etc.
Cada uno difiere del otro de una forma u otra, y dos de ellos no tienen exactamente las
mismas capacidades. El modelo particular al que se hará referencia en adelante es el más
básico, aunque el más avanzado y actualmente el tipo más popular de modelo BLUP, el
modelo animal, siendo este un modelo estadístico avanzado para la predicción genética que
es utilizado para evaluar todos los animales (y no solo a los machos) en una población.
Tiene una cantidad de cualidades deseables de las cuales la más obvia es su habilidad para
evaluar “todos los animales” (en contraposición a solo los machos) en una población.
El modelo animal es un modelo lineal mixto ya que incluye efectos fijos y efectos
aleatorios.
Un efecto es una causa de variabilidad que ha sido identificada y que será incluida en el
modelo como parte de la explicación de la variabilidad de un carácter. Por ejemplo, el sexo del
individuo, el ser macho o hembra, implica variabilidad en el peso adulto dado que
normalmente los machos pesan más que las hembras. Por ejemplo, si se desea conocer el BV
de los individuos para su peso adulto, ajustaremos el efecto genético en el modelo para hacer
inferencias sobre el mismo, pero también incluiremos el efecto sexo. Obsérvese que si no se
incluyese este efecto los machos aparecerían sistemáticamente mejor valorados que las
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 13
hembras al confundirse este efecto con el genético. En general, los efectos de los que depende
la variable de trabajo pertenecerán siempre a una de estas dos categorías, efectos fijos y
efectos aleatorios.
Efectos fijos: presentan pocos niveles (clases o categorías) en la población y todos aparecen
en nuestros datos. Un ejemplo de efecto fijo es el sexo de los animales en la variable peso al
nacimiento. Conceptualmente se asume que el pertenecer a una de las categorías del efecto
representa una diferencia fija con respecto a los otros niveles del efecto, aunque esta
diferencia es desconocida. Por ejemplo, se asume que las hembras pesarán sistemáticamente
k kilogramos menos que los machos. Por esta razón se suelen llamar también efectos
sistemáticos. Se dice que se va a estimar efectos fijos cuando se pretende obtener valores
aproximados de los efectos fijos. Los cuales pueden ser a su vez continuos o discontinuos:
1. Continuos: el efecto es una variable y por tanto puede tomar cualquier valor dentro de
su rango. Un ejemplo sería la edad en meses en relación al peso al destete. La relación
entre la variable de trabajo o variable dependiente y el efecto fijo continuo o variable
independiente es fácil de explicar, dado que es de esperar que los individuos de más edad
presenten mayores pesos al destete. La relación entre ambos es proporcional y suele
emplearse el coeficiente de regresión entre ambos.
2. Discontinuos: el efecto fijo agrupa las observaciones en clases de manera que una
observación puede pertenecer a una clase o a otra. El sexo es un ejemplo claro al poder
pertenecer el dato a un macho o a una hembra, sin que exista una relación de
proporcionalidad entre ambas. Un efecto fijo discontinuo presente en todos los modelos
lineales es la media general (μ) que agrupa a todas las observaciones dentro de su único
nivel o categoría.
Efectos aleatorios: presentan muchos niveles, hasta el punto de asumir conceptualmente
que hay infinitos en la población. El ejemplo más importante en nuestro contexto es el efecto
genético aditivo identificado por el individuo. En la muestra no están representados los
infinitos animales posibles sino que se escogen sólo unos cuantos. A diferencia de los efectos
fijos, los aleatorios no presentan valor constante único desconocido sino que son en sí mismos
una distribución estadística. Conceptualmente se asume que todos los niveles pertenecen a
una distribución, generalmente normal, con media y varianza, pero el valor esperado de cada
uno de los niveles no es un valor sistemático diferente de los otros niveles, sino que el valor
esperado de todos ellos es el mismo, el de la media de su distribución.
El modelo animal se expresa en notación matricial y puede ser representado de la siguiente
forma:
Y= Xb + Za +e
Y: es el vector de los datos o indicios de producción
b: es el vector de los efectos fijos (sexo, establecimiento, grupo contemporáneo, mes o
estación de parto, edad de la vaca, número de lactancia, número de ordeñe diario, tipo de
nacimiento, edad al destete, etc.)
X: es la matriz de incidencia de los efectos fijos
a: es el vector de los factores aleatorios (valor aditivo de los animales)
e: es el desvío aleatorio residual.
Introducción a la Producción Animal - FCV - UNNE
UT 2. Capítulo II. Tema 4. 14
Ventajas del modelo animal
El modelo animal presenta innumerables ventajas en términos de evaluación genética,
siendo una de las principales que a través de la inclusión de la matriz de parentesco, el registro
de cada individuo contribuye para cada evaluación de todos sus parientes (con el peso
adecuado dado por la matriz de parentesco).
Podemos de esta forma obtener estimaciones de los BV de todos los individuos, también de
aquellos que no poseen registros.
En términos generales, se puede decir que el Modelo Animal es bastante flexible, porque
permite:
1. Utilización de información de todos los parientes.
2. Soluciones obtenidas en simultáneo para efectos fijos y aleatorios.
3. Inclusión de toda la información (efectos fijos, marcadores genéticos, grupos
genéticos, caracteres correlacionados, etc.) en un mismo modelo.
4. Fácil extensión a modelos más complejos (registros repetidos, caracteres con efectos
maternos, análisis multivariado, inclusión de efectos no-aditivos, etc.)
Por otro lado, el BLUP es bastante sensible al modelo utilizado, conexiones genéticas entre
efectos fijos, parámetros considerados, censura de los datos, etc. Y tiene el potencial
inconveniente de que la consanguinidad generada cuando se utiliza el BLUP puede ser
substancialmente superior a la obtenida en otros esquemas de selección.