Evaluación de Métodos (I)

38
EVALUACIÓN DE MÉTODOS (I) Notas Índice 1. OBJETIVOS..................................................................................................................... 2 2. NOMENCLATURA ........................................................................................................... 2 3. PRECISIÓN ..................................................................................................................... 6 3.1. Diseño experimental del estudio de imprecisión ........................................................................................ 6 3.2. Comparación con otras evaluaciones de la precisión ................................................................................ 6 3.3. Comparación estadística con el fabricante ................................................................................................ 7 3.4. Componentes de la precisión ..................................................................................................................... 7 3.5. Materiales de calibración y reactivos ......................................................................................................... 7 3.6. Detección de datos extremos (outliers) ...................................................................................................... 8 3.7. Estimación de la repetibilidad ..................................................................................................................... 8 3.8. Estimación de la precisión intra–laboratorio............................................................................................... 9 3.9. Comparación con los datos de imprecisión del fabricante u otros criterios ............................................. 10 3.10. Comparación de la repetibilidad ............................................................................................................. 10 4. LÍMITES DE DETECCIÓN Y CUANTIFICACIÓN .......................................................... 12 4.1 Uso no estándar “valor crítico” .................................................................................................................. 12 4.2. Uso no estándar del término “sensibilidad” .............................................................................................. 12 4.3. Otros límites de niveles bajos................................................................................................................... 13 4.4. Límites de detección en el contexto de métodos cualitativos .................................................................. 13 4.5. Procedimientos para determinar y verificar el límite de detección de un método.................................... 14 4.6. Aproximación general para determinar el límite de blanco ...................................................................... 15 4.7. Aproximación general para determinar el límite de detección ................................................................. 15 4.8. Diseño del estudio .................................................................................................................................... 16 4.9. Número de muestras ................................................................................................................................ 16 4.10. Características de blancos y muestras de bajo nivel ............................................................................. 17 4.11. Resultados .............................................................................................................................................. 18 4.12. Procedimiento para determinar y verificar el límite de blanco y el límite de detección.......................... 18 4.13. Procedimiento para determinar o establecer el límite de blanco ........................................................... 18 4.14. Procedimiento para determinar el límite de detección ........................................................................... 18 4.15. Consideraciones sobre la forma de la distribución................................................................................. 19 4.16. Procedimiento para verificar un límite de detección............................................................................... 20 5. LÍMITE DE CUANTIFICACIÓN ...................................................................................... 22 5.1. Establecimiento del límite de cuantificación ............................................................................................. 22 5.2. Verificación de un límite de cuantificación ............................................................................................... 22 5.3. Informe de resultados ............................................................................................................................... 23 6. LINEALIDAD .................................................................................................................. 24 6.1. Pool de muestras de pacientes ................................................................................................................ 25 6.2. Pool de muestras de pacientes diluido con un diluyente recomendado .................................................. 25 6.3. Pool de muestras de pacientes suplementado con el analito de interés ................................................. 25 6.4. Pool diluido con materiales tratados de baja concentración o con otro pool tratado ............................... 25 6.5. Controles / calibradores / materiales para estudio de linealidad comerciales ......................................... 25 6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado ........................................ 25 6.7. Material de control comercial diluido con diferente volumen del establecido .......................................... 25 6.8. Soluciones acuosas.................................................................................................................................. 26 6.9. Disoluciones en otros disolventes ............................................................................................................ 26 6.10. Intervalo analítico ................................................................................................................................... 26 6.11. Determinación del intervalo lineal........................................................................................................... 27 6.12. Regresión polinómica ............................................................................................................................. 27 6.13. Orden de la regresión polinómica........................................................................................................... 28 6.14. Grado de no–linealidad .......................................................................................................................... 29 6.15. Consideraciones acerca del error aleatorio............................................................................................ 29

description

Validacion de procesos

Transcript of Evaluación de Métodos (I)

Page 1: Evaluación de Métodos (I)

EVALUACIÓN DE MÉTODOS (I)Notas

Índice

1. OBJETIVOS.....................................................................................................................22. NOMENCLATURA...........................................................................................................23. PRECISIÓN .....................................................................................................................63.1. Diseño experimental del estudio de imprecisión ........................................................................................ 63.2. Comparación con otras evaluaciones de la precisión................................................................................ 63.3. Comparación estadística con el fabricante ................................................................................................ 73.4. Componentes de la precisión ..................................................................................................................... 73.5. Materiales de calibración y reactivos ......................................................................................................... 73.6. Detección de datos extremos (outliers) ...................................................................................................... 83.7. Estimación de la repetibilidad..................................................................................................................... 83.8. Estimación de la precisión intra–laboratorio............................................................................................... 93.9. Comparación con los datos de imprecisión del fabricante u otros criterios ............................................. 103.10. Comparación de la repetibilidad............................................................................................................. 104. LÍMITES DE DETECCIÓN Y CUANTIFICACIÓN ..........................................................124.1 Uso no estándar “valor crítico” .................................................................................................................. 124.2. Uso no estándar del término “sensibilidad” .............................................................................................. 124.3. Otros límites de niveles bajos................................................................................................................... 134.4. Límites de detección en el contexto de métodos cualitativos .................................................................. 134.5. Procedimientos para determinar y verificar el límite de detección de un método.................................... 144.6. Aproximación general para determinar el límite de blanco ...................................................................... 154.7. Aproximación general para determinar el límite de detección ................................................................. 154.8. Diseño del estudio .................................................................................................................................... 164.9. Número de muestras ................................................................................................................................ 164.10. Características de blancos y muestras de bajo nivel ............................................................................. 174.11. Resultados.............................................................................................................................................. 184.12. Procedimiento para determinar y verificar el límite de blanco y el límite de detección.......................... 184.13. Procedimiento para determinar o establecer el límite de blanco ........................................................... 184.14. Procedimiento para determinar el límite de detección ........................................................................... 184.15. Consideraciones sobre la forma de la distribución................................................................................. 194.16. Procedimiento para verificar un límite de detección............................................................................... 205. LÍMITE DE CUANTIFICACIÓN......................................................................................225.1. Establecimiento del límite de cuantificación............................................................................................. 225.2. Verificación de un límite de cuantificación ............................................................................................... 225.3. Informe de resultados............................................................................................................................... 236. LINEALIDAD..................................................................................................................246.1. Pool de muestras de pacientes ................................................................................................................ 256.2. Pool de muestras de pacientes diluido con un diluyente recomendado .................................................. 256.3. Pool de muestras de pacientes suplementado con el analito de interés ................................................. 256.4. Pool diluido con materiales tratados de baja concentración o con otro pool tratado............................... 256.5. Controles / calibradores / materiales para estudio de linealidad comerciales ......................................... 256.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendado ........................................ 256.7. Material de control comercial diluido con diferente volumen del establecido .......................................... 256.8. Soluciones acuosas.................................................................................................................................. 266.9. Disoluciones en otros disolventes ............................................................................................................ 266.10. Intervalo analítico ................................................................................................................................... 266.11. Determinación del intervalo lineal........................................................................................................... 276.12. Regresión polinómica ............................................................................................................................. 276.13. Orden de la regresión polinómica........................................................................................................... 286.14. Grado de no–linealidad .......................................................................................................................... 296.15. Consideraciones acerca del error aleatorio............................................................................................ 29

Page 2: Evaluación de Métodos (I)

página 2

6.16 Establecimiento del error máximo permisible.......................................................................................... 307. CALIBRACIÓN ..............................................................................................................317.1. Conceptos básicos asociados a la calibración......................................................................................... 317.2. Chequeo de la falta de ajuste................................................................................................................... 327.3. Diseño de un experimento de calibración ................................................................................................ 337.4. ¿Linealidad exacta? ................................................................................................................................. 337.5. Ajuste de datos a una función lineal con error en ambas variables......................................................... 347.6. Modelos de regresión y de relación funcional .......................................................................................... 347.7. Aplicaciones analíticas de FREML........................................................................................................... 357.8. Cómo estimar las ponderaciones............................................................................................................. 35APÉNDICE 1. CONSIDERACIONES ADICIONALES RELATIVAS AL ESTUDIO DE LAIMPRECISIÓN ...................................................................................................................36A1.1. Modificaciones para realizar una serie analítica por día........................................................................ 36A1.2. Desviación típica intralaboratorio o instrumental ................................................................................... 36A1.3. Ecuación de Satterthwaite ..................................................................................................................... 37A1.4. Otras estimaciones posibles .................................................................................................................. 37A1.5. Imprecisión inter–días ............................................................................................................................ 37

1. Objetivos

• Clarificar conceptos y definiciones básicos relacionados con la evaluación de métodos analíticos;• Conocer los procedimientos estadísticos adecuados para abordar la evaluación y validación de métodos

e instrumentos analíticos;• Conocer los criterios y algoritmos propuestos por entidades científicas de ámbito nacional e

internacional para la evaluación de métodos e instrumentos.

2. Nomenclatura

A lo largo de las dos partes de este tema dedicado a la evaluación de métodos, se emplearán términos queconviene definir y matizar previamente. También se recomienda revisar algunos documentos de la SEQCque hace referencia a la validación de métodos.1

Exactitudy error

Exactitud Es la concordancia entre un resultado de un test y el valor aceptado comoreferencia. Cuando se aplica a una serie de resultados analíticos, incluye unacombinación de componentes aleatorios del error y componentes de sesgo oerror sistemático. [ISO 3534: 3.11] Esencialmente, la exactitud es la ausenciade error. Un resultado es más exacto si se comete un error menor. Losconceptos exactitud y precisión están relacionados: es poco probable que unresultado de un método sea exacto si en general los resultados queproporciona dicho método no son precisos. Cabe destacar que,estrictamente, el concepto de exactitud se aplica a resultados, y no aentidades generales como métodos analíticos, laboratorios o individuos.

Error (demedida)

Es la diferencia entre el resultado de una medida y el valor verdadero delmensurando.Dado que el valor verdadero no puede ser determinado, en la práctica seemplea un valor verdadero convencional. [VIM: 3.10]

Error aleatorio(de un resultado)

Es una componente del error que, en el curso de un número de resultadosde un test de las mismas características, varía de forma impredecible. No esposible corregir el error aleatorio. [ISO 3534: 3.9]

Error sistemático Es una componente del error que, en el curso de un número de resultadosde un test de las mismas características, permanece constante o varía deforma predecible. Los errores sistemáticos y sus causas pueden serconocidos o desconocidos. [ISO 3534: 3.10]

1 Responsabilidades en la obtención de evidencia objetiva para la validación de las característicasmetrológicas de los procedimientos de medida del laboratorio clínico. Quím Clín, 2003; 22: 33-5.

Page 3: Evaluación de Métodos (I)

página 3

Veracidady sesgo

Veracidad Concordancia entre el valor promedio obtenido en una serie larga deresultados de un test y un valor aceptado como de referencia. [ISO 3534:3.12] Habitualmente se expresa numéricamente mediante la medidaestadística del sesgo que está inversamente relacionado con la veracidad

Sesgo Es la diferencia entre la expectativa de los resultados de un test y un valor dereferencia aceptado. El sesgo es el error sistemático total, en contraste conel error aleatorio. Puede haber una o más componentes del error sistemáticoque contribuyen al sesgo. Una diferencia sistemática grande entre un valoraceptado como referencia se refleja mediante un valor de sesgo mayor. [ISO3534: 3.13]La veracidad equivale a la ausencia de sesgo

Intervalo lineal Es el intervalo en el cual los resultados de un método analítico sonaceptablemente lineales; esto es, en el que el error de no–linealidad esmenor que un error criterio dado

Linealidad Es la capacidad (en un intervalo dado) de proporcionar resultados que sondirectamente proporcionales a la concentración (cantidad) de analitopresente en la muestra analizada.La linealidad suele aplicarse a todo el sistema de respuesta (p.ej. a larespuesta analítica final antes que a la lectura de salida del instrumento); Lalinealidad de un sistema se mide chequeando niveles de un analito que sonconocidos por formulación o con respecto a otro (no es necesario que seconozca el nivel absoluto); cuando los resultados del sistema se representanfrente a estos valores, el grado en el que la curva representada se aproximaa una línea recta es una medida de la linealidad del sistema.

Precisión Precisión Es la concordancia entre los resultados independientes de un test obtenidosbajo unas condiciones estipuladas. La precisión depende sólo de ladistribución de errores aleatorios y no se relaciona con el valor verdadero oespecificado. La medida de la precisión habitualmente se expresa entérminos de imprecisión y se calcula como una desviación típica de losresultados de un test. Una menor precisión se refleja en una mayordesviación típica. Se habla de resultados independientes de un test cuandohan sido obtenidos de manera que no están influenciados por ningúnresultado previo del mismo o similar al objeto del test. La medida cuantitativade la precisión depende de manera fundamental de las condicionesestipuladas. Las condiciones de repetibilidad y de reproducibilidad son casosparticulares de condiciones estipuladas extremas [ISO 3534: 3.14]Como la precisión depende de las condiciones de la medida, éstas deben serespecificadas cuando se hace referencia a una estimación de la precisión. Acontinuación se definen términos de uso común empleados para describir lascondiciones de medida

Condiciones derepetibilidad

Son condiciones en las que se obtienen resultados independientes de un testcon el mismo método en sistemas idénticos en el mismo laboratorio por elmismo operador empleando el mismo equipo y en intervalos de tiempocortos. [ISO 3534: 3.15]

Page 4: Evaluación de Métodos (I)

página 4

Condiciones dereproducibilidad

Son condiciones en las que los resultados de un test se obtienen mediante elmismo método en sistemas idénticos en diferentes laboratorios condiferentes operadores y empleando diferentes equipos. [ISO 3534: 3.20]. Lascondiciones de repetibilidad suponen repetir la ejecución del método enterodesde un punto en el que se toma una alícuota de la muestra del laboratorio,no se reduce únicamente a repetir las determinaciones instrumentales enextractos preparados

Repetibilidad Precisión estimada bajo condiciones de repetibilidad [ISO 3534: 3.15]NOTAS• Se distingue entre repetibilidad y reproducibilidad refiriéndose a la

primera cuando se realizan medidas sucesivas bajo las mismascondiciones, y a la segunda cuando las medidas se realizan bajodiferentes condiciones de medida2. Para las condiciones de repetibilidad,las definiciones de VIM e ISO3534 son casi idénticas

• Sin embargo, la definición de VIM de las condiciones de reproducibilidades más general que la de la norma ISO 3534, e incluye medidas intra-laboratorio sobre periodos extensos de tiempo y/o incluso medidasempleando diferentes principios de medida. Esta terminología másgeneral es cada vez más común. Por este motivo, se recomienda que lascondiciones de medida se indiquen siempre cuando se refiere lareproducibilidad

• La norma ISO 5725 discute adicionalmente medidas de precisiónintermedia, y proporciona la notación para condiciones en que varían eltiempo, calibración, operador y equipo

Reproducibilidad Precisión bajo condiciones de reproducibilidad [ISO 3534: 3.20]Precisióninterserial (run–to–run)

Precisión calculada cuando se obtienen resultados independientes en seriesseparadas en el mismo laboratorio con el mismo método y en el mismomaterial

Run Periodo en el que se realiza el análisis bajo condiciones de repetibilidad y semantienen constantes los factores que afectan a la exactitud. Nótese que losruns separados habitualmente se realizan en distinto tiempo e involucranalguna recalibración del instrumento

Condiciones deprecisiónintermedia

Cuando los resultados de un test se obtienen con el mismo método enidéntico sistema de medida y test, pero bajo diferentes condiciones deoperación. (a) Hay cuatro elementos de las condiciones de operación:tiempo, calibración, operador, y equipo; (b) deben anotarse las condicionesque cambian. Suele incluir estimaciones de la imprecisión, como lascomúnmente denominadas interserial (between–run), intra–día (within–day),inter–día (between–day), instrumental (within–device) e intralaboratorio(within–laboratory)

Condiciones derepetibilidad

Condiciones donde se obtienen resultados independientes con el mismométodo en idéntico material y en el mismo laboratorio, por el mismo operadorusando el mismo equipo y en un periodo corto de tiempo (ISO 3534-1);Anteriormente se denominaba precisión intraserial (within–run)

Condiciones dereproducibilidad

Los resultados se obtienen con el mismo método en idéntico sistema y endiferentes laboratorios con diferentes operadores y diferentes equipos (ISO5725-1)3

2 ISO. International of vocabulary of basic and general terms of metrology (VIM). Geneva:ISO, 1993.3 ISO. Accuracy (trueness and precision) of measurement methods and results – Part 1: General principlesand definitions. ISO 5725-1. Geneva:ISO, 1994.

Page 5: Evaluación de Métodos (I)

página 5

PrecisiónInstrumental

Precisión estimada mediante medidas repetidas en una única soluciónproblema, sin ajustes instrumentales, en un periodo corto de tiempoNOTAS• La precisión instrumental no es una definición ISO, sino un tipo de

precisión que frecuentemente se encuentra en las especificaciones delos instrumentos. Difiere de la repetibilidad en que no incluye repeticiónde todo el método analítico, sino sólo la medida instrumental en si,frecuentemente incluso sin ajustes instrumentales

• Las condiciones interseriales (run–to–run) constituyen un caso específicode las condiciones de reproducibilidad en la definición VIM, y secorresponden con las condiciones intermedias definidas por la normaISO 5725

Mensurando Cantidad sujeta a una medida [ISO 3534: 3.5]Incertidumbre (a) Una estimación asociada a un resultado que caracteriza el intervalo de

valores en los que debe encontrarse el valor verdadero. [ISO 3534: 3.25](b) (de medida) Parámetro asociado con el resultado de una medida, que

caracteriza la dispersión de los valores y puede atribuirserazonablemente al mensurando. [GUM: 2.2.3]4

NOTAS• Las definiciones (a) y (b) difieren en la filosofía, pero para la mayoría de

los propósitos pueden considerarse equivalentes• Una estimación de la incertidumbre debe incorporar tanto lo que se

conoce acerca de los efectos aleatorios como de la incertidumbreasociada a efectos sistemáticos de los procesos de medida

• Dado que la estimación de la incertidumbre incorpora las incertidumbresde todos los posibles efectos, una estimación de la incertidumbre esprobablemente el modo más apropiado de expresar la exactitud de losresultados

• En un análisis convencional, la incertidumbre asociada con un resultadoindividual se estima habitualmente a partir de estudios previos, queincluyen estudios de validación y no se requiere una estimaciónindividual de la incertidumbre de cada resultado

Incertidumbretípica

Es la incertidumbre del resultado de una medida, expresada comodesviación estándar [GUM: 2.3.1]

Incertidumbreexpandida

Cantidad que define un intervalo en torno al resultado en el que se esperaque se encuentre una fracción grande de la distribución de valores quepueden atribuirse razonablemente al mensurando [GUM: 2.3.5]La ilustración clásica de la exactitud y precisión en términos de una diana yano describe correctamente la exactitud. Ésta se refiere a una combinación deerrores sistemáticos y aleatorios, por lo que la siguiente gráfica es másadecuada

4 ISO Guide to the expression of uncertainty in measurement. Geneva:ISO,1995. ISBN 92-67-10188-9.

Page 6: Evaluación de Métodos (I)

página 6

3. Precisión

En el presente apartado se presenta el protocolo de estudio de imprecisión según recomendaciones delCLSI.5 Se recomienda consultar también otros protocolos publicados por la SEQC para conocer otrosposibles enfoques del procedimiento.6

3.1. Diseño experimental del estudio de imprecisiónDurante cada uno de los días que dure el estudio de la imprecisión, deben analizarse en dos seriesseparadas dos muestras, cada una con diferente concentración del analito de interés. Adicionalmente, almenos se procesa en cada serie analítica una muestra de control de calidad, según los procedimientoshabituales de control de calidad del laboratorio.Si la variabilidad entre las diferentes series analíticas no constituye un aspecto relevante en el instrumentoevaluado, deben analizarse cuatro muestras de cada nivel, como dos pares, en condiciones de repetibilidad,en diferentes momentos del día. Los resultados apareados deben tratarse como dos resultados obtenidosen la misma serie.Tras este protocolo propio del periodo de familiarización, el experimento debe continuarse durante 15 o másdías. Al final de cinco días de trabajo, deben recalcularse los límites del control en una gráfica de control decalidad y chequear todos los datos para ver si son aceptables. Si se detectan valores aberrantes, debeidentificarse la causa del problema.No deben eliminarse datos sin una justificación válida, ya que esto conducirá a una inadecuada valoraciónde la imprecisión. Cuando se complete el experimento de imprecisión, se realizarán los correspondientescálculos estadísticos con los datos. Si se observa tendencia durante el protocolo del periodo defamiliarización, los datos más antiguos deben ser excluidos y reemplazados por una cantidad igual de datosrecogidos al final del periodo planeado para el periodo de evaluación.

3.2. Comparación con otras evaluaciones de la precisiónRealizar un estudio de repetibilidad, o tomar una única observación (o unas pocas) a una concentracióndada cada día durante 10 o 20 días para evaluar la imprecisión total no es una práctica correcta al no incluiren estos procedimientos ciertas causas significativas de variación. Cuando se emplea una única serieanalítica para estimar la repetibilidad (imprecisión intraserial o within–run), existe un riesgo importante deque las condiciones operativas efectivas en el momento de procesar dicha serie analítica no reflejen losparámetros operativos habituales, afectando por tanto adversamente a la estimación. Además, no hay formade determinar cómo de representativa puede ser una única serie analítica de las características en estudio.Por este motivo, se recomienda que la repetibilidad se estime calculando la imprecisión intraserial (within–run) en varias series analíticas, asegurándose por tanto una estimación más robusta y representativa de lascaracterísticas del sistema en diversas condiciones operativas futuras.Las medidas intermedias de la imprecisión calculadas serán independientes del número de días y de seriesanalíticas procesadas en un día empleadas para su estimación, cosa que no ocurre con los métodostradicionales. Veremos cómo este procedimiento combina correctamente el efecto de la repetibilidad y loscomponentes interserial e inter–día (que varían relativamente de un método a otro), y evitan el error deemplear términos incorrectos para el estudio de la imprecisión (como es la día–a–día).Cuando se diseña un experimento de evaluación, se debe decidir de antemano con cuánta fiabilidad sedesea determinar la imprecisión verdadera. La estimación obtenida con cada protocolo no será la mismaaunque se repita exactamente el mismo protocolo en el mismo laboratorio con un instrumento dentro delintervalo de tolerancia del control, incluso si la imprecisión real es la misma.Estas estimaciones de la imprecisión estarán distribuidas en torno a un valor “verdadero”, y las estimacionesobtenidas a partir de más observaciones se acercarán más a la imprecisión “verdadera”. En general, unmayor número de observaciones conduce a más confianza en una estimación, y a mayor confianza en laestimación, mayor potencia estadística para detectar alejamiento de las características esperadas para elinstrumento.

5 NCCLS. Documento EP5-A2—Evaluation of precision performance of quantitative measurement methods;Approved guideline6 Recomendaciones para el estudio de la precisión de los procedimientos de medida en el laboratorioclínico. Quím Clín 2003; 22: 63-5

Page 7: Evaluación de Métodos (I)

página 7

3.3. Comparación estadística con el fabricanteEste es un concepto muy importante que ilustra cómo una estimación de la repetibilidad basada en 100grados de libertad puede detectar desviaciones relativamente pequeñas de las características delfabricante. Asimismo, una estimación de la repetibilidad basada solo en 10 grados de libertad detectaránsólo separaciones grandes de las características y por tanto una prueba basada en dicha estimación tendrámuy poca potencia estadística.Si el estimado tiene 40 grados de libertad, se tiene mayor potencia estadística y la estimación puededetectar desviaciones pequeñas, aunque quizá clínicamente importantes, de las características delfabricante.

3.4. Componentes de la precisiónEl principal objetivo del experimento de evaluación de la precisión es estimar la precisión del dispositivo demedida o del método tal como se maneja en un instrumento o laboratorio. Intuitivamente, la imprecisión esla variabilidad del instrumento cuando se use en un periodo indefinidamente largo de tiempo. Hasta ciertopunto, diversas fuentes de variabilidad contribuyen a esta imprecisión a largo plazo. En general, basta condiseñar un experimento que contemple todas las fuentes que afectan a la estimación de la imprecisión intra–laboratorio sin tratar de determinar el tamaño relativo de cada fuente o componente. Los términosempleados para describir las componentes de la imprecisión relacionadas con el tiempo incluyen:• Repetibilidad;• Imprecisión interserial;• Imprecisión intra–día;• Imprecisión inter–día; y• Imprecisión intra–laboratorio.De estas, la repetibilidad y la imprecisión intra–laboratorio son generalmente las de más interés. En estediseño, no se pretende incorporar específicamente las estimaciones separadas de otras fuentessignificativas de variabilidad, como el calibrador o las diferencias de lote de reactivos o detécnicos/operadores.

3.5. Materiales de calibración y reactivos Puede emplearse para todo el protocolo un único lote de reactivos y materiales de calibración, pero lainterpretación de los resultados debe considerar este hecho, dado que se puede subestimar verdaderasimprecisiones a largo plazo, intra–laboratorio (o instrumentales). El introducir varios lotes de estosmateriales incrementará la variabilidad observada, y aunque el experimento no permita estimarseparadamente los efectos de estos factores, puede ser representar mejor la imprecisión real.Los materiales empleados en el estudio deben ser seleccionados de modo que simulen las característicasde muestras clínicas adecuadas. Cuando sea posible y apropiado, se preferirán pooles estables ycongelados. En caso necesario, pueden emplearse materiales estables comerciales, con base proteica.Se recomiendan dos concentraciones, aunque pueden usarse más. En este protocolo la imprecisión seestima separadamente para cada nivel, no se promedia para los distintos niveles. Si las estimaciones de laimprecisión o de la imprecisión relativa son iguales a estos niveles, hay evidencia de imprecisión constante.En caso contrario, puede ser necesario evaluar más niveles.Si es posible, conviene seleccionar concentraciones que abarquen una porción significativa del intervalo demedida. Si se dispone de más de dos concentraciones, deben elegirse concentraciones adicionales tancercanas como sea posible a los niveles de decisión médica empleados en el laboratorio. Para comparar losresultados de la evaluación con los publicados por el fabricante, deben elegirse concentraciones similares alos niveles empleados por el fabricante para el estudio.Cuando no se desea verificar una imprecisión dada por el fabricante, sino establecerla en el propiolaboratorio, deben chequearse un nivel bajo, otro alto y otro cercano al punto de decisión médica. Si los tresniveles demuestran una precisión constante o precisión relativa constante, son suficientes para el estudio.En caso contrario, o si hay diferencias importantes en las estimaciones de la precisión entre los tres niveles,deben chequearse más niveles.El experimento de evaluación de la precisión requiere una cantidad suficiente de datos de modo que laestimación obtenida de la misma refleje adecuadamente los verdaderos parámetros de la imprecisión delinstrumento. En general se considera aceptable un mínimo de 20 días operacionales en condiciones

Page 8: Evaluación de Métodos (I)

página 8

aceptables para llevarlo a cabo. Durante los primeros cinco días del experimento, el usuario debefamiliarizarse con el protocolo.Se considera un método corto a aquel en que la duración de la determinación es inferior a 2 h, mientras queun método largo (como el radioimmunoanálisis) dura considerablemente más y no se procesa más de uno aldía. Para métodos largos, existe un procedimiento aplicable incluyendo una serie analítica por día. Paraprocedimientos cortos, las muestras pueden ser analizadas en cualquier momento de la serie analítica. Pararealizar el análisis de la varianza, una serie analítica de evaluación es un periodo de tiempo discreto derecogida de datos diseñado para poder estimar la variabilidad (o deriva) en un día. Para algunosdispositivos, como instrumentos de acceso aleatorio, discretos, o individuales, el concepto de serie analítica(run) puede no ser apropiado. En este caso, las muestras deberían procesarse por duplicado encondiciones de repetibilidad y tiempos aleatorios a lo largo de una jornada de trabajo para simular laoperación real de instrumento.Cada día habrá que realizar los siguientes pasos:1. Analizar dos series analíticas (runs o batches);2. Si una serie analítica debe ser rechazada debido al control de calidad o a dificultades operativas, se

realiza una nueva serie analítica después de que se haya solucionado el problema;3. En cada serie, se analizarán dos alícuotas del material chequeado para cada concentración;4. Se deben incluir en cada serie las muestras de control de calidad que se juzguen necesarias para

valorar la aceptabilidad de la serie analítica o el día;5. Se cambia el orden de análisis de los materiales analizados y muestras de control de calidad para cada

serie analítica o día;6. Para simular la operación verdadera, se incluyen al menos diez muestras de pacientes en cada serie, si

es posible;7. Separar la series analíticas realizadas cada día al menos en 2 h.

3.6. Detección de datos extremos (outliers)Se debe definir un criterio de detección de datos aberrantes para asegurar que problemas operacionales nodistorsionarán los datos resultantes de la estimación de la imprecisión.Asumiendo procedimientos adecuados de control de calidad durante el experimento, se sugiere un test débil(baja potencia) para detectar datos muy aberrantes de los recogidos durante el test de imprecisiónpreliminar.(a) Si la diferencia absoluta entre los replicados excede 5,5 veces la desviación típica determinada en el

test preliminar de la imprecisión el par de datos debe rechazarse.(b) Si se detecta un valor aberrante, el problema subyacente debe ser investigado, y la serie analítica

repetida. El valor de 5,5 deriva del valor superior del 99,9 % del rango normalizado para la diferenciaentre dos observaciones. Este test debería usarse cuando la concentración del material empleado en elchequeo preliminar se acerca razonablemente a la concentración del material en evaluación.

Se pueden planificar más días para el estudio de la imprecisión, en prevención de los valores aberrantesque haya que eliminar. Si más del 5 % de las series analíticas han de ser rechazadas y no se encuentracausa, debe considerarse la posibilidad de que el instrumento no sea lo suficientemente estable como parapermitir establecer la variabilidad de una forma válida.

3.7. Estimación de la repetibilidad

( )2 2

1 21 1

4

I

i j i ji j

f

x xs

I= =

−=

∑ ∑

donde I es el número total de días (generalmente 20);j es el número de series analíticas (intra–día) (1 ó 2);

1I jx es el resultado para el replicado 1, de la serie j en el día i ;

2I jx es el resultado para el replicado 2, de la serie j en el día i .

Page 9: Evaluación de Métodos (I)

página 9

Se necesitan dos resultados de cada uno de las dos series analíticas de cada día para usar la fórmulaanterior. Si solo se dispone de una serie analítica en un día dado, se puede utilizar la fórmula (con 1j = ).Siempre que no haya más de un 10 % de los días de la evaluación en que falten series analíticas (porejemplo, con un solo run) en un diseño experimental de dos series analíticas por día, los cálculosresultantes pueden ser válidos (aplicando las fórmulas del Apéndice 1) si sólo hay una serie analítica pordía.

3.8. Estimación de la precisión intra–laboratorioSe necesitará realizar los siguientes cálculos:faltan los subíndices de las formulas de A y B, al menos no se ven con mi version de word

( ) 21 21

2

I

i iix x

AI

=

−=

∑ i i

donde: I es el número de días (con dos series analíticas);

1I jx es el resultado promedio de la serie analítica 1, en el día i (promedio de dos replicados);

2I jx es el resultado promedio de la serie analítica 2, en el día i (promedio de dos replicados).

A se calcula elevando al cuadrado la diferencia entre el promedio de los replicados de la primera y lasegunda serie analítica de cada día, sumando dichas cantidades para todos los días, dividiendo por 2 I , ytomando la raíz cuadrada. Este cálculo no debe emplearse si los datos se han generado en un solo día osolo una serie analítica.Otra estimación necesaria es:

( ) 21

1

I

iix x

BI

=

−=

∑ i i i i i

donde: I es el número de días;

ix ii es el promedio de todos los resultados del día i ; y

x i ii es el promedio de todos los resultados.

Esta es la desviación típica de las medias diarias (Apéndice 1)Con estas dos cantidades, se calculan

22 2

22 2

2

2

d d

rr r

As B

ss A

= −

= −

donde: d ds es la estimación de la desviación típica inter–días (between–day);

r rs es la estimación de la desviación típica interserial (between–run).

Si la varianza así calculada fuera negativa, por convenio se considerará igual a cero.

La estimación de la imprecisión intra–laboratorio o instrumental (within–device) se calcula con la siguientefórmula para la desviación típica:

2 2 2T d d r r rs s s s= + +

Con esta formula para Ts el resultado obtenido será diferente al estimado con el cálculo mediante ladesviación típica de todos los datos (sin tener en cuenta el día o la serie analítica). La formula anterior es laforma correcta para estimar la imprecisión instrumental, porque sopesa adecuadamente la repetibilidad así

Page 10: Evaluación de Métodos (I)

página 10

como las componentes de la imprecisión inter–días e interserial. El coeficiente de variación (expresado enporcentaje) correspondiente a esta estimación de la imprecisión debería calcularse dividiendo Ts

por laconcentración del material analizado y multiplicado por 100.

3.9. Comparación con los datos de imprecisión del fabricante u otros criteriosLa estimación de la imprecisión obtenida en la sección anterior puede compararse con las especificacionesde la imprecisión del fabricante. El estadístico ji–cuadrado ( )2χ será el que deberá utilizarse. Para ello, se

tomará como referencia la estimación puntual que ofrezca el fabricante (por ejemplo, la desviación típica).Se deben comparar por separado la repetibilidad y la imprecisión intermedia.

3.10. Comparación de la repetibilidad

Se toma como valor de comparación la desviación típica aportada por el fabricante ( )rσ . El test de ji–

cuadrado usa el cuadrado de las estimaciones de la repetibilidad, tanto del usuario como del fabricante.Deben conocerse el número de grados de libertad asociados con 2

rs (varianza intraserial estimada por el

usuario). 2rs tendrá tantos grados de libertad como pares de datos (replicados) se usen para calcularla. Por

tanto, será igual el número de series analíticas realizadas en el experimento, identificadas en adelante comoR . Para aplicar el test es necesario calcular el siguiente valor:

22

2r

r

s Rχ

σ=

donde: 2rs es la repetibilidad estimada por el usuario (varianza);

2rσ es la repetibilidad aportada por el fabricante (varianza); y

R es el número total de series analíticas realizadas (grados de libertad para 2rs ).

El valor calculado de 2χ debe compararse con los valores tabulados del estadístico 2χ utilizando el valorcrítico superior del 95 % de confianza con R grados de libertad (tabla 1). Si el valor calculado es inferior alde la tabla, la estimación no es significativamente diferente del valor de la imprecisión aportado por elfabricante y se puede aceptar como verificada.

g. de l. de la varianzaestimada por el usuario valor crítico del 95 % valor crítico del 99 %

5 11,1 1,516 12,6 16,87 14,1 18,58 15,5 20,19 16,9 21,7

10 18,3 23,211 19,7 24,712 21,0 26,213 22,4 27,714 23,7 29,115 25,0 30,616 26,3 32,017 27,6 33,4

Page 11: Evaluación de Métodos (I)

página 11

g. de l. de la varianzaestimada por el usuario valor crítico del 95 % valor crítico del 99 %

18 28,9 34,819 30,1 36,220 31,4 37,625 37,7 44,330 43,8 50,935 49,8 57,340 55,8 63,750 67,5 76,260 79,0 88,470 90,5 100,475 96,2 106,479 100,7 111,180 101,9 112,390 113,1 124,1

100 124,3 135,6Tabla 1. Valores críticos de ji-cuadrado para la estimación de la varianza estimada por el usuario

Se puede emplear una aproximación similar a la anterior para comparar la estimación de la imprecisiónintra–laboratorio (o instrumental, within-device) con los requerimientos de la aplicación médica de cadaparámetro. Sin embargo, a diferencia de la estimación de la repetibilidad, calcular el número exacto degrados de libertad para Ts implica un cálculo más complicado. Dada la estructura del protocolo propuestoen este tema, el usuario no puede asumir que todas las observaciones sean independientes, lo que esrequisito necesario antes de que se pueda utilizar la estimación de los grados de libertad del propio usuario(número total de observaciones menos uno). La siguiente formula para los T grados de libertad de Ts

tieneen cuenta esta falta de independencia.

( ) 2

2 2 2

2

21

I ME MR MDT IME MR MD

I

+ +=

+ +−

donde: 2rME s= es la media cuadrática intraserial, o varianza de la repetibilidad;

22MR A= es la media cuadrática de las series analíticas o runs;24MD B= es la media cuadrática de los días.

El valor entero más próximo al calculado según esta formula será empleado como grados de libertad para

Ts . Usando este valor, el estadístico apropiado es el siguiente:

22

2T

T

s Tχ

σ×

=

donde: 2Ts es el cuadrado de la desviación típica intra–laboratorio (o instrumental) estimada por el

usuario;2Tσ es el cuadrado de la desviación típica instrumental aportada por el fabricante para el

instrumento o requerida para los fines médicos a los que se destina el análisis;

T son los grados de libertad para Ts .

Page 12: Evaluación de Métodos (I)

página 12

Si el valor calculado de 2χ es inferior que el valor crítico superior del 95 % de una distribución de2χ (Tabla 1), se consideran aceptables las especificaciones de la imprecisión.

Si, por el contrario, el valor de 2χ calculado es mayor que dicho límite crítico superior del 95 % de 2χ laimprecisión estimada no entra dentro de los límites aceptables para la aplicación médica definida.La estimación del usuario puede ser superior que la desviación típica aportada por el fabricante y ser aúnasí aceptable. Dado que el experimento del usuario se basa en un número limitado de observaciones, cabeesperar errores de muestreo para los valores calculados de rs y Ts en torno a los valores verdaderos.Cuanto mayor sea el tamaño del experimento, más próximas serán las estimaciones al valor real. El test de

2χ se usa para determinar si la estimación del usuario es significativamente peor que la aportada por elfabricante.La valoración de la tolerancia que puede considerarse aceptable en función del analito considerado es unainformación que debe obtenerse a partir de las especificaciones de variabilidad biológica descritas en labibliografía y de los requisitos necesarios para que un test tenga utilidad para la aplicación que se le deseedar.

4. Límites de detección y cuantificación

Cuando se pretende conocer el umbral a partir del cual un método es capaz de detectar la presencia deanalito, es importante no olvidar que esta verificación puede no ser correcta si el material empleado no esadecuado. Algunos requisitos que no se deben olvidar se presentan a continuación, como la comprobaciónde la gaussianidad y simetría de los resultados con los que se estimará el límite de detección así como lahomoscedasticidad de los resultados de los blancos y las muestras de bajo nivel del analito estudiado.Además, veremos cómo es necesario considerar desde el punto de vista estadístico el hecho de que unamuestra con una concentración real del analito igual al límite de detección sólo tiene una probabilidad del 50% de proporcionar un resultado que sea interpretado como presencia de analito.En este apartado se presentará el protocolo según recomendaciones del CLSI.7 Una visión simplificadapuede consultarse en los documentos de la SEQC.8

4.1 Uso no estándar “valor crítico”El término valor crítico se emplea en la norma ISO 11843 como el resultado más alto que puede esperarseen una muestra de blanco (muestra sin analito o con concentración cercana a cero). Es la respuesta delmétodo (o instrumento) por encima de la que la muestra puede considerarse que tiene un valor positivo delmensurando. Sin embargo, este término se emplea frecuentemente en los laboratorios clínicos para losresultados de un test que indican una condición médica importante.En este tema la respuesta umbral de la que estamos hablando, se denominará límite de blanco (LB).

4.2. Uso no estándar del término “sensibilidad”El término sensibilidad no se empleará en este contexto sino alguna de las alternativas más adecuadas. Ellímite de detección se prefiere debido a que su definición conlleva menor confusión y por tratarse de untérmino muy utilizado.En muchos laboratorios clínicos y aplicaciones diagnósticas se habla en ocasiones de sensibilidad,sensibilidad analítica indistintamente con límite de detección.Sin embargo, el término sensibilidad tiene otros muchos usos, algunos de los cuales son mucho másadecuados en las áreas correspondientes. Así, el uso más común deriva de la definición IUPAC de lasensibilidad analítica, que es la pendiente de la curva de calibración. La función de calibración, como se havisto, relaciona la media de las concentraciones medidas con concentraciones reales (conocidas) delanalito; cuanto más pronunciada sea la pendiente de la curva de calibración, el método será más sensible apequeños cambios en la concentración del analito presente en la muestra. Este concepto dista mucho del

7 CLSI Documento EP17 - Protocols for determination of limits of detection and limits of quantitation;Approved guideline.8 Recomendaciones para el estudio de la capacidad de detección de los procedimientos de medida en ellaboratorio clínico. Quím Clín 2004; 23: 439-41.

Page 13: Evaluación de Métodos (I)

página 13

de límite de detección. Además, incluso si la pendiente de la curva de calibración es pronunciada, la menorconcentración que puede detectarse con fiabilidad puede ser elevada si existe gran variabilidad en la señalmedida. Por otra parte, un método con moderada sensibilidad analítica (moderada pendiente de la curva decalibración) pero muy baja variación aleatoria de la señal puede tener un límite de detección bajo.Otro uso que incluye el término sensibilidad es la denominada sensibilidad funcional, empleada paradescribir la precisión interserial a muy bajas concentraciones de analito, interesante para ciertosprocedimientos diagnósticos con requerimiento de muy alta precisión a bajas concentraciones. Los términossensibilidad diagnóstica o clínica se emplean para caracterizar o comparar el comportamiento de laspruebas diagnósticas en relación con una información clínica preespecificada (por ejemplo, presencia oausencia del analito diana relacionado con la enfermedad).

4.3. Otros límites de niveles bajosHay diversos tipos de límites de uso común en la nomenclatura de la química clínica, que se emplearán eneste tema: límite de blanco ( )LB , límite de detección ( )LD y límite de cuantificación ( )LQ . Sin embargo,hay otros dos tipos de límites, el límite inferior del intervalo lineal y el límite inferior del intervalo de medida.Es posible que cuatro de estos cinco límites coincidan (con el modelo que consideraremos en el presentetema el LB es inferior al LD , o podrían ser los cinco diferentes). Es más frecuente que algunos seaniguales, pero no todos.Al describir estos conceptos es importante distinguir entre la verdadera cantidad de sustancia que seencuentra realmente en la muestra y el resultado de una medida individual. En este tema, se hablará deconcentración real para describir la que contiene realmente la muestra y concentración medida o resultadopara describir los valores que se obtendrán en el laboratorio cuando se utilice un método analítico particular.La relación entre estos conceptos se describe a continuación:• El menor es el límite de blanco, LB , que es el valor más alto que se espera observar en una serie de

resultado obtenidos en una muestra que no contenga analito. Es importante notar que el LB se refierea un resultado observado de la prueba, mientras que el resto de límites se refieren a concentracionesreales del analito.

• El siguiente límite más bajo es el límite de detección, LD , que es la concentración real a la que unresultado observado muy probablemente exceda el LB y por tanto podrá declarase detectado.

• El límite de cuantificación, LQ , es la menor concentración real a la cual el analito es detectado confiabilidad y a la cual la incertidumbre del resultado observado es menor o igual que el límite establecidopara la incertidumbre, por el laboratorio o por el fabricante del método. Los objetivos para laincertidumbre (o para el sesgo o la imprecisión) deben obtenerse de las especificaciones del método, oestar disponibles a partir de los registros del laboratorio.

• El límite más bajo del intervalo de medida ( )LMR es el nivel más bajo al que se cumplen lascondiciones definidas para el método. Las condiciones definidas incluyen características establecidas,como sesgo e imprecisión, incertidumbre, entre otras características.

• El límite inferior del intervalo lineal ( )LLR , es la concentración más baja a la que la respuesta delmétodo tiene una relación lineal con la concentración verdadera9. Esto implica requisitos para el error deno–linealidad, el cual debe acompañar a cualquier informe de linealidad.

Siempre se cumple que LB LD LQ< < . El resto de límites pueden no tener una relación consistente concada uno de los demás. El puesto relativo de estos límites vendrá determinado por los objetivos decuantificación, error de no–linealidad y otras características definidas para el método.

4.4. Límites de detección en el contexto de métodos cualitativosEl límite de detección es también un criterio de eficacia de métodos cualitativos, donde existe un fondocontinuo de señal instrumental, ya que el resultado se informa como “positivo” o “negativo” (o bien“presente” o “ausente”). Por ejemplo, los métodos de ELISA usan una función de densidad óptica u otrasrespuestas instrumentales para distinguir entre respuestas positivas y negativas. Para tests cualitativostambién es posible estimar el límite de detección. La relación entre el límite de detección, el punto

9 NCCLS. Documento EP6. Evaluation of the linearity of quantitative measurement procedures: A statisticalapproach.

Page 14: Evaluación de Métodos (I)

página 14

discriminante entre los resultados positivos y los negativos (también denominado umbral o cutoff), y larespuesta instrumental a concentraciones cercanas a cero, deberían estar totalmente documentadas por elfabricante y ser comunicada a los usuarios. Esto no se aplica a los métodos en que el punto discriminanteestá muy por encima del límite de detección, como es el caso de los tests de embarazo.Las pruebas cualitativas pueden tener un intervalo dinámico estrecho y alcanzar la saturación de la señal aconcentraciones relativamente bajas. Sin embargo, todas las pruebas cualitativas con un fondo continuotienen un área de transición desde la ausencia de respuesta o señal de fondo hasta la respuesta completa,y el punto discriminante está generalmente diseñado para situarse en esa área. Para algunas pruebas, losfabricantes definen un umbral diferente para los resultados positivos y los negativos, creando una zonadonde la respuesta es “indeterminada.” Esta área indeterminada se denomina intervalo del 95 % en eldocumento NCCLS EP12. User protocol for evaluation of qualitative test performance. En dicho documento,sin embargo, no se define un intervalo de confianza estadístico entorno al punto de cutoff, sino que losextremos que delimitan este intervalo son las concentraciones a las que resultados repetidos son positivosel 95 % de las veces o negativos el 95 % de las veces, respectivamente. Cabe destacar que la repetición deuna prueba de concentración exactamente igual a la del cutoff proporcionará resultados positivos en el 50 %de las réplicas y resultados negativos en el restante 50 % de las veces. En este protocolo, el LB es elmismo que el punto de cutoff, el límite superior del intervalo del 95 % se corresponde con el LD (donde lasmuestras verdaderamente positivas producen resultados positivos en el 95 % de las ocasiones), y el límiteinferior del intervalo es el cero (no existe analito presente en la muestra).El conocimiento del límite de detección para un test cualitativo, combinado con el análisis frecuente de uncontrol positivo débil, permite monitorizar en el laboratorio la consistencia de la eficacia del método en lazona próxima a la concentración de cutoff. Es posible experimentar un incremento no observado en el límitede detección de una prueba cualitativa, por ejemplo, debido a cambios en los reactivos. Esto puedeincrementar la proporción de resultados falsamente negativos, debido a que las muestras conconcentraciones detectables de un analito pueden tener resultados que caigan por debajo del cutoff,mientras que muestras con concentraciones altas seguirían en todo caso aportando respuestascorrectamente positivas. Como consecuencia, la determinación experimental del LD es importante paracontrolar la calidad de muchas pruebas cualitativas.

4.5. Procedimientos para determinar y verificar el límite de detección de un métodoLa aproximación clásica para determinar el LD 10 se discute brevemente a continuación. Para unadeterminación dada, en el desarrollo del método se prepara una serie de resultados en muestras de blancoy en muestras de muy bajo nivel de analito. Los resultados para las muestras de blanco se emplean paradeterminar una respuesta que es infrecuente, y por tanto proporciona un umbral donde los valoressuperiores se interpretan como positivos. Este punto y la desviación típica de las medidas de la muestra debajo nivel se emplean para encontrar la concentración en que las medidas excederán muy probablemente elvalor esperado más alto de los blancos. Las curvas de distribución de probabilidad de medidas repetidas deun blanco y una muestra de baja concentración de analito se esquematizan en la figura 2.

Figura 1. Distribuciones de las concentraciones observadas para el blanco y una muestra de bajaconcentración de analito. La línea discontinua correspondiente a concentraciones negativas indica

que algunos instrumentos no proporcionan resultados menores de 0.

10 Currie AL, et al. Nomenclature in evaluation of analytical methods including detection and quantificationcapabilities (IUPAC recommendations). Pure Appl Chem. 1995; 67: 1699-723.

Page 15: Evaluación de Métodos (I)

página 15

4.6. Aproximación general para determinar el límite de blancoLas dispersiones de los resultados de los blancos y las muestras de bajo nivel se deben al error aleatorio dela medida, que a menudo es menor para la muestra del blanco. En la figura 1, la media de las medidas delblanco es cercana a cero con una distribución simétrica. Mientras que este tipo de señal puede producirseinternamente en el instrumento, muchos instrumentos convierten automáticamente los valores negativos delas señales en cero o en un valor pequeño positivo, o bien los suprimen de modo que únicamente seobtengan valores de concentración positivos como respuesta. Se asume que los valores por encima delpercentil 95 de la distribución de valores en muestras verdaderamente sin analito se desviaránsignificativamente de las medidas del blanco. Cuando una muestra proporciona un valor observado quesupera este límite, puede decirse que contiene una cantidad de analito mayor de cero.Empleando este límite, se tiene un 5 % de probabilidad de que dada una muestra verdaderamente sinanalito se obtenga un valor que indique la presencia de analito. Se trata del error de tipo I (error α ).Asimismo, se observa que medidas de una muestra con baja concentración del analito pueden caer pordebajo de este límite, con lo cual serían indistinguibles de las medidas del blanco. Si se concluye que noexiste analito detectable en estos casos, se comete un error de tipo II, asociado al riesgo β , o “error β ”.En función de los costes relativos de ambos errores, cuando se desarrolla un método se establecen loserrores α y β adecuadamente.

En 1997, ISO 11 recomendó una definición del mínimo límite de detección en relación con los nivelesestablecidos para el error de tipo I y II. Por defecto, dichos errores se acotan al 5 % ( )5%α β= = . Un valorde α del 5 % se corresponde con usar el percentil 95 de la distribución de valores del blanco como límitepara declarar un valor medido significativamente por encima del blanco.Dada una distribución gaussiana de valores del blanco (figura 1), este límite se corresponde con:

1,645B BLB µ σ= + [1]

donde: Bµ y Bσ son la media y desviación típica de las medidas del blanco respectivamente.

Para una situación donde no existe posibilidad de obtener valores negativos, o si la distribución de losvalores del blanco no es gaussiana (por ejemplo, cuando siguen una distribución asimétrica), el percentil 95debe estimarse por otra aproximación.El procedimiento más directo es aplicar un método no paramétrico basado en los valores ordenados. Elpercentil que constituye el límite de la distribución de los blancos, Bp , es el que deja un porcentaje α de

valores en la cola superior de la distribución, y se define como límite de blanco, LB , es decir,

100BLB p α−= [2]

4.7. Aproximación general para determinar el límite de detecciónPara establecer el error de tipo II, se debe considerar la concentración mínima presente en la muestra, igualal LD, que proporciona resultados con una probabilidad específica de superar el LB . Si se establece en un5 % el nivel de error de tipo II, el 95 % de las medidas serán mayores que el LB cuando la concentraciónreal sea la del LD . La figura 1 ilustra dos casos de muestras, una con una concentración real igual al LBy otra con una concentración a un nivel tal que el percentil 5 de la distribución de las medidas deconcentración de la muestra es igual al LB . En el primer caso (figura 1a, 50 % de las medidas están pordebajo del LB , y el otro 50 % por encima. Sólo este último 50 % sería declarado como excediendosignificativamente el valor del blanco, es decir, conteniendo una cantidad detectable de analito, y por tanto

50%β = ). En la figura 1b, en cambio, el 95 % de las medidas con muestras que tienen una concentraciónde analito igual al LD exceden al LB y serán declaradas como medidas conteniendo una cantidaddetectable de analito. Por tanto, sólo el 5 % de las medidas serán erróneamente consideradas nosignificativamente diferentes del blanco, y 5%β = , que es el riesgo de error de tipo II (riesgo β ).

El LD es la concentración real de la muestra, la menor concentración real que puede ser detectada confiabilidad. Habitualmente, la distribución de muestras de bajo nivel es gaussiana y el percentil 5 secorresponde con el LB :

11 ISO. Capability of detection – Part 1: Terms and definitions. ISO 11843-1. Geneva: ISO, 1997.

Page 16: Evaluación de Métodos (I)

página 16

1,645s sLB µ σ= − [3]

donde: sµ y Sσ son la media y desviación típica de la población de medidas de bajo nivel.

Globalmente, se tendrá:

1,645S SLD LBµ σ= = +

Si la distribución de valores del blanco es gaussiana, 1,645B BLB µ σ= + , y, por tanto,

1,645 1,645B B SLD µ σ σ= + + [4]

En caso de que la distribución muestral no sea gaussiana (ni se pueda transformar en gaussiana), puedeestimarse el LD no paramétricamente, como se verá; En caso contrario, será necesario producir muestrasde concentración próxima al LD , y chequear cuál es el valor para el que el 5 % o menos de las medidasobservadas están por debajo del LB .

Figura 2 Distribuciones de replicados para las muestras de blanco (curva izquierda en ambasfiguras) y dos muestras hipotéticas positivas de baja concentración (2a y 2b). Cuando la

concentración real de analito presente en la muestra es igual al LB , el 50 % de las medidas seránsuperiores al (a). Con una concentración real en la muestra igual al LD , (100% - β) (95%) de las

medidas de las muestras serán superiores al LB (b).

4.8. Diseño del estudioEl diseño propuesto por el CLSI7 asume un sistema único del laboratorio operando en condiciones estables(sin cambios de lote de reactivos ni modificaciones importantes en las calibraciones). Sin embargo, lasrecomendaciones incluyen consideraciones de variabilidad debidas al tiempo (o run) y diferencias entresujetos.Los fabricantes deben considerar determinar el LD en dos o más instrumentos con dos o más lotes dereactivos para incluir la variabilidad debida a la combinación de diferentes instrumentos/reactivos. Si losresultados de los diferentes sistemas son sustancialmente distintos, será necesario estudiar las razones dedichas discrepancias. En caso contrario, se asume como LD la estimación mayor que se haya obtenido.Esta sugerencia se debe contextualizar con consideraciones prácticas y con el coste del estudio. Encualquier diseño que se elija, los resultados deben ir acompañados de una descripción completa del estudioy de los parámetros que fueron investigados.

4.9. Número de muestrasEn la determinación del número óptimo de muestras para establecer o verificar un LD , el objetivo escalcular el número necesario de determinaciones y muestras, tanto de blanco como de muestras de bajonivel, de modo que se utilicen eficazmente los recursos. Se sobreentiende que a mayor número demuestras y de determinaciones las estimaciones obtenidas tendrán menor incertidumbre, de modo que elnúmero total de medidas empleado estará limitado principalmente por cuestiones de disponibilidad de lasmuestras adecuadas o por racionalización de recursos económicos. Desde el punto de vista estadístico, sebuscará una solución de compromiso entre el número de medidas de blancos y de muestras y la

Page 17: Evaluación de Métodos (I)

página 17

incertidumbre de la estimación del LB y la variabilidad entre las medidas en las muestras de bajo nivel (sehablará en términos de Ss ).

La estimación no paramétrica del LB es aproximadamente la mitad de eficaz que el procedimientoparamétrico. Esto significa que se espera obtener el mismo resultado mediante procedimientosparamétricos y no paramétricos, pero empleando el mismo número de muestras la estimación paramétricatiene menor incertidumbre (si los datos son gaussianos). Las incertidumbres del percentil o la estimación dela desviación típica también serán proporcionales a la dispersión de las distribuciones. Por tanto, con unaestimación no paramétrica del LB y la estimación paramétrica del LD , el número de medidas de blancodebería ser mayor que el de muestras de baja concentración.Sin embargo, es más frecuente que la dispersión de las medidas de la muestra de bajo nivel sea superiorque la de las medidas del blanco. En conjunto, en la mayoría de los casos puede ser aceptable procesar elmismo número de muestras de bajo nivel que de blancos.Cuando el número de medidas de blanco es el mismo que el de medidas de bajo nivel, la incertidumbre delLD decrece con el inverso de la raíz cuadrada del número de medidas (ajustada por el número demuestras diferentes incluidas en el estudio). La relación entre el tamaño muestral y la incertidumbre del LDfue descrita por Linnet y Kondratovich.12.Una solución de compromiso razonable entre precisión y coste es un mínimo de 60 medidas (tanto deblanco como de muestras de bajo nivel) para establecer el LD , generalmente cuando se desarrolla unmétodo. Para verificar un LD estipulado por el fabricante, se empleará un mínimo de 20 resultados de laconcentración esperada y, si es necesario, también de la concentración del LB . Esta será la evaluaciónhabitual realizada por el usuario.

4.10. Características de blancos y muestras de bajo nivelCuando sea posible, blancos y muestras positivas de bajo nivel deben ser intercambiables por muestrasnaturales, como será por ejemplo el caso, para un a determinación de un fármaco, de procesar suero oplasma sin el compuesto en lugar de únicamente una solución de tampón. Dado que las muestrasartificiales y preparadas por adición del compuesto pueden tener distinto comportamiento que las muestrasobtenidas de un paciente, habrá que tener en cuenta consideraciones respecto a interferencias y efectos dematriz.Para asegurar que las medidas son representativas, es preferible recopilarlas de un número dado demuestras diferentes que de una misma muestra. Dadas las diferencias de matriz existentes de muestras amuestra, incluso en medidas repetidas de una misma muestra, se prefiere una serie de cinco o másmuestras. Estas medidas deberían realizarse a lo largo de varios días de modo que reflejen la realidad delmétodo en las condiciones habituales del laboratorio, incluyendo (cuando sea apropiado) diferente personaly equipo. Para verificar un valor dado, el periodo necesario no incluirá cambios de lote de reactivos omantenimientos importantes del equipo. Para establecerlo, en cambio, es necesario incluir cambios de lotede reactivos.

Consideraciones para muestras de blanco

Para compuestos endógenos, el blanco debería ser muestras a las que se haya eliminado el componente,por ejemplo por precipitación con un anticuerpo, por degradación enzimática o por absorción con carbónactivado, etc. Para hormonas, las muestras de blanco pueden provenir de sujetos enfermos o pacientes conniveles suprimidos debido a tratamiento farmacológico. Para marcadores tumorales, son válidas muestrasde sujetos no enfermos. Si no es posible evitar un nivel residual de analito, debería ser de un orden demagnitud inferior al límite del intervalo analítico del método.

Consideraciones para muestras positivas de bajo nivel

Para muestras de bajo nivel de compuestos endógenos, se prefiere emplear una serie de muestras desujetos con concentraciones bajas. Si es necesario adicionar a una muestra el analito (por ejemplo, para unfármaco), es mejor hacerlo sobre muestras de diferentes sujetos antes que del mismo paciente o a un pool.La Ss conjunta se estimará a partir de medidas repetidas con la serie de muestras, por ejemplo, 12

12 Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. ClinChem. 2004; 50: 732-40.

Page 18: Evaluación de Métodos (I)

página 18

medidas de cada una de cinco muestras. Las medidas deberían realizarse en días diferentes de modo quela Ss refleje la variación analítica total.

Para que las estimaciones del LD y el LB tengan significado, los valores medidos deberían ser trazableshasta un nivel conocido. Si existe método de referencia para el analito de interés, deberían compararse lasmedidas obtenidas por ambos métodos en concentraciones cercanas al mímite inferior del intervaloanalítico. La trazabilidad también puede comprobarse con medidas sobre muestras suplementadas.

4.11. ResultadosLas medidas pueden realizarse de una característica o propiedad como la concentración o la actividadsiempre que la cantidad medida (el mensurando) esté claramente definida. Cuando el mensurando difieredel analito de interés (por ejemplo, una actividad enzimática no es lo mismo que la concentración en masadel enzima), la cantidad debe estar bien definida. Esto es esencial para entender las diferencias en LDpara diferentes métodos o bajo diferentes condiciones de medida.

4.12. Procedimiento para determinar y verificar el límite de blanco y el límite de detecciónLos procedimientos para establecer las características y verificar las especificaciones de un método difierenen complejidad y en el número de medidas necesarias. El procedimiento para hacerlo se basa en el mismomodelo y las mismas tolerancias para los errores de tipo I y II.

4.13. Procedimiento para determinar o establecer el límite de blanco

Se recomienda que se procesen un mínimo de 60 medidas de blanco. El LB se estima para BN medidasrepetidas de una o varias muestras de blanco. El uso de varias muestras puede ayudar a asegurar que unamuestra con cierta cantidad detectable de analito no sea tomada como un blanco. Si los datos parecenseguir una distribución de Gauss, se deberá emplear la ecuación [1] para estimar el LB . Si los datos nosiguen una distribución normal (así como si están truncados en el cero) se empleará la ecuación [2] y elsiguiente procedimiento.

Dados los datos ordenados, se calcula el percentil apropiado ( )p (en función del valor deseado para α . En

este caso, ( )100 95p α= − = :

( ) ( )

0,5100

0,95 0,5 Pr 1

B

B

pLB resultado en la posición N

resultado en la posición N α

= +

= + = −

[5]

Si no es un valor entero se realizará una interpolación lineal. En la práctica suele calcularse el percentil deorden 100 α− mediante cualquier software apropiado.

4.14. Procedimiento para determinar el límite de detección

Para determinar el LD , se estima la desviación típica de las medidas de la muestra ( )Ss a partir de SNmedidas repetidas de muestra(s) con una concentración baja detectable, por ejemplo, una concentración enaproximadamente de cuatro veces el LB . Se recomienda un mínimo de 60 resultados obtenidos a partir demuestras de baja concentración. El procedimiento preferido es tomar varias muestras de bajo nivel (decuatro a seis) y calcular una estimación conjunta de la precisión a esos niveles. Antes de juntar lasestimaciones individuales de la precisión, debería comprobarse la consistencia de las mismas mediante untest F convencional (dos muestras) o un test de Cochran, en caso de que se trate de más de dosmuestras. Si el test falla, es preciso investigar una posible causa técnica. Puede ser indicativo deinestabilidad de la reacción o de que alguna de las muestras esté afectada de una variabilidad superior a laesperada. Se obtiene de este modo una estimación preliminar, pLD según:

p SLD LB c sβ= + [6]

donde: Ss es la desviación típica estimada de la distribución de las muestras de bajo nivel; y

Page 19: Evaluación de Métodos (I)

página 19

c β se deriva del percentil 95 de la distribución de Gauss, como factor de corrección aplicado

debido a que la Ss es una estimación sesgada de la desviación típica poblacional Sσ .

Si el número de medidas SN no es demasiado pequeño,

1,645114

c

g

β =−

donde: g son los grados de libertad de la desviación típica estimada Ss .

Por ejemplo, si se han obtenido 60 resultados ( )60SN = a partir de cinco muestras de concentración baja

( )5k = , para la desviación típica conjunta estimada Ss ,

55

1,645 1,65311220

Sg N k

c β

= − =

= =−

No es necesario ni deseable obtener todas las medidas en la misma muestra de baja concentración. Elmotivo es que el empleo de varias muestras permite tener en cuenta la variabilidad entre sujetos.

Consideraciones acerca de la desviación típica

Es importante considerar si la ss obtenida al nivel medido puede ser la misma que al nivel del pLD . En la

estimación del LD , un problema común es que la desviación típica muestral no sea constante, puesfrecuentemente aumenta con la concentración. Sin embargo, en un intervalo limitado de concentraciones,podría ser aproximadamente constante y el procedimiento anterior es adecuado. Si se puede asumir una ssconstante, entonces pLD LD= .

En caso contrario, se debe considerar una aproximación más complicada, asumiendo que la desviacióntípica muestral es función de la concentración13,14.

4.15. Consideraciones sobre la forma de la distribuciónSi los datos de la concentración baja no son gaussianos, cabe la posibilidad de transformar los datos paraobtener una distribución normal, por ejemplo mediante una transformación logarítmica. En este caso, el LDse calcula en las unidades transformadas, y posteriormente convertirlo a las unidades originales mediante latransformación inversa (por ejemplo, exponencial).

Si no es posible obtener una distribución normal, pero la Ss es razonablemente constante, se puede

emplear una estimación no paramétrica de la dispersión, calculada como la distancia entre el percentil β dela distribución de medidas y el valor asignado (o valor aceptado como referencia) para la muestra de bajonivel. Esta distancia, que se denominará ,SD β , es análoga al término Sc sβ de la ecuación [6], por lo que:

,SLD LB D β= +

Si la Ss no es constante, y no es posible obtener datos normales, deberá emplearse un procedimiento de

“prueba y error” no paramétrico Se prepararán muestras a niveles similares al LD esperado y se obtendráuna serie de medidas (en distintos tiempos y con diferentes operadores). Se calcularán los percentiles β ,

13 ISO. Capability of detection. Part 1. Terms and definitions. ISO 11843-1. Geneva:ISO, 1997.14 ISO. Capability of detection. Part 2. Methodology in the linear calibration case. ISO 11843-2. Geneva:ISO,2000.

Page 20: Evaluación de Métodos (I)

página 20

como porcentaje de observaciones por debajo de LB . El LD es el menor nivel para el cual dicho percentilβ sea del 5 % o menor.

4.16. Procedimiento para verificar un límite de detecciónEn un laboratorio se puede plantear asegurar que un procedimiento cumpla las especificaciones de LDque establece el fabricante, en lugar de establecer su propio LD . Si se dispone de él, el laboratorio deberíausar el LB proporcionado por el fabricante, pero debe verificarlo con al menos 20 replicados de un blanco.Se puede asumir el LB considerado por el fabricante si no se observan más de tres replicados superioresal LB .Si no se conoce el LB , se debe estimar como se ha descrito anteriormente y posteriormente procesarmuestras repetidas de la concentración del LD para así estimar la proporción de resultados que excedenel LB . Se recomienda un mínimo de 20 medidas de dichas muestras, si es posible en diferentes muestrasy varios días. Si la proporción de observaciones que superan el LB está de acuerdo a lo esperado (1 β− ,por defecto 95 %), es decir, si el “95 %” está incluido en el intervalo de confianza del 95 % para laproporción registrada, puede decirse que los datos apoyan el LD del fabricante. Puede ocurrir que seobtenga más de una medida de 20 por debajo del LB y aún así se cumpla este criterio. En la tabla 2 sepresenta, para tamaños muestrales entre 20 y 1000, los límites inferiores de la proporción registrada queestán de acuerdo con la proporción esperada del 95 %.Si la proporción obtenida no está de acuerdo con el 95 % esperado, entonces no habrá sido posible verificarel LD del fabricante. El usuario debería considerar contactar con éste, o establecer un LD por su cuenta,como es ha descrito anteriormente.

n límite inferior proporción observada (%)20 8530 8740 8850 8860 8870 8980 8990 90

100 90150 91200 92250 92300 92400 93500 931000 94

Tabla 2. Límites inferiores del 95 % de confianza para los resultados observados que excedan el LBcon una proporción esperada de 1-β = 95 % (modificado de Linnet & Kondratovich)15

Ejemplo de verificación de un LDUn procedimiento analítico para medir una hormona un LD de 45 UI/L según el fabricante con

5%α β= = . El usuario determina 25 medidas de blanco (5 medidas de 5 muestras de blanco durante 5días) y 25 medidas en muestras a las que se ha añadido 45 U/L del analito (5 medidas de 5 muestras en 5días). Los resultados se presentan en la tabla 3 y la figura 2. La inspección visual revela que la distribución 15 Linnet K, Kondratovich M. A partly nonparametric procedure for determination of the limit of detection. ClinChem. 2004; 50: 732-40.

Page 21: Evaluación de Métodos (I)

página 21

de valores del blanco es asimétrica y, por lo tanto, se estima el LB no paramétricamente. El percentil 95 es20,28.

orden blancos muestras1 0 18,82 0 19,023 0 26,634 0 26,915 0 31,086 0 33,997 0 35,118 0 35,99 0 36,1210 1,08 41,6711 1,92 43,912 2,38 46,3213 2,98 47,7714 3,8 47,9915 4,78 48,8316 7,3 54,6717 8,81 57,318 10,31 59,119 11,29 61,1720 13,48 61,9621 14,39 62,9722 16,97 66,4423 17,4 73,4424 21 73,825 24 75,71

Tabla 3. Valores de ejemplo para una verificación del LD

Figura 3. Ejemplo de verificación del LD distribuciones de las 25 medidas del blanco y de las 25 demuestras suplementadas con analito de modo que la concentración sea igual al LD supuesto de 45

U/L. Se estimó el LB en 20,28 UI/L (p95 de la distribución de los blancos).

El 92 % de las medidas de las muestras, 2325 , superaron el LB .

Page 22: Evaluación de Métodos (I)

página 22

En la tabla 3 se observa que el 92 % es mayor que el límite inferior (85 %) para una confianza del 95 %siendo el tamaño muestral de 25. Por tanto, la proporción observada no es contradictoria con el LDesperado.

5. Límite de cuantificación

El Límite de cuantificación ( )LQ es la menor cantidad de analito que puede ser detectado con fiabilidad (el

LD ), y al cual el error total cumple los requisitos del laboratorio para aportar un aceptable uso clínico.Dependiendo del objetivo definido para el error, el LQ puede ser igual la LD o mucho mayor. Nuncapuede ser inferior. El LQ debería determinarse como parte del desarrollo del método y puede serdocumentado por el fabricante. El usuario puede establecer su propio LQ o verificar el del fabricante. Noes necesario determinar el LQ para cada método si puede determinarse la incertidumbre (o error total) dela medida para los niveles bajos. En estos casos, puede ser aceptable informar la incertidumbre estimadadel resultado de cada resultado de nivel bajo y permitir al usuario interpretar si es adecuado para su uso.

5.1. Establecimiento del límite de cuantificaciónLos resultados del estudio del LD deberían usarse para estimar el sesgo y la imprecisión para cada nivelde analito. Para este protocolo, se recomienda un mínimo de 40 replicados, entre tres y cinco muestrasdiferentes, determinadas en al menos cinco series. La diferencia entre la media de los replicados (si seemplea una muestra) y el valor de referencia aceptado es una estimación del sesgo. Si se emplea más deuna muestra para cada nivel, el promedio de las diferencias es una estimación de la veracidad. Ladesviación típica total de los 40 resultados (una muestra) o la estimación conjunta de la Ss es unaestimación de la precisión. La combinación de estos para estimar el error total a cada nivel, se realizaempleando: 2 Ssesgo s error total+ = (si el sesgo es negativo, usar 2 Ssesgo s error total− = ). Si

la estimación es inferior al objetivo definido para el error total, puede asumirse que: LQ LD= .

Este procedimiento asegura que, para muestras con un valor verdadero igual al LQ, hay aproximadamenteun 95 % de probabilidad de que el resultado del test sea suficientemente exacto. Si se requiere mayorprobabilidad, la Ss debería multiplicarse por un factor mayor; por ejemplo, si 4 Ssesgo s+ y 4 Ssesgo s−están dentro de los valores esperados (y el error es gaussiano), más del 99,5 % de los resultados seajustarán al uso deseado.Si no se cumple el objetivo a este nivel, deberán chequearse niveles ligeramente más altos. Debenobtenerse materiales de referencia adecuados, similares a los materiales empleados para determinar elLD . La concentración real debe ser conocida por un método independiente, bien mediante un método dereferencia, por suplementación, o, cuando sea adecuado, por dilución. Si los materiales con comerciales, laincertidumbre del factor de dilución y/o proceso de suplementado debe incluirse con la estimación de laincertidumbre o del error total derivado del estudio.Si se obtiene un LQ superior al menor nivel asumido en el intervalo de medida (o intervalo comunicable), elintervalo de medida puede no ser adecuado para el uso deseado en el laboratorio. Si los límites inferioresdel 95 % de confianza para la estimación del sesgo y la imprecisión son mayores de lo descrito para elmétodo, deberá investigarse una causa técnica.

5.2. Verificación de un límite de cuantificaciónSi se desea confirmar un LQ o si el error no puede asumirse como gaussiano, se puede usar unprocedimiento alternativo para chequear el LQ descrito. Esto requiere el seguimiento de todas las

consideraciones anteriores, a excepción del cálculo de Ss y la estimación del error total, y es aceptable unmínimo de 25 replicados. En este caso, los replicados en cada muestra se comparan con el valor dereferencia para la muestra y el objetivo de error total. El número de resultados que excederán el error totales una medida de lo adecuado del método a ese nivel. Se puede utilizar la tabla 3 para determinar elnúmero de resultados “inaceptables” que podrían ser observados, si se emplea un criterio del 95%. Porejemplo, si hay un total de 30 replicados (sobre un número de muestras), en la tabla 3 se puede ver que almenos 87 % de los resultados (26,1, redondeados a 27) deben estar entro del objetivo de error. Por tanto, si

Page 23: Evaluación de Métodos (I)

página 23

se obtienen hasta tres resultados con error excesivo, el LQ puede considerarse verificado. Si existe dudaacerca de este resultado (en el ejemplo, permitiendo al 10 % de las muestras tener un error excesivo),deben obtenerse más replicados.Si no se cumple este criterio, el LQ descrito por el fabricante quedará en entredicho.

5.3. Informe de resultados

5.3.1. Informe de intervalos para resultados cuantitativos

Habiendo establecido varios límites de acuerdo con este protocolo, el fabricante de un método puede quererinformar LB , LD y LQ en el folleto incluido en los reactivos o descripción del método. Si el fabricante delmétodo decide informar de estos límites, deben ir acompañados de las probabilidades α y β , objetivospara los niveles establecidos de precisión y veracidad, así como otras características del diseño.El informe va a depender de dónde se sitúan los resultados observados respecto a los límites y de losprocedimientos del laboratorio. Si un laboratorio quiere aportar el máximo de información, incluyendo la“zona gris” de incertidumbre de la cuantificación, sería adecuado el siguiente planteamiento:• Si resultado LB≤ se informa como “no detectado; concentración LD< ”;

• Si LB resultado LD< < se informa como “analito detectado; concentración < LQ;”

• Si LD resultado LQ≤ < (a) se informa como “analito detectado; concentración < LQ ”; o bien

(b) se informa el resultado advirtiendo de que posiblemente esté sujeto amayor incertidumbre;

• Si resultado LQ> se informa.

Si un laboratorio elige informar sólo resultados cuantitativos y simplificar el informe de las concentracionesinferiores al LQ , puede ser adecuado el siguiente procedimiento:

• Si resultado LB≤ se informa como “concentración < LD ” o “no detectado”;

• Si LB resultado LQ≤ < se informa como “concentración < LQ ” o “detectado”

• Si resultado LQ≥ se informa el resultado medido

Figura 4.

5.3.2. Precauciones en la interpretación de resultados cuantitativos

Los valores medidos menores que el LQ pero superiores al LB pueden servir para demostrar la presenciadel analito, pero los niveles reales medidos no deberían emplearse para ninguna interpretación clínica. Losresultados que se sitúen entre el LD y el LQ no deberían informarse sin alertar de la posible mayorincertidumbre de esos valores.El LD y el LQ pueden coincidir o diferir en cierta cantidad, dependiendo de la incertidumbre del LD y delos objetivos del laboratorio. Si hay diferencia entre ambos valores, no se puede asumir que la respuestamedida entre el LD y el LQ sea lineal, ni siquiera que siga una función monótona creciente. Aunque estamonotonía sea cierta en la mayoría de los casos, pueden darse situaciones en que no exista relación a esos

Page 24: Evaluación de Métodos (I)

página 24

niveles, debido a discontinuidades, valores nulos, etc. Si no existe una documentación clara acerca de larelación monótona, no deben hacerse interpretaciones acerca de concentraciones en este intervalo deconcentraciones.En la práctica rutinaria, el LD y el LQ deberían emplearse como se ha descrito anteriormente para decidircómo informar los resultados. Existen otras situaciones, como es el caso de que se use el promedio devarias réplicas como resultado para un sujeto, o en estudios científicos, en que deben registrarse lasconcentraciones medidas (si se dispone de ellos), independientemente de que estén por debajo o porencima del LD , porque en estas situaciones si se emplean resultados truncados, cualquier promedioestaría sesgado.

6. Linealidad

La demostración del intervalo lineal requiere una serie de concentraciones conocidas o relacionesconocidas establecidas por dilución. En todas las situaciones la secuencia de análisis debe ser aleatoria. Elexperimento del intervalo lineal requiere contar con suficiente cantidad de cada espécimen para preparardiluciones y llevar a cabo el análisis de cada uno de cinco o más concentraciones. El volumen puede variarsegún lo que se desee establecer:• Para demostrar que la operación del sistema está dentro de las especificaciones del fabricante deben

emplearse de cinco a siete concentraciones elegidas a lo largo de todo el intervalo lineal establecido.Deben chequearse dos replicados de cada nivel.

• En el desarrollo de métodos nuevos, si se desea establecer el intervalo lineal, o cuando se quieremodificar un método ya existente, deberían emplearse entre siete y once concentraciones a lo largo delintervalo de medida que se espera de antemano. En el desarrollo de métodos se puede emplear máspuntos y ampliar dicho intervalo hasta hacerlo un 20 – 30 % más amplio, con la intención de eliminaralgunos de los puntos y obtener el intervalo lineal más amplio posible. Deben usarse de dos a cuatroreplicados de cada nivel, dependiendo de la imprecisión esperada.

• El número mínimo de puntos para describir de una manera fiable un intervalo lineal es cinco, medianteun método polinómico. Con mayor número de puntos, se obtendrá una descripción más exacta de lalinealidad se podrá también establecer un intervalo lineal más amplio, una vez se hayan eliminado lospuntos necesarios.

Se recomienda preparar adecuadamente niveles de concentración intermedia igualmente espaciadosmezclando proporcionalmente un pool alto y uno bajo, aunque el método que se propone en el documentoCLSI EP6 no lo requiere necesariamente.9 Se acepta el empleo de muestras especialmente preparadaspara obtener concentraciones específicas, dado que se conocerán las concentraciones relativas a cada unade las demás. Para esta evaluación, se cometerá menos error si se emplean mezclas preparadas,dispensando con exactitud adecuada, a partir de un pool alto y otro bajo, que si se emplean muestrasindividuales o soluciones reconstituidas o preparadas en el laboratorio. Debe tenerse especial precaucióncuando se dispensen volúmenes pequeños. Las pipetas de desplazamiento positivos son útiles parapreparar diluciones exactas con pequeños volúmenes.

S = 5 muestras S = 6 muestras S = 7 muestras S = 8 muestras S = 9 muestras1: bajo (L) 1: bajo (L) 1: bajo (L) 1: bajo (L) 1: bajo (L)2: 0,75 L + 0,25 H 2: 0,80 L + 0,20 H 2: 0,833 L + 0,167 H 2: 0,857 L + 0,143 H 2: 0,875 L + 0,125 H3: 0,50 L + 0,50 H 3: 0,60 L + 0,40 H 3: 0,667 L + 0,333 H 3: 0,714 L + 0,286 H 3: 0,750 L + 0,250 H4: 0,25 L + 0,75 H 4: 0,40 L + 0,60 H 4: 0,500 L + 0,500 H 4: 0,571 L + 0,429 H 4: 0,625 L + 0,375 H5: Alto (H) 5: 0,20 L + 0,80 H 5: 0,333 L + 0,667 H 5: 0,429 L + 0,571 H 5: 0,500 L + 0,500 H

6: Alto (H) 6: 0,167 L + 0,833 H 6: 0,286 L + 0,714 H 6: 0,375 L + 0,625 H7: Alto (H) 7: 0,143 L + 0,857 H 7: 0,250 L + 0,750 H

8: Alto (H) 8: 0,125 L + 0,875 H9: Alto (H)

Tabla 4. Esquemas de dilución para preparar muestras de cinco a once concentracionesigualmente espaciadas

Page 25: Evaluación de Métodos (I)

página 25

Se pueden emplear productos comerciales para diagnóstico in vitro, siempre que se sigan las instruccionesdel fabricante. Estos productos permiten verificar cuantitativamente una calibración, validar intervalos demedida, y determinar la linealidad de sistemas químicos automáticos, semiautomáticos y manuales.A continuación, se presenta una lista de posibles tipos de especímenes en orden de preferencia para laaplicación que nos atañe. Debe extremarse la precaución en lo que respecta a emplear una matrizapropiada para un método particular.

6.1. Pool de muestras de pacientesLa matriz de muestra ideal es un pool de especímenes de pacientes con una concentración de analitocercana al límite superior del intervalo dinámico esperado, que será diluido con otro pool de muestras depacientes de la menor concentración esperada o deseada. La concentración final de los pooles querealmente se analicen representará el intervalo estudiado. Por lo tanto, los pooles alto y bajo finales puedenrequerir ajuste para llevarlos al intervalo deseado.

6.2. Pool de muestras de pacientes diluido con un diluyente recomendadoEl fluido empleado para diluir una concentración del pool de muestras de pacientes de concentración altapuede afectar a los resultados obtenidos.Sólo el diluyente recomendado por el fabricante, o que se haya comprobado como aceptable en ellaboratorio, deberá emplearse para las diluciones. Para aquellos sistemas analíticos que permitan la diluciónde la muestra del paciente cuando las concentraciones del analito estén por encima del intervalo dinámico,empleando el diluyente apropiado para demostrar la linealidad a lo largo del intervalo de medida, existe laventaja de que se dispondrá de un diluyente recomendado y chequeado para dicho fin.

6.3. Pool de muestras de pacientes suplementado con el analito de interésEl material de suplemento que contenga el analito de interés no necesita ser de alta pureza si no existensustancias interferentes. En caso contrario, debe registrarse en el estudio la fuente, pureza, efectoesperado... Si se emplea una disolución concentrada del analito para suplementar el pool, se debe diluir elpool lo menos posible (en principio, menos del 10 %), y documentar el disolvente.

6.4. Pool diluido con materiales tratados de baja concentración o con otro pool tratadoSi es posible, se empleará para las diluciones un pool de pacientes de baja concentración.Alternativamente, pueden emplearse ciertos tratamientos para reducir la concentración de analito, (comodiálisis, tratamiento por calor o cromatografía). Debe tenerse en cuenta que estos tratamientos puedenalterar el analito y/o la matriz física o químicamente. Es más importante mantener constante la matriz quealcanzar bajos niveles por simple dilución.

6.5. Controles / calibradores / materiales para estudio de linealidad comercialesSi se emplean estos materiales, deben analizarse como si se tratara de muestras de pacientes. Si no sesuministran mezclas de las concentraciones apropiadas, se empleará la muestra más alta y más baja parapreparar concentraciones intermedias. Conviene asegurar que el analito esté en la forma fisiológicamentenormal (por ejemplo, enlazado a proteína o como metabolito, si es el caso).

6.6. Pool diluido con suero salino u otros diluyentes diferentes del recomendadoCuando se empleen estas muestras debe considerarse posibles efectos de matriz que puedan afectar a losresultados. Las diluciones deben ser las mínimas necesarias y han de documentarse.

6.7. Material de control comercial diluido con diferente volumen del establecidoCuando se empleen estas muestras deben considerarse posibles efectos de matriz que puedan afectar alos resultados: estos efectos pueden modificar la concentración. Las diluciones deben ser las mínimasnecesarias y han de documentarse. Debe extremarse la precaución para asegurar que se consigue unacompleta disolución del material liofilizado.

Page 26: Evaluación de Métodos (I)

página 26

6.8. Soluciones acuosasCuando se emplean disoluciones acuosas, no se chequean los efectos de la matriz de las muestras realesen la respuesta del método. Dichos efectos de matriz pueden influir en la interpretación de los resultados.Aunque son preferibles materiales de alta pureza porque minimizan las posibles interferencias quepotencialmente afecten a los resultados, pueden ser aceptables materiales menos puros.Muchos métodos químicos en clínica se calibran con materiales acuosos, y la concentración suministradapor pesada puede ser aceptada como valor diana.

6.9. Disoluciones en otros disolventesLos efectos de matriz pueden ser más probables aún si se emplean disolventes orgánicos.La secuencia analítica debería ser aleatoria. Si existe arrastre o deriva significativos los resultados delexperimento no son aceptables.

6.10. Intervalo analíticoLos niveles de concentración extremos elegidos para la medida deben incluir o ser iguales a los valoresmínimo y máximo especificados en las características del método. Cuando se establece el intervalo lineal,se emplean entre siete y once niveles seleccionados en un intervalo de concentraciones dentro de un rangoque será entre un 20 y un 30 % más amplio que el intervalo de medida esperado, con la intención deeliminar puntos de no–linealidad y establecer el intervalo más amplio posible de respuesta lineal aceptable.El empleo de un número mayor de niveles puede ayudar a justificar el uso de la interpolación para definir lascaracterísticas del intervalo dinámico de medida.Si no se conoce la concentración de los pooles alto y/o bajo, debe codificarse cada uno de ellos. Lacodificación es el proceso de asignar a cada pool un número que aluda a su concentración relativa. Paraconcentraciones igualmente espaciadas, la codificación permite asignar números enteros a cada poolconsecutivo. En otras palabras, las concentraciones del pool no necesitan ser conocidas de antemano. Paraverificar los límites, puede emplearse la media de los resultados de los pooles alto y bajo. Se puedepreparar una concentración intermedia a partir de los pooles alto y bajo así como sucesivas concentracionesintermedias a partir de ésta y los pooles alto y bajo.En el ejemplo siguiente, se emplea un protocolo por dilución, aunque en algunos laboratorios puede serpreferible un diseño gravimétrico. Independientemente del procedimiento por el cual se preparen lasdisoluciones, éstas deben realizarse con extremo cuidado(1) Se obtienen dos pooles (de concentraciones alta y baja respectivamente), en una matriz aceptable y

con suficiente volumen para todo el experimento. El volumen requerido de cada pool dependerá delvolumen del procedimiento. Aseguraremos que el sistema de dispensación es el más exacto y precisoposible. La siguiente aproximación se basa en cinco concentraciones igualmente espaciadas.

(2) El pool de concentración baja (idealmente cerca y dentro del límite bajo) se codifica como Pool 1; el poolde la concentración más alta chequeada se codifica como Pool 5.

(3) Los pooles de concentración intermedia se preparan por dilución y se establecerá la relación entre ellosy con los pooles alto y bajo mediante intervalos constantes. Un método conveniente para preparar lospooles intermedios es el siguiente:• Pool 2: 3 partes de pool 1 y 1 parte de pool 5.• Pool 3: 2 partes de pool 1 y 2 partes de pool 5.• Pool 4: 1 parte de pool 1 y 3 partes de pool 5.La concentración de cada pool se define por la siguiente fórmula

1 1 5 5

1 5

C V C Vconcentración

V V+

=+

donde: 1C es la concentración de Pool 1;

5C es a concentración de Pool 5;

1V es el volumen del Pool 1;

5V es el volumen de Pool 5.

Page 27: Evaluación de Métodos (I)

página 27

Debe tomarse la precaución de mezclarlos perfectamente y protegerlos de la posible evaporación ydeterioro.Por ejemplo, para un sistema analítico que requiera 0,05 mL por determinación, y se chequeen 10 muestraspor concentración, se necesitarán al menos 0,5 mL adicionales de volumen muerto. Supongamos que laconcentración del pool 1sea de 120 unidades y la del de concentración baja de 40 unidades (no es precisoconocer la concentración antes de analizarlo).(1) Especímenes para Pooles 1 y 5: alícuotas de 0,6 mL se dispensan en tubos apropiadamente rotulados.(2) Pool 2: se añaden 0,6 mL de Pool 1 a 0,2 mL de Pool 5. (3) Pool 3: Se mezclan 0,4 mL de Pool 1 y 0,4 mL de Pool 5.(4) Finalmente, el Pool 4 se hace mezclando 0,2 mL de Pool 1 y 0,6 mL de Pool 5. La concentración de

Pool 4 se calcula según:40 0,200 120 0,600 100

0,200 0,600Pool 4 unidades× + ×

= =+

Las concentraciones esperadas de los pooles son 40, 60, 80, 100, y 120 unidades.La representación de los resultados analíticos puede emplear concentraciones conocidas o calculadas.• Para establecer el intervalo lineal: 9 a 11 niveles, y 2 a 4 replicados de cada nivel.• Para validar las especificaciones de un método: 7 a 9 puntos, y 2 o 3 replicados de cada nivel.• Para confirmar que el intervalo lineal es válido en un laboratorio: 5 a 7 niveles, y 2 replicados de cada

nivel.Las muestras deberían analizarse aleatoriamente durante la misma serie o series analíticas próximas.El número de réplicas deberá ser suficiente para proporcionar una estimación fiable de la concentración acada nivel. Para algunos analitos, en algunas concentraciones, se puede requerir 3–5 réplicas. Los usuariosdeben juzgar acerca del número de réplicas necesarias. Este procedimiento no se ve afectadonegativamente por el empleo de diferente número de replicados a diferentes niveles.En este capítulo, se hablará de outliers en el sentido de aquellos resultados aislados que sean visual oestadísticamente diferentes del resto de los resultados, y se aplica sólo a valores individuales de losreplicados. No son múltiples replicados del mismo nivel o un valor promedio a un nivel; Estos tipos deresultados desviados serían indicativos de falta de linealidad o de error sistemático. Los outliers sonresultados que proceden de errores probados o razonablemente asumidos. En este contexto, los outliersson resultados que no se ajustan al patrón representado por el resto de los datos. La inspección visual de lagráfica de los resultados frente a los valores esperados suele ser suficiente para detectarlos. Un únicooutlier en una serie de datos puede ser eliminado y no necesita ser reemplazado. Si subjetivamente seobserva más de un punto candidato a ser eliminado, el sistema de medida probablemente sea impreciso, ylas causas de la misma deberían ser examinadas y a ser posible solucionadas antes de tratar de establecero verificar la linealidad del método.

6.11. Determinación del intervalo linealLa evaluación polinómica de la linealidad asume, a priori, que los datos no son lineales. Esta aproximaciónasume que los resultados se ajustan perfectamente a una curva en ausencia de error aleatorio. Si la curvade mejor ajuste es lineal o no afecta a la capacidad de interpolar entre los datos experimentales.Esencialmente, el método polinómico evalúa la no–linealidad: por este motivo se emplean polinomios.El método consta de dos partes. La primera parte examina si un polinomio no–lineal ajusta los datos mejorque una línea recta. La segunda parte, realizada en aquellos casos en que el ajuste polinómico no–lineal esmejor que el lineal, establece si la diferencia entre el polinomio no–lineal que mejor se ajusta y el lineal esmenor que la cantidad de sesgo aceptable para el método, que debería estar predefinido.

6.12. Regresión polinómicaLa evaluación de la linealidad requiere al menos cinco disoluciones de diferentes concentracionesanalizadas al menos por duplicado.Se debe conocer tanto la concentración de analito como la relación entre las disoluciones, que puedeconsistir en intervalos equidistantes o intervalos de distinta longitud. Por ejemplo, en un intervalo de 0,20 a1,00 g/L, las soluciones equidistantes deberían tener concentraciones de 0,40, 0,60, y 0,80 g/L. Se puederepresentar 0,20, 0,40, 0,60, 0,80 y 1,00 g/L para los valores en el eje de las abscisas, o 1, 2, 3, 4 y 5.

Page 28: Evaluación de Métodos (I)

página 28

A continuación, se realiza un análisis de regresión polinómica para polinomios de primero, segundo y tercerorden. Esto puede llevarse a cabo en la mayoría de los programas estadísticos comerciales.

6.13. Orden de la regresión polinómica

orden polinomiogrados de libertad de la regresión

(g. de l. reg)primero 0 1y b b x= + 2

segundo 20 1 2y b b x b x= + + 3

tercero 2 30 1 2 3y b b x b x b x= + + + 4

El modelo de primer orden es una línea recta. Esta será la ecuación de mejor ajuste lineal tanto si el métodoes lineal como si no lo es. El modelo de segundo orden describe una relación en la que existe una curva derespuesta, tanto con una tendencia creciente en la misma como decreciente. El modelo de tercer ordenajusta situaciones donde la respuesta cambia según los niveles; respuestas con forma sigmoide se ajustanbien a este modelo, dado que son modelos donde no hay linealidad en los extremos del intervalo demedida.

Los coeficientes de regresión se etiquetan como ib . En el modelo de segundo orden, 2b es el coeficiente

de no–linealidad; en el modelo de tercer orden, 2b y 3b son coeficientes de no–linealidad. Se debe obtener

el error estándar de la pendiente para cada coeficiente de no–linealidad, ies . El siguiente paso es realizaruna prueba t para comprobar si los coeficientes de no–linealidad son estadísticamente significativos; esto

es, si el coeficiente es significativamente diferente de cero. Los primeros dos coeficientes ( )0 1,b b no se

chequean porque nunca reflejarán no–inealidad. El test se calcula como sigue, para 2b y 3b :

i

i

bt

es=

Se calcula el número de grados de libertad a partir de la formula:

( ). . . .grados de libertad g de l L R g de l reg= −

donde: L es el número de concentraciones diferentes,R es el número de replicados de cada preparación o concentración; yg. de l. reg. es el número de grados de libertad consumidos por el análisis de regresión.

g. de l. reg es el número de coeficientes presentes en el modelo de regresión (incluido 0b ). (En el ejemplo

anterior, para un polinomio de tercer orden sería 5L= ; 2R= , g. de l. reg. = 4, y 5 2-4=6g.del. = × . Seconsultaría el valor crítico de t (bilateral para 0,05α = ), o la probabilidad de que se exceda el valor

observado de t . Si ninguno de los coeficientes de no–linealidad, 2b o 3b , son significativos ( 0,05p> paratodos), puede considerarse que los datos son lineales y el análisis está completado excepto si es precisochequear una gran imprecisión.

Si alguno de los coeficientes de no–linealidad son significativos, 2b en el modelo de segundo orden, o 2b o

3b en el modelo de tercer orden, ( )0,05p< , entonces los datos no son lineales según este protocolo. Esimportante notar que éste es un mero test de significación estadística, e indica solo que se ha detectadofalta de linealidad, no que sea suficientemente relevante como para afectar a los resultados de lospacientes.

Page 29: Evaluación de Métodos (I)

página 29

6.14. Grado de no–linealidadSe selecciona el polinomio de segundo o tercer orden (no–lineal) con el mayor ajuste examinando el errorestándar de la regresión ( ),y xes . Este estadístico es una medida de la diferencia entre los resultados

medidos y el modelo, de modo que el modelo con menor valor de ,y xes proporciona el mejor ajuste de losdatos.

Se calcula la desviación de la linealidad ( )DL a cada concentración como sigue:

( ) ( )0i i i iDL p x b b x= − +

donde: x varía desde 1x a sx ; y

( )ip x es el valor del polinomio de mejor ajuste en el punto ix .

Por tanto, iDL es la diferencia entre el modelo de segundo orden (cuadrático) y el de primer orden (lineal) acada nivel de concentración, o la diferencia entre el modelo de tercer orden (cúbico) y el lineal. Es unamedida de la diferencia entre el modelo no–lineal y el lineal, a cada una de las concentraciones medidas. Ladiferencia se expresa en unidades analíticas de modo que se puedan comparar con objetivos predefinidos.Si los objetivos se expresan como porcentajes, los valores iDL pueden transformarse análogamente en

porcentajes dividiendo iDL por la concentración a cada valor (las concentraciones son ix para muestras

de valores conocidos o el promedio de los valores medidos si ix son concentraciones relativas) y

multiplicando por 100 %. Los iDL se calculan sólo a los niveles de las muestras, no a cualquier valor de lospolinomios entre dichos puntos (incluso la presunción de no–linealidad podría ser mayor a niveles entre losniveles medidos).

Se examina iDL a cada nivel y se compara con el criterio establecido para el error a cada nivel. Si cada

iDL es inferior que el criterio, entonces, incluso si se ha detectado no–linealidad estadísticamentesignificativa no es importante dado que la cantidad de error no–lineal está dentro de la tolerancia elegida. Sialgún iDL supera el criterio, existe un posible problema de no–linealidad a ese nivel. Hay dosaproximaciones al problema:(a) tratar de encontrar la razón de la no–linealidad (preparación de la muestra, interferencia, calibración

instrumental, etc.) y eliminarla;(b) examinar la gráfica de respuesta frente a concentración y determinar si la no–linealidad está en los

extremos del intervalo de concentraciones o en el medio del mismo.

Si la concentración no–lineal está a cada extremo, una opción es eliminar el punto para el cual iDL seademasiado grande y repetir el análisis estadístico. Obviamente esta opción reducirá el intervalo delinealidad.

6.15. Consideraciones acerca del error aleatorioHasta ahora no hemos considerado la contribución del error aleatorio al establecimiento de la linealidad. Elerror aleatorio resulta de la variabilidad aleatoria, (variabilidad en el sistema analítico) y puede conducir adificultad para detectar una posible no–linealidad. La mejor estimación de la repetibilidad es la diferenciaconjunta entre las L parejas de replicados. La diferencia conjunta entre los replicados es una medida delpromedio global de la variabilidad que es independiente del nivel de analito presente. Esta es la“repetibilidad” del método, y se denota por xs (o xCV , o error proporcional). Si la estimación de xs sonrazonablemente iguales a todos los niveles, entonces la repetibilidad es también constante. Si la diferenciaes mucho mayor a concentraciones altas entonces la repetibilidad puede ser aproximadamente proporcionala la concentración de referencia ( xCV constante). Si la repetibilidad es proporcional a la concentración,debe calcularse los errores como diferencias porcentuales antes que como diferencias absolutas. Larepetibilidad puede calcularse mediante análisis de varianza, como la raíz cuadrada de las mediascuadráticas del error. También puede hacerse una estimación sencilla como sigue:

Page 30: Evaluación de Métodos (I)

página 30

• Calcular la diferencia entre dos replicados a cada nivel;• Elevar al cuadrado las diferencias entre replicados;• Sumar las diferencias al cuadrado;

• Dividir por el número de niveles ( )L x 2;

• Tomar la raíz cuadrada.Para dos replicados y L niveles la fórmula sería la siguiente:

( ) 21 21

2

L

i ii

r

r rs

L=

−=

1ir y 2ir pueden ser tanto resultados reales del procedimiento como expresarse como porcentajes de lamedia (aunque se deben usar las mismas unidades para todos los niveles). Si se emplean las diferenciasporcentuales entonces el resultado obtenido sería un xCV en lugar de xs .

Para situaciones con más de dos replicados, la estimación del error aleatorio deberá venir de un análisis dela varianza.

( )( )

2

1 1

1

L R

i j ji j

r

r rs

L R= =

−=

∑ ∑ i

donde: R es el número de replicados a cada nivel ( )1,2, ,j R= … ;

L es el número de niveles ( )1,2, ,i L= … ;

ir es el resultado promedio del nivel i .

Se compara xs con el objetivo para la repetibilidad, tanto si se expresa con sus unidades como en

porcentaje. Si xs es mayor que el objetivo, la imprecisión puede no ser adecuada para efectuar unadeterminación fiable de la linealidad. Esto es, la media de los replicados a cada nivel puede ser demasiadoincierta para realizar una determinación veraz de la linealidad. En este caso puede ser necesario estudiar elmotivo de la imprecisión, corregirlo y repetir el experimento de linealidad. Cuando la repetibilidad es muydiferente a lo largo de las distintas concentraciones, puede ser preferible emplear regresión ponderada parael modelo lineal. Para ello se utiliza el inverso de la varianza de los replicados a cada nivel.

6.16 Establecimiento del error máximo permisibleEl laboratorio debe determinar sus propios objetivos para el error de medida de cada analito.16 Los objetivosdeberían basarse en las necesidades de los clientes del propio laboratorio y en el entendimiento de lascapacidades del método tal como se emplea en dicho laboratorio. Los requisitos para el error de medida seemplean para determinar los objetivos de las diferentes fuentes de error de medida, como son los diversoscomponentes de la precisión, la veracidad y la no–linealidad. Se han propuesto diversos modelos paradeterminar los objetivos del error de medida.Algunas consideraciones para elegir objetivos para la linealidad:• Los objetivos de la linealidad no deben ser superiores que los del sesgo;• Los objetivos del sesgo deben ser menores o iguales que los del error de medida.Cuando las concentraciones de las muestras analizadas son desconocidas, los objetivos para la linealidaddeben estar en unidades relativas (porcentaje).Ciertos requisitos que implícitamente deben cumplirse para la evaluación estadística del intervalo linealsegún el presente protocolo, son:

16 NCCLS. Estimation of total analytical error for clinical laboratory methods. Approved guideline. NCCLSdocument EP21-A.

Page 31: Evaluación de Métodos (I)

página 31

• Los niveles de las muestras deben ser conocidos sin error (niveles reales conocidos, o conocidos conrespecto a cada uno de los otros);

• El intervalo lineal se chequeará sólo entre las concentraciones menor y mayor que demuestrencaracterísticas aceptables;

• El intervalo lineal se evaluará para la salida final del sistema (concentración o actividad) y no para laseñal instrumental, la cual puede ser procesada posteriormente por el sistema;

• Las muestras usadas han de estar libres de interferencias, que invalidarían el experimento;• El sistema analítico cumplirá el resto de características en el intervalo lineal chequeado;• Los tests de significación de los coeficientes de regresión también asumen que los replicados se

distribuyen según una normal a cada nivel, y que la varianza de esta distribución es constante a lo largode todos los niveles.

7. Calibración

7.1. Conceptos básicos asociados a la calibraciónLa calibración y todos los conceptos asociados a ésta, han sido determinados a lo largo de los años por losorganismos metrológicos y de normalización internacionales. En un principio fueron fijados básicamente conmiras a su empleo desde dentro de los laboratorios de calibración, ensayo, etc. Sin embargo, hoy día elpersonal técnico de una empresa en la que se desea mantener un Sistema de Confirmación Metrológica seve enfrentado con toda esta terminología, conceptos y definiciones, que le resultan ajenos y de difícilcomprensión. La definición de calibración desde la norma ISO17 es la operación de comparar la salida de unequipo de medida frente a la salida de un patrón de exactitud conocida cuando la misma entrada (magnitudmedida) es aplicada a ambos instrumentos. Durante el proceso de calibración el equipo es verificado paraun conjunto de puntos representativos de todo su intervalo de medida. El requisito 4.11 de la norma ISO900118 especifica claramente que los equipos de medida se deben gestionar y utilizar de manera adecuada:"El suministrador debe establecer y mantener al día procedimientos documentados para controlar, calibrar yrealizar el mantenimiento de los equipos de inspección, medición y procedimiento (incluyendo el soportelógico usado en los procedimientos analíticos) utilizados por el suministrador para demostrar la conformidaddel producto con los requisitos especificados." Más concretamente, el documento ISO 10012-1 y en suversión UNE EN 30012-119 indica que se debe diseñar e implantar un Sistema de Confirmación Metrológica.El objetivo último de este sistema de confirmación es garantizar el correcto funcionamiento de los equiposde medida que afectan a la calidad. Si se atiende a la definición de confirmación metrológica dada en elmismo documento, este sistema debe incluir toda operación requerida “para asegurar que un equipo demedida cumple con los requisitos establecidos para su uso planificado”. Entre estas operaciones seencuentra la calibración, ajuste, reparación, sellado y etiquetado, etc.Examinar la linealidad de una función de calibración es una tarea habitual tanto en la validación de métodosanalíticos como en las operaciones de la práctica rutinaria. La linealidad es una característica importante ydeseable de un método analítico. Por ejemplo, si la función de calibración es lineal, es más fácil estimar laecuación y los errores en la estimación de concentraciones desconocidas a partir de la función decalibración serán probablemente menores. Además, asumir la linealidad de la calibración es implícito al usoválido de un método para adiciones estándar. Dada la importancia de la calibración lineal, no es infrecuenteque se tienda a usar el coeficiente de correlación como indicador de linealidad.El coeficiente de correlación, dado por

17 Cuaderno técnico: calibración de equipos de medida industriales según iso 9000.18 UNE-EN-ISO 9000: Normas para la gestión de la calidad y el aseguramiento de la calidad. (Partesindividuales publicadas como ISO 9000, ISO 9001, ISO 9002, ISO 9003 e ISO 9004). AENOR, Madrid,1994.19 UNE-EN 30012–1: Requisitos de aseguramiento de la calidad de los equipos de medida. Parte 1: Sistemade confirmación metrológica de los equipos de medida. (ISO 10012–1: 1992). AENOR, Madrid, 1994.

Page 32: Evaluación de Métodos (I)

página 32

( )( )

( ) ( )1

2 2

1 1

n

i ii

n n

i ii i

x x y yr

x x y y

=

= =

− −=

− −

∑ ∑es una medida de la relación entre dos variables x e y . Tiene diversas propiedades muy útiles (véase eltema Correlación, Notas). Su uso en calibración, sin embargo, se basa en una incorrecta interpretaciónbastante generalizada. Es cierto que, si los puntos de la calibración se ajustan mucho a una recta, el valorexperimental de r será próximo a la unidad (figura 5).

Figura 5. Datos ASin embargo, la afirmación inversa no es cierta. Un valor de r próximo a la unidad no necesariamenteprocede de una relación lineal sino que puede ser, por ejemplo, resultado de que los puntos se ajustenclaramente a una curva (figura 4).

Figura 6. Datos BExiste un problema adicional relacionado con esto: los valores de r no pueden compararseapropiadamente. No es correcto decir que unos datos con 0,99r = sean ‘más lineales’ que otros con una

0,95r = . Lo mismo ocurre con el estadístico 2R obtenido de una regresión. Subyace una cuestión degrado. Una calibración con 0,9999r = se aproximará necesariamente a una recta. El problema es que nose puede decir cuánto o si será lo suficientemente próxima.

7.2. Chequeo de la falta de ajusteEstrictamente hablando, no se puede chequear la linealidad como tal. Lo que se puede hacer es comprobarsi la desviación de la linealidad es demasiado pequeña como para detectar que, dados unos resultados,dicha desviación no es estadísticamente significativa. Una aproximación es examinar los residuales de laregresión lineal. Se trata de las distancias entre los datos experimentales a la línea de regresión, medidaparalelamente al eje de respuesta. Si no hay falta de ajuste (esto es, si la calibración es inherentementelineal) los residuales representados frente a la concentración parecerán una muestra aleatoria de unadistribución normal de media cero. Como ejemplo, a continuación se representan los datos de la figura 5frente a la concentración (figura 6).

Page 33: Evaluación de Métodos (I)

página 33

Sin embargo, si no hay linealidad, se podrá percibir un patrón en la gráfica de los residuales, generalmentecon forma de una tendencia en los puntos, como puede observarse en la figura 8, correspondiente a losdatos de la figura 6. Para saber si este patrón que sugiere no–linealidad es significativo se debe replicar lasmedidas en cada punto de la calibración, proporcionando la información inherente a la variabilidad de larespuesta de las medidas (lo que se conoce como el error puro). En la figura 8 se observa, por ejemplo, unadesviación sistemática de los residuales respecto al cero que es razonablemente grande con respecto a lasdiferencias entre las medidas de los duplicados, y por tanto probablemente sea estadísticamentesignificativa.

Figura 7. Residuales estandarizados de la regresión lineal usando los datos A. No se observa patrónalguno respecto a los residuales.

Figura 8. Residuales estandarizados de la regresión lineal usando los datos B. Se observa claratendencia de los residuales.

En casos de duda, el test estadístico que se aplica es un análisis de la varianza de los residuales en elcontexto de una ausencia de ajuste o de error puro. Si existe una falta de ajuste significativa, y el patrón delos residuales apoya esta interpretación, se habrá demostrado la no–linealidad significativa de una manerainequívoca. Dados los datos de la figura 8, el estadístico muestra que existe falta de ajuste significativo,

0,01p≈ . Si hay evidencia de diferente varianza en la respuesta, lo que es frecuente en calibraciones en unintervalo amplio, se puede emplear una regresión ponderada.

7.3. Diseño de un experimento de calibraciónUn diseño eficaz es emplear seis o más concentraciones del analito, igualmente espaciados a lo largo delintervalo de concentraciones de interés, y medirlas por duplicado en orden aleatorio. La razón es lasiguiente: (a) debe haber suficientes puntos de calibración para obtener un patrón discernible. En algunoscasos seis puede ser un mínimo de puntos práctico; (b) aleatorizar el orden de las medidas evita elproblema de confundir la no–linealidad con efectos temporales como deriva instrumental durante lacalibración.

7.4. ¿Linealidad exacta?Cabe preguntarse en algunos casos si necesitamos una linealidad exacta o es aceptable cierto grado dedesviación de la linealidad, como por ejemplo si la evaluación de la incertidumbre resultante de usar unafunción de calibración lineal aporta una contribución insignificante sobre la incertidumbre global de lamedida. Sin embargo, habrá que considerar en todo caso qué parte de la calibración es relevante paranuestras necesidades.

Page 34: Evaluación de Métodos (I)

página 34

En la figura 9 se observa cómo emplear una relación lineal para representar una curva de calibración que enrealidad es curva puede conllevar una falta de ajuste que conducirá a resultados seriamente erróneos. Eneste ejemplo, bajas concentraciones de analito pueden estar sujetas a errores sistemáticos relativamentegrandes.

Figura 9

7.5. Ajuste de datos a una función lineal con error en ambas variablesUna condición básica de la regresión es que los valores de la variable respuesta (variable dependiente)sean aleatorios mientras que los de la variable x (independiente o predictora) deberían estar exentos deerror. Este modelo a menudo se aproxima a las aplicaciones clínicas, por ejemplo en el caso de lascalibraciones. Sin embargo, si no se cumplen las condiciones, los resultados de la regresión son en principioincorrectos y en la práctica pueden llevar a error. Alternativamente puede ser válido un método general deestimación funcional de máxima verosimilitud ( )FREML . FREML estima la ordenada en el origen y lapendiente, así como sus correspondientes errores estándar, sin introducir sesgos debidos al usoinadecuado de la regresión. El método es simétrico, por lo que las variables x e y pueden serintercambiadas sin afectar al resultado y permite manejar datos heterocedásticos, es decir resultados condiferentes precisiones.

7.6. Modelos de regresión y de relación funcionalLa regresión ponderada normal se basa en un modelo de los pares de datos

( ) ( ) ( )( )1 2 1 2, , , , , ,i ix x x x x x… tales que a y b son parámetros que describen la verdadera línea y ie

es el error normal aleatorio de varianza ( )var iy . Las estimaciones ( ),a b de a y b se obtienen

minimizando la función

( ) 22

1 i

ni i

i y

y a b xs=

− −∑

con respecto a a y b . La minimización se lleva a cabo por simple aplicación del cálculo a las conocidasecuaciones de la regresión.En la estimación de la relación funcional el modelo es diferente:

i i i

i i i

i i

x u

y

u

ε

ν η

ν α β

= +

= +

= +

donde iε y iη son independientes, normalmente distribuidas y con errores de varianzas iκ y iλrespectivamente. Se encuentra la relación funcional minimizando

Page 35: Evaluación de Métodos (I)

página 35

( ) ( )2 2

1 1

n ni i i i

i ii i

x u y a buκ λ= =

− − −+∑ ∑

Esta formulación sigue el principio de máxima verosimilitud, que es una aproximación de estimaciónestadística más general que el conocido método de mínimos cuadrados. Sin embargo, a diferencia de laregresión, la minimización ahora no puede resolverse algebraicamente, sino que requiere métodosnuméricos iterativos.

7.7. Aplicaciones analíticas de FREML(a) Calibración con materiales de referencia sólidos (donde la incertidumbre del valor de referencia puede

ser considerable);(b) Comparación de resultados de dos métodos sobre un intervalo de concentraciones apreciable y

caracterización del sesgo, si existe, entre ellos.Ambas aplicaciones pueden requerir pruebas de significación de a y b y de la ausencia de ajuste.FREML acomoda estos requisitos proporcionando los errores estándar aes , bes y un estadístico deausencia de ajuste.

Se podría contrastar, por ejemplo, la hipótesis 0 : 0H α = (la línea pasa por el origen de la gráfica)calculando:

aa

azes

=

Asimismo, se podría chequear 0 : 1H β = (la pendiente de la recta es la unidad) con:

1a

b

bzes−

=

Los valores de z pueden interpretarse como una distribución normal estándar, de modo que para unaconfianza del 95 % debe usarse el valor crítico de 1,96 para | |z .

El estadístico de ausencia de ajuste es la suma de cuadrados de los residuales escalados, que pueden sertratados aproximadamente como una variable 2χ con 2n− grados de libertad. Un valor significativamentealto de este estadístico sugiere tanto que la estimación de la varianza fue considerada demasiado baja (unfallo común) como una ausencia de ajuste. En el segundo caso puede deberse a una interferencia nocorregida o a una verdadera falta de linealidad. El examen de la representación gráfica de los residualesescalados permite dilucidar cual de las situaciones se está dando.

7.8. Cómo estimar las ponderacionesEn el ejemplo anterior las varianzas fueron estimadas a partir de un número moderado de resultadosreplicados. En algunos casos, el empleo de FREML estaría indicado si tuviéramos sólo uno o un pequeñonúmero de resultados por punto. Para ponderar las estimaciones en primer lugar se asume que los datosson homocedásticos, podríamos usar una varianza común para cada uno de los valores y otra para los x. Silos datos son heterocedásticos, una gráfica de residuales escalados puede resolver el problema. Entoncesse toman diferentes varianzas para cada valor x e y . Si la heterocedasticidad es muy grande inclusopocas réplicas de los datos mejorarán los resultantes estadísticos.En la calibración, además, se puede usar un modelo lineal simple de la desviación típica en función de laconcentración, que podría ser empleado para suavizar las estimaciones puntuales de los datos obtenidoscon pocas medidas.

Page 36: Evaluación de Métodos (I)

página 36

Apéndice 1. Consideraciones adicionales relativas al estudio de la imprecisión

A1.1. Modificaciones para realizar una serie analítica por díaPara aquellos instrumentos en que por la larga duración del método, o por otro motivo, no sea posiblerealizar más de una serie analítica por día, cabe la posibilidad de estimar la imprecisión Sin embargo eneste caso no será posible valorar por separado la imprecisión interensayo de la inter–día y no se podráestimar la imprecisión intra–día.La fórmula básica para estimar la repetibilidad será:

( ) 21 21

2

I

i ii

r

x xs

I=

−=

donde: I es el número total de días (generalmente 20);

1ix es el replicado 1 del día i ; y

2ix es el replicado 2 del día i .El procedimiento será el descrito en el apartado 3, salvo por el hecho de que se realizará solo una serieanalítica por día en lugar de 2.En esta estimación los grados de libertad serán la mitad de los del protocolo que utiliza dos series analíticaspor día. Para aumentar el número de grados de libertad hay dos alternativas:(a) Incrementar el tamaño del experimento, prolongando el estudio durante más días (se recomienda un

mínimo de 30), procesando dos alícuotas del material empleado para el estudio de la imprecisión encada serie analítica;

(b) Incrementar el número de alícuotas procesadas en cada serie manteniendo la duración del estudio en20 días. En este caso, la desviación típica intraserial se estimará mediante la siguiente fórmula:

( )( )

2

11 1

1

I N

i ii j

r

x xs

I N= =

−=

∑∑ i

donde: I es el número total de días;N es el número de replicados analizados en cada serie analítica;

i jx es el resultado obtenido en el replicado j de la serie analítica procesada el día i ;

ix i es el promedio de todos los replicados del día i .

El número de grados de libertad en esta estimación es igual a I veces el número de replicados efectuadosen cada serie analítica menos 1, esto es, ( ). . 1g de l I N= − . Cada serie analítica debe contener el mismonúmero de replicados para que la fórmula anterior sea adecuada. No se incluye el factor 2 en eldenominador porque ahora esta formula emplea la suma de desviaciones cuadráticas respecto a la mediade las series analíticas, a diferencia de las diferencias entre los duplicados empleados en fórmulas previas(adecuado sólo para dos observaciones).

A1.2. Desviación típica intralaboratorio o instrumentalCuando sólo se disponga de una serie analítica por día, se estimará la imprecisión intralaboratorio según lasiguiente expresión:

( ) 21

1

I

iix x

BI

=

−=

∑ i i i

donde: I es el número de días;

Page 37: Evaluación de Métodos (I)

página 37

ix i es el promedio de los replicados en el día i ;

x i i es el promedio de todos los resultados en todos los días;

B es la desviación típica de los promedios diarios (generalmente denominado error estándarde las medias diarias). Cuando sólo se realiza una serie analítica por día, esta estimación combina lascomponentes interdiaria e interserial de la imprecisión. Esta será la formula empleada independientementedel número de días o el número de replicados.

A partir de la anterior estimación, B , y de la desviación típica intraserial, rs , se puede calcular laimprecisión instrumental o intralaboratorio según la expresión:

2 21T r

Ns B sN−

= +

donde: N es el número de replicados en cada serie analítica;

B es la desviación típica de las medias diarias;2rs es la estimación de la repetibilidad en forma de varianza.

Esta fórmula puede emplearse independientemente del método usado para incrementar el número deobservaciones del estudio de repetibilidad (días adicionales o replicados adicionales en cada serieanalítica).

A1.3. Ecuación de Satterthwaite

Se emplea para calcular el número adecuado de grados de libertad, T , para valorar Ts aplicando

apropiadamente el test de 2χ cuando se quiera verificar la imprecisión aportada por el fabricante. Secalcula T según la fórmula:

( )( )( )

2

22

1

11

I N ME MDT

I MDN MEI

− +=

− +−

donde: 2rME s= es la media cuadrática intraserial;

2MD N B= es la media cuadrática para ambas series analíticas y días.

Se utiliza el valor entero más próximo al resultado obtenido para T como grados de libertad para evaluar

Ts .

A1.4. Otras estimaciones posiblesEn ocasiones hablar de imprecisión día–a–día o intra–día ha creado confusión. A menudo “día–a–día” seemplea erróneamente como la imprecisión media a lo largo de una periodo largo de tiempo. Otra fuente deconfusión adicional proviene de que los parámetros componentes de la imprecisión son independientes deltipo de experimento, mientras que los cálculos de estas estimaciones difieren considerablemente en funcióndel número de observaciones incluidas en cada serie analítica, de las series analíticas procesadas por día, ydel número de días del experimento.

A1.5. Imprecisión inter–díasEstadísticamente, la imprecisión día–a–día (más apropiadamente denominada inter–días) es la desviacióntípica (ajustada) de las medias diarias, tras eliminar los efectos de la repetibilidad y la variabilidad interserial,la variabilidad intra–día, en los promedios diarios. Debemos pensar en términos de una estimación de lavariabilidad de los promedios diarios que se esperarían si se pudiera realizar un número infinito deobservaciones cada día. Si se realiza una única serie analítica cada día, se puede demostrar que lavarianza de los promedios diarios sigue la siguiente expresión:

Page 38: Evaluación de Métodos (I)

página 38

( )( )

1 2var1

I

ii

D

x xx s

I=

−= =

∑ i i i

con un valor esperado:

( )2

2 2 rD d ds

σ= +E ,

donde: ix i es el promedio de los resultados del día i ;

x i i es el promedio de todos los resultados en todos los días;

I es el número total de días;2d dσ es la varianza inter–días real (ajustada);

2rσ es la varianza intraserial real (repetibilidad);

N es el número de replicados de cada serie analítica.Según aumenta el número de replicados de cada serie analítica, la estimación será más próxima alparámetro verdadero (ej, la repetibilidad tendrá menos influencia en la estimación). La cantidad denominadaB en este protocolo no puede tomarse como una estimación de la imprecisión inter–días. Para que estacantidad sea útil requiere un ajuste. El proceso de ajuste depende del número de series analíticas por día ydel número de observaciones por serie analítica, pero no del número de días en que haya sido efectuado elprotocolo.

Dos series analíticas por día

Para dos series analíticas por día, como se describió en el protocolo principal, las cantidades A y B delapartado 3 se usan para derivar la estimación de la desviación típica inter–días verdadera ajustada d dσ :

22

2d dAs B= −

y de la desviación típica interensayo intra–día:2

2

2r

r r

ss A= −

Una única serie analítica por día

Para una única serie analítica por día y dos o más observaciones por serie, el procedimiento es algodiferente. Las componentes inter–día e interensayo no pueden separarse. La cantidad denominada B mideen este caso la suma de ambas componentes. Habrá que eliminar el efecto de la variabilidad intraserial dela estimación calculando:

22 r

d d

ss B

N= −

donde: N es el número de replicados por serie analítica.

La interpretación de la cantidad d ds es la suma de los efectos inter–día e interserial intra–día.

En algunos casos, la cantidad obtenido en el radicando anterior puede ser negativa, si la componente inter–días es pequeña. Si ocurre esto, la estimación de d ds debe establecerse en 0. Esta precaución debeaplicarse a las estimaciones calculadas anteriormente para dos series analíticas por día.