Avances en el control de calidad externo en el laboratorio de embriología clínica

Martínez Granados, Luis

Avances en el control de calidad externo en el laboratorio de embriología clínica

Martínez Granados, Luis

Dirigida por:

José Antonio Castilla Alcalá Director

Universidad de defensa: Universidad de Granada

Fecha de defensa: 27 de febrero de 2018

Tribunal:

Ignacio Santiago Álvarez Miguel Presidente/a
Juan Mozas Moreno Secretario
José Carlos Prados Salazar Vocal
M. Carmen Gonzalvo López Vocal
Anibal Nieto Díaz Vocal

Departamento:

ANATOMÍA Y EMBRIOLOGÍA HUMANA

Tipo: Tesis

Teseo: 541874 DIALNET DIGIBUG editor

Resumen

Introducción Las técnicas de reproducción asistida son fundamentales para atender los deseos reproductivos de las parejas estériles y de las mujeres sin pareja masculina, para evitar la transmisión de enfermedades infecciosas y hereditarias o para preservar la fertilidad. El laboratorio de reproducción debe estar orientado a satisfacer las necesidades de sus usuarios mediante procesos de probada seguridad y eficiencia. Para ello es clave la implantación de sistemas de calidad y programas de control de calidad internos (CCInt) y externos (CCExt). Actualmente, diferentes sociedades científicas han recomendado la participación en programas de CCExt de evaluación morfológica embrionaria y de citotoxicidad (CT) (OMS, 2010; Hurtado de Mendoza et al., 2015; ESHRE Guideline Group on Good Practice in IVF Labs et al., 2016), ya que permiten conocer la fiabilidad entre laboratorios y su exactitud, en el primer caso, y aumentar su eficiencia, en el segundo. 1.Análisis de ovocitos y embriones. La evaluación de la calidad embrionaria es clave en el laboratorio de embriología clínica, sin embargo, diversos factores pueden afectar a esta valoración, como las posibles diferencias intra e interobservador existentes en la interpretación de los criterios de clasificación de cigotos y embriones. Algunos autores como Arce et al. (2006) indican que la variabilidad intraobservador para la clasificación embrionaria es relativamente baja. Respecto a la variabilidad interobservador, es importante que todos los miembros de un equipo sigan un mismo criterio para poder trabajar como una unidad y tomar decisiones reproducibles y válidas. Esto implica una estandarización en los sistemas de evaluación embrionaria, así como la formación continuada del equipo de embriólogos (Arce et al., 2006). En 2008, la Asociación para el Estudio de la Biología de la Reproducción (ASEBIR) publica un manual, en el que se estandarizaba por primera vez los criterios de evaluación y clasificación embrionaria (Ardoy et al., 2008). Sin embargo, la evaluación morfológica clásica, la más extendida en los laboratorios, está basada en determinaciones estáticas, presentando tres grandes desventajas: 1º Está vinculada a momentos puntuales, con la consiguiente pérdida de información sobre el resto del desarrollo embrionario. 2º Inevitablemente perturba las condiciones óptimas de cultivo. 3º Tiene un carácter subjetivo, dependiente del observador (Arce et al., 2006) Frente a esta evaluación morfológica clásica ha aparecido, en los últimos años, la tecnología time-lapse, que permite el seguimiento del desarrollo embrionario en tiempo real. Estas plataformas ofrecen la posibilidad de cultivar embriones en un entorno controlado, capturando imágenes a intervalos definidos. Lo que ofrece varias ventajas frente a la microscopia estática convencional. 1º Permite el mantenimiento de condiciones óptimas de cultivo durante todo el desarrollo embrionario. 2ºPermite hacer un monitoreo continuo de los embriones. 3º Reducción de posibles errores en la clasificación de embriones, debido a la posibilidad de visionar las imágenes indefinidamente. No obstante, los sistemas time-lapse también presentan algunas limitaciones, como la incapacidad de rotar los embriones en observación. Al ser una tecnología de reciente implantación, aun encontramos inconsistencias en la terminología utilizada a la hora de nombrar las variables morfocinéticas. Kaser y Racowsky (2014) pusieron de relieve que el mismo evento del desarrollo embrionario era denominado de hasta cuatro maneras diferentes según los autores. Esta terminología debería ser estandarizada. En los años en los que solo existían los criterios morfológicos clásicos, diferentes encuestas y sondeos realizados a centros de reproducción asistida en España (Castilla et al., 2010), sacaron a la luz la gran disparidad de criterios que usaban los diferentes laboratorios para la clasificación embrionaria. La ausencia de criterios comunes afectaba tanto a los parámetros a evaluar, como a los puntos de corte entre categorías, lo que restaba validez a dichos criterios, aumentando la variabilidad entre observadores. Para disminuir esta variabilidad se propusieron diferentes alternativas como la asistencia a actividades formativas específicas (Ruiz de Assin et al., 2011) y la participación en programas de control de calidad externos e internos (Arce et al., 2006; Castilla et al., 2010). En 2007, comenzó a realizarse en España un programa de CCExt para laboratorios de reproducción basado en la evaluación de la morfología embrionaria de manera estática. En 2011, los criterios de clasificación embrionaria de ASEBIR se incorporan al programa de CCExt. En estos programas nuestro grupo demostró la importancia de utilizar valores verdaderos basados en la opinión de expertos (Ruiz de Assin et al., 2009). No obstante, en estos estudios aún no se aplicaban los criterios estandarizados de morfología embrionaria de ASEBIR por su reciente publicación en aquellos años. Con la aparición de la tecnología time-lapse y su posterior implantación en numerosos laboratorios, ha surgido el mismo problema de falta de consenso y validez. Esta falta de consenso entre laboratorios conllevaría problemas como la imposibilidad de generar estudios multicéntricos con una valoración común de la calidad embrionaria, la dificultad en la interpretación de informes clínicos de otros laboratorios o en la comparación de los datos bibliográficos. 2.Evaluación de fungibles El fungible de laboratorio utilizado en reproducción asistida que vaya a estar en contacto con gametos o embriones no debería tener una influencia negativa en la viabilidad de estos, por lo que la identificación de fungibles que puedan ser citotóxicos es esencial para el óptimo rendimiento de los laboratorios de embriología (Lierman et al., 2007). La realización de bioensayos para determinar la utilización o no de materiales y medios es fundamental para evitar una disminución de los resultados o desechar materiales y/o medios no tóxicos, lo que implicaría costes extra. Un buen sistema de bioensayos de materiales y medios llevaría consigo una mejora de resultados con un menor coste. Los programas de CCExt de CT en los laboratorios de reproducción están implantados desde hace tiempo, pero es necesario su estandarización ya que los fungibles que se evalúan son muy diversos (puntas de pipeta, placas de cultivo, catéteres de transferencia, medios de cultivo, etc.). Tras lo comentado en la introducción, el objetivo de este trabajo es abordar diferentes aspectos de los programas de CCExt del laboratorio de embriología, utilizando una metodología estandarizada para realizar estudios de fiabilidad y acuerdo (GRRAS) (Kottner et al., 2011). Hipótesis y justificación 1.Hipótesis • La incorporación de una catalogación embrionaria estandarizada a un programa de CCExt de evaluación morfológica embrionaria clásica afectaría a la fiabilidad y acuerdo entre laboratorios y un panel de expertos. • Por su reciente implantación, los equipos time-lapse carecen de controles de calidad externos, lo que podría restar validez a dichos sistemas al no controlarse la variabilidad entre observadores. • Los diferentes fungibles utilizados en los CCExt de CT podrían influir en la capacidad de los laboratorios de detectar fungibles tóxicos. 2.Justificación Uno de los retos a los que se enfrentan los laboratorios de reproducción asistida es el mantenimiento de la calidad en todos los procesos llevados a cabo en él. Para ello, se debe evaluar la eficacia de las decisiones y procedimientos realizados diariamente, identificar y corregir problemas, asegurar la certeza y la precisión de los procedimientos, y controlar la competencia del personal del laboratorio. Por este motivo es fundamental analizar y evaluar los procesos y técnicas que se llevan a cabo en el laboratorio de embriología de forma tradicional y aquellos procesos y técnicas nuevas que pretenden incorporarse a dichos laboratorios con objeto de asegurar y garantizar el buen funcionamiento de estos. En los últimos años los dos avances más relevantes en el campo de la clasificación embrionaria han sido la publicación de los criterios estandarizados de catalogación embrionaria de ASEBIR y la aparición de plataformas de morfocinética. Estas últimas se han instalado en nuestros laboratorios sin análisis previos de su reproducibilidad entre centros. Aunque actualmente se ha comprobado una baja variabilidad entre observadores del mismo centro, se desconoce si existen variaciones entre laboratorios a la hora de determinar los tiempos y las características del desarrollo embrionario. Como se ha comentado anteriormente, es fundamental analizar y evaluar los procesos y técnicas que se llevan a cabo en el laboratorio de embriología. En la actualidad existen a nivel internacional distintos CCExt para evaluar fungibles gametotóxicos, sin embargo, se desconoce si el rendimiento de un laboratorio en la evaluación de fungibles tóxicos depende del tipo de fungible evaluado. Objetivos 1. Analizar la reproducibilidad entre laboratorios de embriología y un panel de expertos en evaluación morfológica embrionaria clásica. 2. Analizar el impacto de los equipos time-lapse en la variabilidad entre laboratorios de embriología en la evaluación morfológica embrionaria. 3. Valorar la influencia del tipo de producto a analizar en un programa de CCExt de CT en el laboratorio de embriología. Material y métodos 1.Acuerdo y fiabilidad entre laboratorios y un panel de expertos en evaluación morfológica embrionaria clásica Se analizan los datos recogidos en el programa de CCExt de ASEBIR correspondientes a los años 2012-16, en los que participaron una media anual de 44 centros nacionales de forma voluntaria. Se evalúan un total de 125 embriones a lo largo de los 5 años. En este programa, los centros acceden a una plataforma a través de internet en la que encuentran 3 proyectos con videos cigotos, embriones de día 2 y día 3 y 2 proyectos con videos de embriones de día 4 y día 5. La óptica y el aumento usado para la grabación fueron Hoffman y 400x, respectivamente. Las grabaciones se llevaron a cabo simulando la rutina diaria de valoración de la calidad embrionaria. En este programa anual de CCExt se evalúan, para los embriones en día 2 y día 3: número de células, asimetría de las blastómeras, porcentaje de fragmentación celular, presencia de multinucleación, presencia de vacuolas; y para embriones de día 5: tipo de blastocisto, masa celular interna y trofoectodermo (evaluadas según la catalogación de ASEBIR). Además, los laboratorios deben clasificar cada embrión de día 2, día 3 y día 5 según la catalogación de ASEBIR. Todas las características analizadas, entre las 16-18 horas, 43-45 horas y 67-69 horas tras la microinyección espermática, permiten seguir un diagrama de flujo para cada embrión según ASEBIR, que indicará la calidad del embrión y por tanto su potencial de implantación. Clasificándose los embriones según ASEBIR en A (muy alta capacidad de implantación), B (alta capacidad de implantación), C (baja capacidad de implantación) y D (muy baja capacidad de implantación). También deben decidir para los 3 primeros proyectos (embriones día 2 y día 3) que dos embriones debían ser transferidos y para los 2 últimos proyectos (embriones día 5) que embrión debía ser transferido. Para aquellos embriones que decidían no transferir, los centros debían decidir si los crioconservarían o los descartarían. El grupo de interés de calidad de ASEBIR propone a un grupo de siete expertos. El grupo de expertos se reúne de forma presencial y anual para analizar las imágenes de la misma manera que lo hacen los centros. Para cada variable analizada se considera, la respuesta dada por la mayoría de los centros y la respuesta consensuada por el grupo de expertos. La respuesta consensuada del grupo de expertos es utilizada como el valor verdadero. Aquellas características embrionarias en las que el grupo de expertos no llega a un consenso fueron eliminadas del estudio. 2.Variabilidad entre laboratorios en la evaluación morfológica embrionaria mediante time-lapse Los centros participantes en este estudio fueron contactados mediante la secretaría técnica de ASEBIR. Esta llevó a cabo una invitación a todos sus asociados, vía e-mail, para la participación en un ensayo piloto de CCExt. Indicando que la participación en este ensayo piloto sería voluntaria, por centro y siendo condición indispensable disponer de alguna de las dos plataformas evaluadas (Embryoscope o PrimoVision). A cada centro participante se le enviaron tres proyectos en un dispositivo USB. Cada proyecto incluía videos del desarrollo de entre 9-14 ovocitos hasta la fase de blastocisto. Estos videos se realizaron a partir de imágenes tomadas cada 5-20 minutos de 31 embriones para los usuarios de Embryoscope y 35 embriones para los usuarios de PrimoVision. Cada centro debía, en base a estos vídeos, clasificar los embriones en día 2, 3 y 5, siguiendo los criterios ASEBIR de clasificación embrionaria, y decidir, para cada proyecto, que embrión de día 5 debería ser transferido. Para aquellos embriones que decidían no transferir, los centros debían elegir si los crioconservarían o los descartarían. Al mismo tiempo se facilitaron instrucciones con explicaciones sobre el funcionamiento del programa de control calidad y una base de datos para la recogida de tiempos y otras características morfológicas. Se recogen los tiempos a los que ocurre: La extrusión del segundo corpúsculo polar (extrusión 2º CP), la aparición (aparición PN) y desaparición (desaparición PN) de los pronúcleos, cada una de las divisiones celulares (inicio de t2, t2, t3, t4, t5, t6, t7, t8, t9), tiempo en el que alcanza la fase de mórula (tmórula), tiempo en el que aparecen los primeros signos de blastulacion (tsB), tiempo en el alcanza la fase de blastocisto (tB), tiempo en el que comienza la expansión (tBE), tiempo en el que inicia la eclosión (tBHi). Las características morfológicas recogidas fueron: Anomalías ovocitarias: Presencia de alguna característica morfológica anormal (agregados del REL, vacuolas, inclusiones, anomalías del espacio perivitelino, anomalías de la zona pelúcida, anomalías en el corpúsculo polar o en la forma del ovocito), número de pronúcleos, fragmentación celular, presencia de vacuolas, presencia de multinucleación y asimetría de las blastómeras. 3.Influencia del tipo de producto a analizar en un programa de control de calidad externo de citotoxicidad Los datos analizados proceden del programa de CCExt de CT (años 2013-2016) organizado por ASEBIR. En este programa se realiza un envío anual a los laboratorios participantes de dos fungibles (muestras de medios de cultivo embrionario y puntas de pipeta). Algunos de esos fungibles fueron tratados por la organización de tal manera que resultasen tóxicos. Los laboratorios participantes desconocen totalmente el tratamiento aplicado a cada fungible. Los fungibles habían sido previamente testados por la organización con el fin de confirmar su toxicidad o no toxicidad. Todos los centros utilizaron para valorar la toxicidad de los fungibles el test de supervivencia espermática y debían responder para cada fungible analizado si era tóxico o no tóxico. 4.Análisis estadístico Para los cálculos anteriores, se utilizó el programa estadístico AgreeStat2015 [Advanced Analytics, LLC (USA)]. Se utilizó una ponderación cuadrática cuando fue necesaria aplicarla en algún parámetro. Para expresar la fuerza de concordancia para los estadísticos kappa y Gwet utilizamos los siguientes intervalos: 0 “no hay acuerdo”, 0,01-0,20 “leve”, 0,21-0,40 “justo”, 0,41-0,60 “moderado”, 0,61-0,80 “substancial” y 0,81-1 “casi perfecto” (Landis y Koch et al., 1977). Para una correcta interpretación del acuerdo ponderado se utilizaron los siguientes intervalos: 0.70-0.79 “pobre”; 0.80-0.89 “moderado”; 0.90-0.98 “fuerte”; 0.99-1.00 “casi perfecto” (Tworek et al., 2013). Se consideró un alto grado de acuerdo cuando sobre un embrión o cigoto más del 75% de los laboratorios coincidían en su clasificación o decisión clínica. Para la comparación de las diferentes variables cualitativas analizadas se utilizó el test de χ2 con una significación del 5%. En caso de no cumplirse las condiciones de validez de dicho test, se utilizó el test de Fisher. Los datos obtenidos en control de calidad externo de tecnología time-lapse usando los criterios estandarizados de ASEBIR se analizan con el paquete estadístico SPSS 19.0. Para cada tiempo analizado, se calculó el coeficiente de variación y el coeficiente de correlación intraclase, junto con el correspondiente intervalo de confianza al 95%. Los tiempos medios de cada evento de los embriones analizados con cada plataforma se compararon por el test de Student. Se utiliza el test de Chi cuadrado para comparar los datos categóricos. Todas las pruebas se realizaron con el nivel de significancia del 5%. Se analizó la sensibilidad (S), especificidad (E), valor predictivo positivo (VPP), valor predictivo negativo (VPN) y acuerdo global de los bioensayos. Se utilizó una representación del espacio ROC para interpretar los datos del test de supervivencia espermática (TSE). Para determinar si existía relación entre el porcentaje de acierto al analizar medios de cultivo y el obtenido al analizar puntas de pipeta, se calculó el coeficiente de Correlación de Pearson. Resultados 1.Acuerdo y fiabilidad entre laboratorios y un panel de expertos en evaluación morfológica embrionaria clásica Respecto a la evaluación morfológica embrionaria, el valor de fiabilidad obtenido entre laboratorios y el panel de expertos es sustancial (Gwet: 0.76; 95% IC: 0.70-0.84). El acuerdo entre laboratorios y el panel de expertos fue más alto en los embriones de buena calidad que en los de calidad más baja. Cuando se observa multinucleación o vacuolas, se obtienen bajos niveles de fiabilidad. En blastocistos, la característica que presenta las mayores discrepancias es la masa celular interna. En la decisión clínica sobre el embrión, la fiabilidad entre laboratorios y el panel de expertos es moderada (Gwet: 0.51; 95% IC: 0.41-0.60). Siendo más baja cuando el destino del embrión era crioconservarse, que cuando era transferirse o descartar. 2.Variabilidad entre laboratorios en la evaluación morfológica embrionaria mediante time-lapse Para los dos equipos time-lapse estudiados (EmbryoScope™ y Primo Vision™) se observan dos periodos de alta variabilidad entre laboratorios en los tiempos de los eventos del desarrollo embrionario. Se observa un pico de variabilidad cuando los laboratorios deben determinar los primeros eventos del desarrollo (extrusión del segundo corpúsculo polar y aparición de los pronúcleos) y un segundo pico entre los tiempos correspondientes a 8 células y al estadio de mórula. En la mayoría de las variables cualitativas analizadas se observa una muy baja variabilidad entre centros, tanto en la evaluación morfológica clásica como con los equipos time-lapse, excepto para falsa división, vacuolas y asimetría (utilizando todos los métodos) y multinucleación (para los usuarios de Primo Vision™), donde esta variabilidad fue más alta. La variabilidad entre laboratorios en catalogación embrionaria según criterios ASEBIR, toma valores de Gwet moderados-sustanciales (Gwet 0.41-0.80) para los usuarios de evaluación morfológica embrionaria clásica (EMEC) y EmbryoScope™, y bajos-moderados (Gwet 0.21-0.60) para usuarios de Primo Vision™. La variabilidad entre laboratorios para decisión clínica fue superior (Gwet 0.41-0.60) en día 5 para usuarios de EMEC que la obtenida para usuarios de equipos time-lapse (Gwet 0.81-1). 3.Influencia del tipo de producto a analizar en un programa de control de calidad externo de citotoxicidad De manera global e independientemente del producto analizado en la evaluación de fungibles en el programa de CCExt de CT se observó que la S (0.93 y 0.87) para puntas y medios, respectivamente, fue superior a la E (0.79 y 0.76), y que el VPN fue superior (0.92 y 0.90) que el VPP (0.82 y 0.71). Al comparar los resultados según el material utilizado, observamos de manera global que se obtienen parámetros de rendimiento diagnóstico similares con ambos materiales, excepto en el VPP que resultó significativamente más alto al utilizar puntas de pipeta que medios de cultivo (0,82 [0,77-0,87] vs 0,71 [0,66-0,76], p≤0.05) Al analizar las respuestas de los laboratorios por número de participaciones en el programa de CCExt de CT de ASEBIR, se observó que en la primera participación evaluando medios de cultivo, los resultados obtenidos son más bajos en S y E, que los obtenidos en la primera participación evaluando puntas de pipeta. Sin embargo, en las siguientes participaciones, con más experiencia, los resultados en S y E son similares entre ambos productos. No se observó una correlación significativa entre el porcentaje de aciertos de un laboratorio en medios de cultivo y el de aciertos en puntas de pipeta (r=0.026). Discusión Acuerdo y fiabilidad entre laboratorios y un panel de expertos en evaluación morfológica embrionaria clásica El alto grado de acuerdo observado en este estudio, es similar al observado en este mismo programa, previo a la incorporación de la catalogación estandarizada (Ruiz de Assin et al., 2009). Sin embargo, la tendencia a un mayor desacuerdo entre laboratorios y el panel de expertos en los embriones tipo D, podría deberse a la mayor dificultad en el uso de un sistema de catalogación embrionaria de cuatro categorías. La fiabilidad “casi perfecta” obtenida en la evaluación de la fragmentación embrionaria, es superior a la publicada hasta el momento (Arce et al., 2006; Paternot et al., 2009, 2011). Esto podría deberse al tipo de imágenes analizadas, ya que en el estudio de Arce et al. (2006) no se utilizaron el mismo tipo de imágenes en los dos grupos de estudio, al contrario de lo que ocurre en este trabajo. Otra causa, podría ser el diferente número de categorías utilizadas en ambos estudios para valorar la fragmentación. En nuestro estudio se utilizan dos categorías para valorar fragmentación mientras que en el estudio de Arce et al. (2006) se utilizan seis categorías para evaluar la misma característica, lo que podría llevar a un menor grado de fiabilidad al analizar fragmentación. Al analizar presencia/ausencia de multinucleación o de vacuolas en embriones en estadio de células y la catalogación de blastocistos entre laboratorios y un panel de expertos mediante EMEC se obtuvo un porcentaje de acuerdo ponderado casi total entre laboratorios y el panel de expertos, así como una elevada fiabilidad, mientras que al utilizar el coeficiente kappa (k) para medir la fiabilidad, este fue moderado. Esta paradoja de obtener elevados porcentajes de acuerdo con k bajas es debida al análisis de poblaciones muy homogéneas. Esto provoca que el acuerdo obtenido se deba al azar y no ofrezca ninguna garantía de que los embriólogos puedan identificar, estas alteraciones en el embrión. Los resultados obtenidos de fiabilidad y acuerdo en catalogación de embriones son superiores a los publicados anteriormente (Arce et al., 2006; Baxter Bendus et al., 2006; Paternot et al., 2009; Storr et al., 2016). Esto podría deberse al diferente diseño de nuestro estudio (en el que la categoría elegida por la mayoría de los laboratorios se comparó con la asignada por un panel de expertos) en comparación con el diseño empleado por otros investigadores (variabilidad interobservador). En la catalogación de blastocisto, se observan altos valores globales de fiabilidad y acuerdo. Sin embargo, observamos al igual que Storr et al., (2017), niveles bajos de fiabilidad entre observadores en la evaluación de la MCI. Nosotros, al tener en cuenta cada categoría, observamos que la baja fiabilidad obtenida es debida principalmente a las MCI de mala calidad. Con respecto al destino final del embrión, la baja fiabilidad y acuerdo observados, especialmente en la decisión de crioconservar embriones, en comparación a los valores de fiabilidad y acuerdo encontrados en catalogación embrionaria, podría deberse a las diferentes políticas de transferencia y crioconservación propias de cada centro. La relativa poca fiabilidad observada en el destino del embrión en día 5, en comparación con lo publicado por Storr et al. (2016), podría ser debido a que nuestro programa considera tres opciones de respuesta (transferencia, crioconservar o descartar) mientras que Storr et al. (2016) consideran sólo dos (transferencia o no de transferencia). Una de las limitaciones de nuestro trabajo es que no disponemos de información sobre el nivel de experiencia de los embriólogos que participan en el CCExt. Otra posible limitación es que la participación en el programa de CCExt de ASEBIR es voluntaria. Variabilidad entre laboratorios en la evaluación morfológica embrionaria mediante time-lapse Nuestros resultados, tras analizar los datos de un ensayo piloto de CCExt de EME mediante time-lapse, parecen confirmar la dificultad existente en la determinación de los tiempos a los que ocurren algunos eventos embrionarios debido a la posibilidad de marcar los eventos en distintos momentos (inicial, medio o final), observándose un pico de variabilidad entre laboratorios al analizar eventos que tardan más tiempo en producirse Otro pico de variabilidad se observa a partir del estadio de 8 células, posiblemente porque las células están más próximas entre sí haciendo más difícil su contaje y porque en estos momentos suele comenzar el proceso de compactación. El alto grado de acuerdo entre laboratorios, observado al analizar mediante time-lapse los eventos de morfocinética coincide con los publicados por Sundvall et al. (2013). En nuestro estudio, la validez de esta conclusión se vio reforzada por la participación de 24 laboratorios, comparado con los tres observadores del mismo laboratorio estudiados por Sundvall et al. (2013). Tras comprobar los resultados del ensayo piloto de EME mediante time-lapse con los obtenidos en el programa de CCExt de EMEC, no se observó un aumento en el nivel de acuerdo entre laboratorios usuarios de equipos time-lapse frente a los usuarios de EMEC, en la evaluación de ninguna característica morfológica ni en clasificación de embriones según los criterios ASEBIR. Este resultado inesperado, podría deberse en parte, a que muchas características morfológicas embrionaria son transitorias y los criterios para evaluar dichas características no están bien definidos actualmente para las plataformas time-lapse (Hardarson et al., 2006; Chavez et al., 2012). Entre los usuarios de Primo Vision™ el grado de acuerdo fue significativamente menor en la evaluación de fragmentación y multinucleación posiblemente por limitaciones técnicas de esta plataforma Por este motivo cualquier nueva tecnología de selección de embriones debe ser evaluada antes de su incorporación a los laboratorios de reproducción asistida (Lundin y Ahlstrom, 2015; Harper et al., 2012). No se observa una disminución en la variabilidad entre laboratorios en la evaluación de asimetría entre usuarios de equipos time-lapse y EMEC. Estos resultados podrían explicarse porque, a pesar de que los equipos time-lapse disponen de herramientas para medir el diámetro celular, no todos los laboratorios las utilizan, no todos los laboratorios emplean la misma definición de asimetría y que la asimetría puede ser transitoria (Aparicio-Ruiz et al., 2016). La variabilidad entre centros en decisión clínica es menor entre usuarios que utilizan equipos time-lapse. Este puede deberse a la baja variabilidad observada en características morfológicas, que sólo pueden ser observados por time-lapse (Kirkegaard et al., 2012, Ciray et al., 2014), y que han sido relacionadas con una baja calidad embrionaria (Rubio et al., 2012; Athayde Wirka et al., 2014; Liu et al., 2015). Algunos autores han sugerido que el uso de algoritmos basados solo en eventos morfocinéticos debe complementarse con la observación de características morfológicas clásicas, ya sea con equipos time-lapse (Aparicio-Ruiz et al., 2016) o por EMEC (Kieslinger et al., 2016). Sin embargo, nuestros resultados muestran que esta práctica sigue presentando variabilidad entre laboratorios. Los resultados de nuestro estudio muestran que los laboratorios de embriología tienden a estar más de acuerdo en la evaluación de embriones de baja calidad que en los de alta calidad y en los embriones que deben descartase más que en los que deben transferirse, independientemente de la técnica de evaluación embrionaria utilizada, estos resultados coinciden con los publicados por Arce et al. (2006) y Castilla et al. (2010) para los usuarios de EMEC. Existen distintas limitaciones en este estudio. Los embriones evaluados por cada método son diferentes y han estado sometidos a diferentes condiciones de cultivo. Sin embargo, los tiempos de desarrollo de los embriones analizados fueron similares para cada una de las plataformas. Otra limitación es que se desconocen las tasas de implantación de los embriones evaluados y, por tanto, no se ha podido determinar, si la variabilidad entre laboratorios, observada en este estudio, en decisión clínica y en catalogación embrionaria puede reducir la efectividad de los ciclos de reproducción asistida. Por último, no se puede descartar la posibilidad del sesgo de participación ya comentada en el estudio anterior. Influencia del tipo de producto a analizar en un programa de control de calidad externo de citotoxicidad En nuestro estudio, se observa una tendencia a obtener resultados de S, E, VPP y VPP analizando puntas de pipeta, superiores a los publicados por Castilla et al. (2010). Esto podría deberse a que, en los años incluidos en nuestro estudio, los centros participantes solo utilizaron el TSE como test y solo analizan un tipo de material (puntas de pipeta), al contrario de lo que ocurría en el programa de CCExt cuando fue analizado por Castilla et al. (2010), en los que los centros emplearon diferentes métodos de evaluación y se analizaron diversos tipos de materiales tóxicos. Los resultados en S, E, VPP y VPN obtenidos en nuestro estudio analizando medios de cultivo son inferiores a los observados en el programa de CCExt de CT de la asociación americana de bioanalistas (AAB) (AAB, 2017). Estas diferencias podrían deberse a una diferente manipulación de los medios de cultivo para convertirlos en tóxicos en los dos programas de CCExt de CT analizados. Los laboratorios participantes detectan mejor los productos citotóxicos que los que no lo son. Desde un punto de vista clínico parece menos perjudicial equivocarse clasificando fungible no tóxico como tóxico que un fungible tóxico como no tóxico. Esta tendencia coincide con la observada por otros trabajos (Castilla et al., 2010; AAB, 2017). Los mismos laboratorios son más eficaces detectando toxicidad en puntas de pipeta que en medios de cultivo, estas diferencias pueden estar relacionadas con el método utilizado por los laboratorios para evaluar la CT de los fungibles. Cuando se evalúan puntas de pipeta, los espermatozoides control se encuentran en el mismo medio de cultivo que los espermatozoides que están bajo la influencia de la toxicidad de las puntas de pipeta. Sin embargo, cuando se evalúan medios de cultivo los espermatozoides control se encuentran en un medio diferente al que se encuentran los espermatozoides incubados con el medio problema. Otra posible causa podría ser que las condiciones de los fungibles durante el transporte, almacenamiento y manipulación en los laboratorios hasta su uso, afecte más negativamente a los medios de cultivo que a las puntas de pipeta (Nijs et al., 2009; Swain et al., 2012;). En nuestro trabajo no hemos ajustado por la experiencia previa de los centros en TSE, pero el hecho de no haber observado relación entre el porcentaje de aciertos en un laboratorio con medios de cultivo y puntas de pipeta sugiere, que las diferencias observadas se deben más al tipo de producto que a un factor de laboratorio. Conclusiones 1. La evaluación mediante morfología clásica de embriones sin anomalías morfológicas se realiza de forma fiable en los laboratorios de embriología. 2. Cuando se observan diferencias entre laboratorios y expertos en evaluación morfológica embrionaria clásica, se deben a la presencia de vacuolas o multinucleación en embriones en estadio de células y a masas celulares internas de baja calidad en estadio de blastocisto. Es necesario mejorar la formación de los embriólogos clínicos en la evaluación de estas características morfológicas al utilizar los métodos clásicos de evaluación embrionaria. 3. Deberían analizarse las políticas de transferencia embrionaria de los centros con el fin de lograr niveles más altos de acuerdo respecto al destino final del embrión cuando es evaluado con métodos morfológicos clásicos, especialmente cuando el destino final de los embriones en estadio de células debe ser crioconservar. 4. La variabilidad entre laboratorios en la determinación de los tiempos a los que ocurren los eventos embrionarios depende de la duración del evento. 5. Los equipos time-lapse han disminuido la variabilidad entre laboratorios en la decisión clínica tomada sobre embriones. Sin embargo, no han modificado la variabilidad existente entre laboratorios en la catalogación de embriones. 6. Es necesario estandarizar la interpretación de las alteraciones morfológicas embrionarias observadas en equipos time-lapse antes de incorporar estas características a los algoritmos diagnósticos que utilizan dichos equipos. 7. El tipo de fungible empleado en los controles de calidad externos de citotoxicidad del laboratorio de reproducción humana asistida influye en los resultados de estos. 8. La utilización de puntas de pipeta como fungible en un programa de control de calidad externo de citotoxicidad es fácil logísticamente y permite obtener resultados válidos en dichos programas. Sin embargo, no permite analizar controles de calidad de otras características (pH u osmolaridad) que pueden afectar a la viabilidad de gametos y embriones.