Base de datos de imágenes con capacidad de búsqueda de Cric como plataforma pública para datos de citología de frotis de Papanicolaou convencionales

Sin embargo, la prueba de Papanicolaou sigue siendo fundamental, ya que la positividad para VPH oncogénico aún requiere información citológica6,7 como seguimiento. Incluso con el diagnóstico molecular, la prueba de Papanicolaou sigue siendo el método de detección utilizado en los países de bajos ingresos: su reemplazo por métodos más costosos es una realidad lejana3. Incluso en los países de ingresos altos, la implementación bien estructurada de los programas de prueba de Papanicolaou ha reducido la incidencia y las tasas de mortalidad por cáncer de cuello uterino hasta en un 65 % en los últimos 40 años8. A pesar del uso global de la prueba de Papanicolaou para detectar el cáncer de cuello uterino, tiene limitaciones inherentes9, entre ellas, que es laboriosa, lo que destaca la necesidad de estrategias que generen resultados más precisos y con menores tasas de falsos negativos, falsos positivos e insatisfactorios. resultados. Debido a que la interpretación visual requiere mucho tiempo, es subjetiva y requiere una interacción humana altamente especializada10,11,12,13,14,15, los crecientes esfuerzos en las últimas décadas se han dirigido a desarrollar un análisis automatizado de los datos de frotis de Papanicolaou. En los últimos años, se han propuesto algoritmos de aprendizaje automático para abordar estos desafíos. Uno de los requisitos más cruciales para un sistema automatizado con tecnología de visión por computadora y técnicas de aprendizaje automático es una colección de cientos (si no miles) de imágenes escaneadas bien organizadas y de alta calidad de pruebas de Papanicolaou y metadatos asociados.
Los datos existentes FAIR (Findable, Accessible, Interoperable, and Reusable)16 sobre las pruebas de Papanicolaou son limitados y sin representación de células con alteración preneoplásica de todas las clases, en su mayoría compuestas de células recortadas, imágenes sintéticas no estandarizadas y líquido. basada en citología17,18,19,20,21,22,23. Los datos FAIR más utilizados en estudios de clasificación de imágenes de frotis de Papanicolaou para la detección de lesiones cervicales son la base de Herlev5,17,21,22,24. Esta base de datos incluye un total de 917 imágenes: cada imagen contiene una única célula cervical y se asigna a una de las siete clases de lesión preneoplásica. Otros datos FAIR utilizados en los estudios de clasificación de imágenes de frotis de Papanicolaou incluyen la base de datos SIPaKMed25, con 4049 células (en 966 imágenes) asignadas a una de cinco categorías de tipos de células, sin preneoplásico. Otro problema con la mayoría de las bases de datos, incluidas Herlev y SIPaKMed, es que no están clasificadas de acuerdo con la nomenclatura del Sistema Bethesda, creada en 1988 para estandarizar la terminología de la citología cérvico-vaginal a fin de reducir la alta variabilidad en el informe de los resultados.
El sistema Bethesda se considera la terminología más utilizada, consistente y reproducible entre diferentes patólogos y laboratorios26,27. Otra complicación es que muchos trabajos anteriores se han basado en colecciones de imágenes con celdas recortadas y/o imágenes “limpias” poco realistas, similares a las de la citología en base líquida10,20,25,28. La Figura 1 ilustra la gran diferencia entre las imágenes adquiridas mediante citología convencional y de base líquida. La citología convencional muestra superposición de células, leucocitos, glóbulos rojos y moco, y el cuadro es extremadamente variado y significativamente más complejo de analizar que el de la citología en base líquida, que muestra homogeneidad en la distribución celular y ausencia de factores que oscurezcan29. Ilustración de (a) citología convencional y (b) citología de base líquida. La creación y entrega de una base de datos de imágenes reales de citología convencional a partir de pruebas de Papanicolaou tendrá un gran impacto en la visión artificial y los métodos de aprendizaje automático para el descubrimiento de conocimientos. Permite la comparación de algoritmos existentes, así como el estudio de nuevas metodologías de predicción mucho más realistas desde el punto de vista biológico, y necesarias para que estos métodos sean útiles para el cribado rutinario del cáncer de cuello uterino.
Hay por tanto dos grandes retos: algoritmos que permitan la identificación y clasificación de las células de forma precisa, y una base de datos completa y representativa con información precisa que permita el desarrollo/aprendizaje de metodologías automáticas para apoyar la decisión del profesional. Este artículo presenta una plataforma basada en la web y utiliza esta plataforma para respaldar el desarrollo de una nueva base de datos de células cervicales, "CRIC Cervix", una colección de imágenes obtenidas de una prueba de Papanicolaou convencional. El Centro para el Reconocimiento e Inspección de Células (“CRIC”) es un consorcio colaborativo de investigadores que tiene como objetivo proporcionar colecciones de células a la comunidad científica. Las imágenes de CRIC Cervix son similares a las obtenidas durante un examen, con muchas células por imagen y una resolución de 150 dpi. Los citopatólogos clasificaron las células según el protocolo definido por la nomenclatura del Sistema Bethesda. Además de células individualmente identificadas y clasificadas manualmente por diferentes especialistas, el campo de imagen completo de las células recogidas también tiene un diagnóstico.
Las células presentes en los fluidos pleural, pericárdico y peritoneal normales incluyen un bajo número de células mesoteliales y, en ocasiones, células inflamatorias. Las células mesoteliales están presentes en pequeños grupos o como individuos. Si se separan del revestimiento de la cavidad durante el proceso de recolección, las células mesoteliales se parecen a las células escamosas con una relación N/C baja y abundante citoplasma débilmente basófilo. Históricamente, las células con esta morfología se han denominado células mesoteliales "pálidas". Las células mesoteliales normales que están presentes en el líquido antes de la recolección son redondeadas y bastante basófilas (células mesoteliales “oscuras”). Miden entre 25 y 35μ de diámetro. Los núcleos están ubicados en el centro, redondos y uniformemente granulados. El citoplasma es abundante. La característica más llamativa de estas células es la presencia de un borde en cepillo periférico eosinofílico o "falda". Las células inflamatorias presentes en los fluidos normales tienen la morfología de los leucocitos normales de sangre periférica. El glóbulo blanco predominante observado varía según la especie. En perros y caballos, los neutrófilos son frecuentes. En gatos y bovinos predominan los linfocitos.
