¿Cómo resolver los desafíos de MRD?

Superando los desafíos

Para mitigar los errores de secuenciación, se pueden utilizar métodos que utilizan códigos de barras moleculares (MBC), identificadores moleculares únicos (UMI), etc. (que son esencialmente todos iguales), donde cada molécula inicial se secuencia muchas veces. Las MBC se utilizan luego para generar secuencias consenso a partir de secuencias que probablemente se obtuvieron a partir de la misma molécula de partida. El supuesto es que los errores aparecen debido a procesos algo estocásticos y que las secuencias de consenso probablemente serán correctas. Esto requiere muchas observaciones de la misma molécula inicial, por lo que se recomendará generar 10 veces más secuencias que moléculas. Por lo tanto, con 8.000 equivalentes genómicos, podríamos querer apuntar a una profundidad de secuenciación de 80.000.

El uso de MBC duales, como es el caso de los ensayos SureSelect XT HS2 de Agilent, TSO 500 de Illumina, AVENIO de Roche, etc., permite además derivar secuencias consenso a partir de ambas cadenas de ADN de partida de una molécula. Si está presente una mutación somática en la molécula de partida, ambas cadenas deben respaldar la presencia de esa mutación. Si solo se observa una mutación aparente en una hebra, por ejemplo, debido a la desaminación de la citosina de la molécula de partida, es posible que no haya ningún apoyo para esa mutación de la otra hebra.

Sin embargo, los tipos de mutaciones que aparecen debido al ensayo y la secuenciación no son completamente estocásticos. Algunos tipos son mucho más comunes que otros y, al secuenciar muchas muestras normales, uno puede hacerse una idea de qué tipos de mutaciones tienen menos probabilidades de aparecer que otros. La desaminación de la citosina puede ocurrir mediante calentamiento, y el primer paso de la PCR, en el que se desnaturaliza el ADN y se activa una polimerasa termoestable, a menudo implica una incubación de varios minutos a ~ 94 ° C. Esto puede conducir a la formación de variantes C> T (que también se pueden observar como G> A). Sin embargo, estas variantes pueden tener poco apoyo de la otra cadena de ADN, excepto cuando lo tienen. Con un panel lo suficientemente grande, especialmente cuando hay pocas réplicas de moléculas iniciales, probablemente habrá algunas variantes C> T que superen la corrección de errores basada en MBC. Similar, A> G (T> C) ha sido ruidoso en los datos NGS que he mirado. Por lo tanto, si vamos a detectar variantes basadas en 1 o 2 observaciones, entonces puede ser útil evitar tipos de mutaciones que sean más ruidosas que otras, que pueden tener implicaciones para la gestión del ruido que pueden necesitar ser específicas de la plataforma y el ensayo. .

El objetivo de un ensayo de monitorización de MRD es diferente de un ensayo de ctDNA utilizado para la identificación de mutaciones somáticas. En la monitorización de la ERM, nos preocupa menos la detección de nuevas mutaciones somáticas que la detección de mutaciones previamente identificadas que se espera que estén presentes en el tumor. Por tanto, la calidad de todas las bases secuenciadas es menos importante que la calidad de las bases donde se cree que residen las mutaciones somáticas. Por lo tanto, si bien es posible que debamos llamar a variantes somáticas existentes con pocas observaciones, no estaríamos intentando llamar nuevas mutaciones somáticas.

Con un contenido tumoral bajo, las variantes somáticas se vuelven difíciles de detectar porque pueden no estar presentes en la muestra, o en una cantidad suficiente de copias. Una solución es buscar muchas variantes somáticas. Sin embargo, una muestra con una carga de mutaciones tumorales (TMB) baja de digamos 5 solo tendría alrededor de 10 en un panel de ctDNA de 2 megabase, cuya ejecución puede costar varios miles de dólares. Por lo tanto, es posible que deseemos utilizar paneles específicos de pacientes que solo busquen mutaciones que se encuentren en el tumor de este paciente. La secuenciación del exoma completo (WES) se puede utilizar como primer paso, si se dispone de una biopsia tumoral regular. Se esperaría que una muestra con un TMB de 5 tuviera alrededor de 150 variantes en los exones. Con los datos del genoma completo, puede haber 10,000 variantes para elegir. Con más variantes para elegir, hay más oportunidades para elegir variantes que puedan detectarse con buena sensibilidad y especificidad. La sensibilidad es importante porque queremos poder detectar variantes cuando están presentes. La especificidad es importante ya que, si vamos a detectar una variante con una sola observación, no queremos tener una sola observación de una variante que no está allí.

Figura 1 Blog de Yves, parte 2

Figura 1. La alta sensibilidad requiere decisiones tomadas a partir de pocas observaciones. Número esperado de variantes somáticas llamadas de 100 para un VAF dado y para diferentes números de observaciones mínimas requeridas para llamar a una variante en 30 ng de ADN (azul = 1, naranja = 2 y otros = 3 a 5 observaciones)

La sensibilidad obtenida al detectar variantes con una sola observación y que solo requiere que se detecte una de cada 100 variantes, según la guía de la FDA, podría permitir que el ensayo se use para ERM definido en ~ 0.01% VAF para seleccionar pacientes. Por otro lado, si necesitamos dos observaciones antes de que estemos dispuestos a llamar a una variante, entonces el LOD aumenta en un orden de magnitud. Si necesitamos llamar a más de una variante, entonces el LOD aumenta aún más.

Si logramos aumentar la entrada de ccfDNA, se espera que esto mejore la sensibilidad; siempre que aumentemos la profundidad de secuenciación en consecuencia. Además, también podríamos aumentar el número de variantes que buscamos. Sin embargo, como se mencionó anteriormente, un TMB de 5 corresponde a aproximadamente 150 variantes identificadas por WES y no todas pueden ser deseables (por ejemplo, C> T); y algunos pacientes pueden tener tumores con un número significativamente menor de mutaciones identificadas.

Validación de ensayos específicos de pacientes

Un panel de ctDNA regular proporciona muchos puntos de datos de rendimiento para las mismas ubicaciones en el genoma, lo que permite que el ajuste del ensayo de ctDNA y las tuberías asociadas funcionen bien para identificar variantes somáticas en esas ubicaciones. Sin embargo, los ensayos específicos del paciente son diferentes; y es posible que la validación deba incluir el proceso de diseñar muchos ensayos personalizados diferentes para variantes somáticas que se encuentran en todo el genoma, ya que cada paciente es diferente. A esto le seguirían evaluaciones de la sensibilidad y especificidad de esos ensayos personalizados para determinar si el enfoque cumple con los requisitos del usuario final para el monitoreo de MRD.

Para permitir dicha validación, el póster de LGC SeraCare presentado en la sesión virtual II de AACR titulado “Materiales de referencia para el monitoreo de enfermedades residuales medibles (MRD)” (# 1978) describe un nuevo conjunto de materiales de referencia para ensayos de MRD. Los materiales de referencia que aparecen en este póster utilizan líneas celulares de línea germinal emparejadas con SNP para un flujo de trabajo normal / tumoral.

El tumor y los componentes normales se pueden usar para WES u otros ensayos para identificar mutaciones somáticas en los componentes del tumor; o simplemente se pueden obtener los datos de WES de SeraCare. A continuación, se pueden diseñar ensayos personalizados para detectar esas mutaciones somáticas y evaluar la sensibilidad y la especificidad; el cartel describe un diseño de dos ensayos NGS MRD personalizados diferentes. Dado que los componentes tumorales tienen un TMB en el rango de 10-20 (~ 300 + mutaciones somáticas en exones) y son ~ euploides, los materiales de referencia pueden formularse para estudios LOD donde las mutaciones somáticas están presentes en frecuencias definidas.

Por lo tanto, si queremos determinar qué tan bien el ensayo de monitoreo de MRD detecta variantes somáticas a 0.01% VAF o incluso a 0.001% VAF o menos, entonces estos materiales de referencia pueden usarse. Curiosamente, los datos del póster muestran que cuando las variantes se eligen bien, es posible que las MBC no sean necesarias para evaluar las variantes somáticas con una VAF del 0,1% (al menos en un Illumina MiSeq con 8 muestras por celda de flujo). Sin embargo, la VAF al 0,1% es solo el punto de partida para la monitorización de la ERM, y la corrección de errores limitada puede permitir la detección de variantes somáticas a una VAF al 0,01% cuando se dirigen sólo a unas 20 mutaciones somáticas.

Un tercio de las mutaciones se usó para evaluar la sensibilidad en un componente tumoral dado, mientras que el resto de las mutaciones se usaron para evaluar la especificidad, ya que solo se esperaban en uno de los otros dos componentes tumorales. Al diseñar un único ensayo personalizado para evaluar la ERM en dos o más pacientes, las mutaciones que no se espera que se observen en un paciente determinado pueden usarse para evaluar la especificidad cuando se usan 1 o 2 observaciones para llamar una mutación somática. Si hay una señal más específica que ruido, es posible que todavía haya MRD.

Si bien el VAF al 0.01% estuvo cerca del límite de detección con aproximadamente 20 mutaciones somáticas analizadas por tumor (~ 0.02% de contenido tumoral), podríamos aumentar ese número a 100 mutaciones somáticas para nuestro ensayo personalizado para mejorar potencialmente el LOD, aunque, el ensayo puede ser más costoso de ejecutar debido a la necesidad de una secuenciación proporcionalmente mayor. Al mismo tiempo, las ~ 300 + mutaciones somáticas en los exones de cada componente tumoral podrían usarse para diseñar muchos ensayos personalizados y evaluar la capacidad de un ensayo personalizado dado para tener un rendimiento similar. Si se necesitan más mutaciones somáticas, entonces las mutaciones somáticas podrían determinarse también en intrones, o podrían usarse materiales de referencia derivados de componentes normales / tumorales emparejados con SNP adicionales.

Conclusiones

En conclusión, si vamos a diseñar ensayos para el monitoreo de MRD, entonces esos ensayos serán diferentes de los ensayos de ctDNA convencionales. Es posible que necesiten detectar variantes con menos observaciones manteniendo la especificidad para tener suficiente sensibilidad. Al mismo tiempo, es posible que deban personalizarse para las mutaciones somáticas en un paciente determinado, lo que significa que puede ser necesario validar todo el proceso, desde la identificación de la mutación somática, pasando por el diseño del panel NGS personalizado, pasando por la monitorización de la ERM. Afortunadamente, ahora hay materiales de referencia para esto: Materiales de referencia para el monitoreo de enfermedades residuales medibles (MRD) .

Diseño de ensayos específicos para pacientes
Para modelar el rendimiento ideal del ensayo, podemos usar distribuciones de Poisson y Binomial en Excel. Para determinar la fracción de variantes que tendrán al menos count_at observaciones dado un cierto número de observaciones promedio (avg_obs), se puede usar la siguiente ecuación:

= 1-POISSON.DIST ((count_at-1), avg_obs, TRUE)

Por ejemplo, si normalmente requerimos 5 observaciones de una variante para llamarla como presente y esperamos que una muestra contenga alrededor de 8 copias detectables de variantes, entonces usaríamos lo siguiente que predice que llamaríamos al 90% de tales variantes (nosotros integre el área de la distribución de Poisson para 0 a 4 observaciones, luego réstelo del área total de 1 para obtener el área para 5 o más observaciones):

= 1-POISSON.DIST ((5-1), 8, VERDADERO)

Si solo hay aproximadamente 2 copias detectables de cada variante, solo podríamos llamar aproximadamente al 5% de tales variantes. El número de variantes detectables se obtendría multiplicando eso por el número de variantes que estamos buscando. Entonces, cuantas más variantes busquemos, mayor será la probabilidad de detectar al menos algunas variantes. Sin embargo, buscar variantes más somáticas requiere secuenciar más. Además, la búsqueda de variantes más somáticas tiene el potencial de aumentar el número de variantes falsas positivas.

El intervalo de confianza para el número de variantes que llamaríamos presentes se puede obtener del número total de variantes (total_vars), la fracción de variantes detectables (fracción) y los límites superior e inferior del intervalo de confianza (ubicación; ya sea 0.025 o 0,975 para un intervalo de confianza del 95%):

= BINOM.INV (total_vars, fracción, ubicación)

En el ejemplo anterior, si solo hay alrededor de 2 copias detectables de cada variante y estamos buscando 100 variantes, entonces esperaríamos llamar entre 1 y 10 variantes el 95% del tiempo. Establecer la ubicación en 0.05 nos daría una idea del LOD ya que el 95% de las muestras tendrían al menos 2 de cada 100 variantes llamadas presentes cuando hay un promedio de aproximadamente 2 copias detectables de cada variante. Si esas dos denominadas variantes significan que la muestra es MRD positiva en nuestro ensayo, entonces nuestro LOD sería una muestra que promedia 2 copias detectables. Para 30 ng, eso sería un VAF promedio de 0.025%. Sin embargo, es probable que el 100% de la entrada no se pueda analizar y el 30% sea más típico. En ese caso, la VAF promedio estaría justo por debajo del 0,1%.

Sin embargo, es posible que queramos llegar al 0.01% o al 0.001% o incluso a un VAF promedio más bajo. WES para una muestra con un TMB de 5 nos dará alrededor de 150 variantes, pero no todas serán ideales. Para llegar a esos VAF promedio más bajos, debemos sentirnos cómodos con las variantes de llamada en 1 o 2 observaciones.

Temas: NGS , ctDNA , cfDNA , materiales de referencia , MRD