Abstract
Påvisning av sjeldne mutanter ved hjelp av neste generasjon sekvense har et betydelig potensial for diagnostiske applikasjoner. Detektering av sirkulerende tumor-DNA er den fremste anvendelse av denne tilnærming. Den største hindring for bruken er høy lesefeilraten av neste generasjons sequencere. Snarere enn å øke nøyaktigheten av endelige sekvenser, vi har oppdaget sjelden mutasjoner ved hjelp av en halvledersekvens og et sett av avviksdeteksjonskriterier basert på en statistisk modell av lesefeilhyppigheten ved hver feil posisjon. Statistiske modeller ble utledet fra sekvensdata fra normale prøver. Vi har oppdaget at epidermal vekstfaktor-reseptor (
EGFR
) mutasjoner i plasma DNA av lungekreftpasienter. Single-pass dypt sekvensering ( 100000 lesninger) var i stand til å oppdage en aktivering mutant allel i 10.000 normale alleler. Vi bekreftet metode med 22 potensielle og 155 retrospektive prøver, for det meste bestående av DNA renset fra plasma. En tidsmessig analyse foreslått mulige bruksområder for sykdom ledelse og for terapeutisk beslutnings å velge epidermal vekstfaktor reseptor tyrosin kinase hemmere (EGFR-TKI).
Citation: Kukita Y, Uchida J, Oba S, Nishino K, Kumagai T, Taniguchi K, et al. (2013) Kvantitativ Identifikasjon av Mutant Alleler Avledet fra Lung Cancer in Plasma Cell-Free DNA via Anomaly Detection Bruke Deep Sequencing data. PLoS ONE 8 (11): e81468. doi: 10,1371 /journal.pone.0081468
Redaktør: Raya Khanin, Memorial Sloan Kettering Cancer Center, USA
mottatt: 16 mars 2013; Akseptert: 13. oktober 2013, Publisert: 21.11.2013
Copyright: © 2013 Kukita et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet med tilskudd fra Osaka Medical Center for kreft og hjerte sykdommer. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
for noen molekylære målrettede legemidler mot kreft, undersøkelse av genomisk endringer i målgener har blitt en diagnostisk rutine og er uunnværlig for behandling beslutninger. For eksempel, de sterke effekter av epidermal vekstfaktor-reseptor tyrosin kinase hemmere (EGFR-TKI, dvs. gefitinib og erlotinib) er på ikke-småcellet lungekreft (NSCLC) korrelert med aktivering somatiske mutasjoner i
EGFR
[1,2]. Pasienter som er administrert disse stoffene er i dag valgt basert på tilstedeværelse av disse aktiverende mutasjoner. Identifiseringen av mutasjonene er basert på biopsiprøver; prosedyren er invasiv og ofte vanskelig å utføre. En ikke-invasiv diagnostisk prosedyre er ønskelig.
Cell-free DNA i blodet består av DNA som stammer fra kreft vev og har blitt studert for ikke-invasive diagnostiske prosedyrer [3]. Dette DNA, kalt sirkulerende tumor DNA (ctDNA), er sjelden i blodet, og dens oppdagelse er en teknisk utfordring. Et antall fremgangsmåter er blitt undersøkt, men de fleste av dem har begrensninger i følsomhet og robusthet. Strålte (perler, emulsjon, forsterkning og magnetisme) [4] er mest sannsynlig den mest sensitive metoden. I strålte, blir PCR-produktene amplifisert fra et enkelt molekyl festet til en enkelt magnetiske kuler ved hjelp av emulsjon PCR. Mutasjonssetet er merket med en fluorescerende probe eller primer-forlengelse, og den muterte allel er kvantitativt detektert ved å telle de fluorescensmerkede perlene. Strålte hell kvantifisert
APC Hotell og
KRAS
mutasjoner i ctDNA av pasienter med kolorektal kreft [5,6] og
EGFR
mutasjoner i ctDNA av lungekreftpasienter [7] . Til tross for sin høye følsomhet og kvantifisering evne, har strålte ikke fått i popularitet fordi det er en arbeidskrevende teknologi og krever oligonukleotider for hver mutasjon posisjon.
Fordi strålte og neste generasjons sequencere, dvs. massivt parallelle sequencere, bruker den samme eller en svært lik mal forberedelse teknikk, er det mulig å søke neste generasjons sequencere for samme formål. Det har vært flere studier på dypt sekvensering av cellefritt DNA [8,9]. Disse studiene antydet muligheten av tilnærming, men manglet kritisk vurdering av deteksjonssystemer. Spesielt de ikke ta opp problemet med multippel testing, noe som er iboende i diagnostiske applikasjoner.
I denne rapporten har vi etablert en metode for å påvise
EGFR
mutasjoner i ctDNA i perifert blod av lungekreftpasienter som bruker single-pass dypt sekvensering av forsterkede
EGFR
fragmenter . Den siste utviklingen av en halvleder sequencer (Ion Torrent PGM) [10] har adressert svakhetene i andre tilgjengelige sequencere (dvs. en lang driftstid for en enkelt analyse og høye driftskostnader) og er anvendbar for diagnoseformål. Vi anvendte uregelmessighet deteksjons [11,12] og bestemmes et sett av deteksjonskriterier basert på en statistisk modell av lesefeilhyppigheten ved hver feil posisjon. Metoden kvantitativt oppdaget
EGFR
mutasjoner i celle-fritt DNA på et nivå sammenlign til strålte, lovende ikke-invasiv diagnostikk som utfyller biopsi.
Resultater
Prinsipp for påvisning
Deep sekvensering av PCR-forsterket fragment som inneholder en mutasjon nettstedet kan gjennomføres for å påvise og kvantifisere muterte alleler blant de store mengder normale alleler avledet fra verts vev. Det store problem i forbindelse med denne tilnærmingen er hyppigheten av feil som innføres i løpet av sekvensering og PCR-amplifikasjon. Det avgjørende her er innstillingen og nøyaktig evaluering av deteksjonsgrenser. Når frekvensen av en baseendring på et mål locus er høyere enn en forutbestemt lese feilrate (RER), kan vi bedømme endringen å være på grunn av tilstedeværelsen av en mutant sekvens. Det vil si, anomalier som faller betydelig utsiden av RER fordeling regnes som mutasjoner. RER er definert som den feilraten beregnet fra endelige sekvensdata, inkludert feil i både sekvensering og PCR-trinn. I uregelmessighet deteksjon [11,12], som i hypotesetesting, falske positiver blir styrt basert på en statistisk modell. I vårt tilfelle, kan den statistiske modellen av RER konstrueres fra sekvensdata fra målregioner av et tilstrekkelig antall av normale individer som bærer ingen mutasjoner.
Hvis les det oppstår feil under en sannsynlighetsfordeling, antall lesninger som kreves for å oppnå en bestemt påvisningsgrense kan estimeres. Figur 1a viser forholdet mellom mutasjonen deteksjonsgrensen, lese dybde, og RER på et signifikansnivå på p = 2×10
-5 for hver enkelt deteksjons uten multiplisitet korreksjon, forutsatt at lesefeil oppstå etter en Poisson-fordeling. De data som er vist på figur 1a leveres i tabell S1. Med et økende lese- dybde og mink RER, reduseres deteksjonsgrensen. I en tidligere studie av vår gruppe [7], deteksjonsgrensen for sjeldne mutante alleler ved bruk strålte [4] var en av 10.000 (0,01%). Fordi en plasma DNA-analyseprøven inneholder omtrent 5000 molekyler, er dette deteksjonsgrensen rimelig. Dette målet kan oppnås med 100000 leser når RER er under 0,01%.
a, Forhold mellom lese feilrate, lese dybde, og deteksjonsgrensen for mutasjoner når signifikansnivået er p = 2×10
-5. Horisontal akse, lese dybde; vertikal akse, deteksjonsgrense (%). Fra topp til bunn indikerer hver linje en lesefeilhyppigheten (RER) på 1%, 0,2%, 0,05% eller 0,01%. b, tredimensjonal fremstilling av substitusjon RER. x-aksen, basis posisjoner av EGFR-eksoner 19-21. Fra venstre til høyre, pilene indikerer stillingene T790M, L858R, og L861Q. y-akse, 48 DNA-prøver fra normale individer. Fra foran til bak, konverteringer til A (grønn), er C (gul), G (magenta), eller T (blå) justert for hver prøve. z-aksen, RER (%). c, Tredimensjonal fremstilling av feil innsetting /sletting. x-aksen, basis posisjoner av EGFR-eksoner 19-21. Baren viser plasseringen av ekson 19 slettingen. y-akse, 48 DNA-prøver fra normale individer. Blå, plasma DNA; lyseblå, WBC DNA (store mengder); mørk blå, WBC DNA (små mengder). z-aksen, RER (%). d, Fordeling av RER. Hvit kolonne, substitusjon feil; grå kolonnen, innsetting /sletting feil. Horisontal akse, rekke RER (%); vertikal akse, insidens (%).
Lesefeil på
EGFR
mål omegn
For EGFR-TKI behandling, en aktive
EGFR
mutasjon er et tegn på behandlingseffekten [ ,,,0],1,2]. Pasienter som skal administreres disse stoffene er for tiden velges basert på tilstedeværelsen av disse aktiverende mutasjoner. I tillegg til å aktivere
EGFR
mutasjoner, en motstandsdyktig
EGFR
mutasjon kalt T790M vises i omtrent halvparten av pasientene utsettes for EGFR-TKI behandling [13,14]. Dermed tre aktiverende mutasjoner, dvs. en delesjon i
EGFR
ekson 19 og L858R og L861Q i
EGFR
ekson 21, samt T790M resistent mutasjon i
EGFR
ekson 20 ble valgt som mål loci.
Vi er fast bestemt på rers i en 169 basisområdet rundt målet loci bestående ved å utføre dyp sekvensering av DNA-prøver fra normale individer. Vi brukte en Ion Torrent PGM [10] sequencer for dette arbeidet. Single-pass sekvensering ble utført, og antall leser varierte fra 44 400 til 373 000, i snitt 162 000. Vi har anvendt tre typer av DNA-prøver: 19 plasma DNA-prøver med beløp tilsvarende pasientprøver, 16 leukocytter (hvite blodlegemer, WBC) prøver DNA med mengder som var 10 eller 50 ganger størrelsen av en pasients prøve, og 13 WBC DNA prøver med mengder som var en tiendedel av størrelsen av en pasients prøve. Vi delte substitusjon feil i fire mønstre, tilsvarende konvertering til A, C, G, eller T. Dermed var det 507 mulige typer erstatninger (169 basis posisjoner x 3 mønstre) i målområdet. En substitusjon RER er grafisk vist i figur 1 b, med unntak av omdannelsen fra G til A i posisjon 2361 på grunn av en hyppig SNP. Substitusjons rers er ikke ensartet, og de er heller uavhengige av hverandre, og høye rers er forbundet med spesifikke basisposisjoner. I tillegg er en substitusjonsmønster dominant ved hver basisposisjon. En innsetting /sletting RER er grafisk vist i figur 1c. Vi gjorde ikke skille mellom sletting og innsetting feil, som innsett blir ofte gjenkjent som slettinger og vice versa ved sekvenssammenstillingen programvare. RER innsetting /sletting er generelt høyere enn erstatningen RER. En tendens lik den som er av substitusjon er observert, ved at høy innsetting /sletting rers er forbundet med spesifikke basisposisjoner. Figur 1d viser fordelingen av rers. Det var betydelige forskjeller mellom substitusjon og innsetting /sletting rers. I 410 ut av de mulige 506 typer av substitusjon (81,0%), RER var lavere enn 0,01%. I motsetning til dette ut av de 169 typene innsetting /sletting, RER var lavere enn 0,01% i bare 79 (46,7%). Disse resultatene var enig med tidligere rapporterte observasjoner fra PGM plattformen [15]. De data som er vist i figurene 1b og 1c leveres i tabellene S2 og S3, respektivt.
På grunn av høy innsetting /sletting lesefeil, ansatt vi en spesiell metode for å detektere exon 19 delesjonsmutasjoner. Vi har utarbeidet åtte mal ekson 19 sekvenser med representative slettinger og skjermet slettingen sekvenser ved å matche dem med malen sekvenser. Denne metoden var ganske effektiv for siler ut lesefeil; ingen sekvenser med sletting lese feil ble funnet blant de 48 prøvene som ble testet.
Statistiske modeller av lesefeilrater og kriterier for anomali deteksjon
Vi deretter undersøkt statistiske modeller av lesefeil. I en Poisson-fordeling modell, blir gjennomsnittet og variansen av antallet forekomster forventet å være den samme og blir bestemt av intensiteten parameteren
lambda
. Her, i stedet for å bruke RER, ble lesefeil frekvens angitt som forekomst i 100000 leser, og dens gjennomsnittlige variansen og ved hver basisposisjon ble beregnet. Sammenhengene mellom gjennomsnittet og variansen er vist i figur 2a og figur S1 i File S1 for substitusjon og innsetting /sletting lesefeil, henholdsvis. I begge tilfeller, blir variansen er større enn den i en betydelig andel av tilfellene. I slike tilfeller vil anvendelse av Poisson-fordeling fører til økt antall falske positiver. Dette fenomen, kalt «overdispersion», er vanlig i biologiske studier, og i slike tilfeller er en negativ binomial fordeling påføres [16]. Overdispersion er på grunn av fluktuasjoner i intensiteten parameteren, og det er fornuftig å anta at intensiteten para følger en gamma-fordeling. Under dette scenariet, forekomsten nummer teoretisk følger en negativ binomial fordeling. I figur 2b, blir økningen i terskelen for substitusjon fra en Poisson til en negativ binomial fordeling plottet mot varians /gjennomsnittlig forhold på lesefeilen for substitusjonstyper der varians /gjennomsnittsforhold varierte fra 1 til 2. Når forholdet overskredet ca 01.02 til 01.04, var det en betydelig økning i terskel. Således har vi konstruert vår statistisk modell av hver substitusjons under de følgende kriterier.
a, leser Forholdet mellom gjennomsnittet og variansen av substitusjons feil presentert som antall per 100.000. Horisontal akse, gjennomsnitt; vertikal akse, varians. Den røde linjen viser hvor gjennomsnittet og variansen er like. b, forskjellen mellom terskler beregnet i henhold til en negativ binomisk fordeling og en Poisson-fordelingen. Terskelen er den minste antall base endringer i 100.000 leser møte nivået av statistisk signifikans (p-0,01). Horisontal akse, varians /gjennomsnittlig ratio av substitusjonslesefeil; vertikal akse, forskjell mellom terskler. De typer erstatninger som varians /gjennomsnittlig ratio varierte fra 1 til 2 er plottet. c, nøyaktighet for kvantifisering. Hvert datapunkt representerer gjennomsnittet av tre bestemmelser. Horisontal akse, fraksjon av mutante alleler i kunstige produkter; vertikal akse, brøkdel av mutante alleler estimert fra dyp-sekvensering. d, reproduserbarhet for kvantifisering. Horisontal akse, baseendring satsen i den første rettssaken; vertikal akse, baseendring hastighet i det andre forsøket.
1. Når den gjennomsnittlige lesefeil i 100000 leser var mindre enn 1, en Poisson-fordeling med λ satt til 1 ble påført (169 typer substitusjoner).
2. Når den gjennomsnittlige var større enn 1 og varians /gjennomsnittlig forhold på lesefeil var mindre enn 1,2, ble en Poisson-fordeling påført (15 typer substitusjoner).
3. Når den gjennomsnittlige var større enn 1 og varians /gjennomsnittlig forhold på lesefeil var større enn 1,2, ble en negativ binomial fordeling påført (323 typer substitusjoner).
ekson 19 sletting og L858R tilhørte den første kategorien, mens L861Q og T790M mutasjons nettsider tilhørte den andre og den tredje kategorier, henholdsvis. Påvisningsgrensene for ekson 19 delesjon og L858R, L861Q og T790M substitusjonsmutasjoner ved et signifikansnivå på p = 2×10
-5 var mindre enn 0,01% og mindre enn 0,01%, 0,01% og 0,05%, henholdsvis . I den følgende analyse, vi brukte p = 2×10
-5 som betydningen terskelen for hver enkelt deteksjon, uten å vurdere et mangfold korreksjon, forventer en falsk positiv på 50.000 prøvene.
Omrisset av metoden er 1) forsterkning av
EGFR
fragmenter med ekson-spesifikke primere fra plasma DNA; 2) dypt sekvensering av
EGFR
fragmenter med PGM ( 100 000 leser /fragment), som kombinerer PCR produktene; 3) matchende utgangs sekvenser med
EGFR
mal sekvenser; 4) påvisning av slettinger og erstatninger, og konvertering av antall hendelser i at 100.000 leser; og 5) evaluering av base forandrer seg med anomali deteksjonskriterier. I uregelmessighet påvisning, blir baseforandringer bedømt som mutasjoner, når antallet hendelser i 100000 leser er lik eller overskrider terskelverdien (exon 19 delesjon, 7, L858R, 7; L861Q, 12; T790M, 60). En skjematisk fremstilling er vist i Figur S2 i File S1.
Quantitativity og reproduserbarhet
Først undersøkte vi metodens kvantifisering evne. Vi forberedte testprøvene inkludert ulike fraksjoner av PCR-produkter av muterte
EGFR
fragmenter. Det var en veldig god linearitet (
r
= 0,998) mellom inokulert mengder av PCR produktene og de observerte mutant-til-normal allel forholdstall utledet fra dypt sekvensering (figur 2c). Vi undersøkte reproduserbarhet av fremgangsmåten ved bruk av plasmaprøver fra lungekreftpasienter hvis primære lesjoner ble bekreftet til å bære aktiverende mutasjoner. De fraksjoner av de mutante alleler målt i to forsøk er plottet i figur 2d. En høy overensstemmelse (
r
= 0,989) ble observert, med unntak av i prøver som inneholdt små mengder av de mutante alleler, tilsvarende en ca. 0,3% fraksjon av allelene er tilstede eller mindre. I disse tilfellene, den innledende fasen av PCR forsterkning var sannsynlig å være mislykket på grunn av lavt antall mutant maler, anslått til 15 eksemplarer eller mindre. Dermed grense for kvantifisering var ca. 0,3%.
Validering med prøver fra lungekreftpasienter
Vi har evaluert vår metode videre ved hjelp av lungekreft biopsiprøver, prøvetaking plasma DNA og primær lesjon samtidig som en del av en prospektiv studie. Resultatene for prøver fra 22 pasienter viste 86% samstemmighet (95% konfidensintervall, 66-95), 78% (44-93) følsomhet, og 92% (66-98) spesifisitet, sette vevet biopsi som standard. Resultatene er lovende med hensyn til utvikling av et diagnostisk verktøy for å komplettere lungekreft biopsi.
Vi deretter analysert totalt 155 prøver: 144 prøver fra plasma, åtte fra cerebrospinalvæsken, og ett hver fra urin, pleuravæske, og bronkial alveolar lavage. Som for plasmaprøver ble to eller flere prøver hentet fra 32 pasienter på forskjellige tidspunkter i sykdomsforløp. Alle de oppnådde data er vist i tabell S4. Kliniske data for pasienter, inkludert stadium, histologi, behandling og status av motstand mot EGFR-TKI er også oppført i denne tabellen. Blant de 33 pasienter som er forbundet med en primær lesjon som inneholder exon 19 delesjon, ble denne mutasjonen funnet i minst en av plasmaprøver fra 24 pasienter (72,7%). Av de 23 pasientene som de primære lesjoner utviste de L858R eller L861Q substitusjoner, ble disse mutasjoner funnet i minst en av plasmaprøver fra 18 pasienter (78,2%). En dobbel mutasjon (samtidig påvisning av ekson 19 sletting og L858R) ble observert i 12 plasmaprøver, selv om doble mutasjoner er ikke vanlig i biopsiprøver. Avvik mellom aktiverings mutasjon typene som er identifisert i biopsi og plasma DNA-prøver ble observert i fem plasmaprøver. T790M ble funnet i 13 ut av 57 plasmaprøver (22,8%) fra pasienter med EGFR-TKI motstand, og i 7 av 87 plasmaprøver (8,0%) uten EGFR-TKI motstand.
tidsmessige endringer av
EGFR
mutasjonsnivåer under sykdomsforløpet
Et betydelig antall prøver ble samlet inn fra samme pasient ved ulike tidspunkt i sykdomsforløpet. Tidsmessige endringer av
EGFR
mutasjon nivåer i plasma DNA fra pasienter med tre eller flere prøver er skjematisk vist i figur 3. På grunn av den relativt korte samplingsperioden ble prøver ble oppnådd fra bare en del av sykdomsforløpet i de fleste tilfeller . Vi har fokusert på to overganger: overgang på grunn av EGFR-TKI behandlingsstart og at etter å anskaffe EGFR-TKI motstand. Data før behandlingsstart ble oppnådd i seks tilfeller. En betydelig reduksjon i aktivering av mutasjon nivåer med behandlingen ble observert i alle tilfeller (p = 1.7×10
-4). Clearance av ctDNA ved behandlingsstart er et generelt fenomen.
Hver prikk representerer en tidspunkt for prøvetaking. Diagrammet er ikke nøyaktig representasjon av tidsskala, og bare rekkefølgen av punkter er gyldig informasjon. Tallene representerer
EGFR
mutasjoner i 10000 sekvens lyder: svart, ekson 19 sletting; blå, L858R; rød, T790M. Bare tall som overstiger grensene vises. «Mutation type» indikerer at i biopsiprøver.
Data ble innhentet både før og etter oppkjøpet av EGFR-TKI motstand i syv tilfeller. Etter å skaffe motstand, ble aktiveringen av mutasjonen nivå økt i fem pasienter (218, 226, 259, 61, 66), redusert i en pasient (44), og øker med forsinkelse i en annen pasient (178). Økning av aktivering av mutasjoner kan korrelere med sykdomsprogresjon. Til tross for den klare sammenhengen mellom T790M og EGFR-TKI-motstand status i over valideringsstudie, dynamikk T790M under sykdomsforløpet var ikke så klar som for aktivering av mutasjoner; T790M ofte dukket opp før anskaffe motstand.
Tre pasienter er beskrevet i mer detalj. Pasient 226 ble behandlet med gefitinib som første linje kjemoterapi. Den gefitinib behandling ble stoppet flere ganger på grunn av bivirkninger. En radiologisk respons (partiell respons, PR) ble observert fra måned 1 til måned 9, og sykdomsutvikling ble observert i måned 10. Før gefitinib behandling, brøkdel av den mutante allel var svært høy (mer enn 50%), men etter bare en uke av denne behandling brøkdel av det mutante allelet ble redusert til 0,3%, før eventuelle radiologiske forandringer (fig S3A i File S1). T790M dukket opp på 10 måneder når sykdomsprogresjon begynte. Pasient 243 også utstilt en skjev nedgang i mutant allel fraksjonen ved oppstart av gefitinib behandling (figur S3b i File S1). Denne pasienten ble behandlet med kirurgi og kjemoterapi adjuvant (CDDP pluss VNR) tidligere, og deretter utsatt for gefitinib. Pasient 41 presentert med progresjon av neoplastisk meningitt, og ble underkastet kombinert erlotinib-pemetrexed terapi. Tidligere behandlinger var CDDP pluss gemicitabine, gefitinib, og erlotinib. En mindre radiologisk respons ble observert fra måneder 1-4, og sykdomsprogresjon forekom senere. Det var en skjev reduksjon i mutant allel fraksjonen ved begynnelsen av behandlingen, og økningen på sykdomsutviklingen var bare liten (figur S3c i File S1). Det bør bemerkes at respose av ctDNA til EGFR-TKI behandlingsstart var rask i alle tre tilfellene (pasient 229, en uke, 243, to uker, 41, en måned).
Mutasjon deteksjon på hele målet omegn
Vi har utforsket mulighetene for å identifisere substitusjons mutasjoner i hele målet
EGFR
region som tilsvarer 503 typer erstatninger, eksklusive L858R, L861Q og T790M. Fordi signifikansnivå ble satt til p = 2×10
-5 for hver deteksjon, var falske positiver forventet å dukke opp en gang i 100 prøver. I virkeligheten ble en median på tre erstatninger funnet per prøve. Fordelingen av antall substitusjoner pr prøve er vist i figur 4a. Basert på erfaringene fra biopsiprøver, de fleste av disse erstatningene var sannsynlig å være falske positiver. En betydelig fraksjon av de forskjellige typer av substitusjoner presentert ingen falske positiver (56,2%, figur 4b), og de statistiske modeller var av praktisk bruk med slike substitusjoner. For andre, parameterestimering fra data fra 48 normale individer var ikke tilstrekkelig konservative for utelukkelse av falske positiver.
a, Fordeling av antall ulike typer erstatninger dømt som mutasjoner per prøve. Horisontal akse, antall av typene substitusjoner; vertikal akse, antall prøver. b, Fordeling av antall sampler med en substitusjonstypen bedømt som en mutasjon. Horisontal akse, antall prøver med en substitusjonstypen bedømt som en mutasjon; vertikal akse, hvor mange av de typer substitusjoner.
Diskusjoner
Rare mutasjon deteksjon av mål loci gjennom dyp sekvensering av plasma celle-fritt DNA har en tilsvarende følsomhet for overføring. Spesifisiteten er også akseptabelt fordi
EGFR
mutasjon typer i biopsi og plasmaprøver viste en høy samstemmighet. Dermed har sjelden mutasjon deteksjon med dyp sekvense nå nådd et tilstrekkelig nivå for å fortsette til bekreftelse gjennom en prospektiv studie. Fremgangsmåten kan anvendes på et begrenset antall av mål-loci som helst sokkelposisjon; ved hjelp av de to-end-metoden eller sekvensering fra den motsatte retning vil øke nøyaktigheten av høy feilfrekvens posisjoner, noe som øker sensitiviteten og spesifisiteten til akseptable nivåer.
Det er imidlertid vanskelig å forlenge mutasjon deteksjon til et større område. Forekomsten av falske positiver er ikke akseptabelt for diagnostiske applikasjoner. Parameterestimering med økt antall normale prøver og /eller mer konservative estimeringsmetoder, som for eksempel Bayesiansk inferens, kan redusere falske positiver. Vi brukte mutasjon fritt DNA fra normale individer for kartlegging av lesefeil, men mutasjonsdeteksjon ble utført med plasma DNA fra lungekreftpasienter. En mulig årsak til manglende terskler kan være forskjellen på DNA kvalitet. Den nylige oppdagelsen av kunstig mutasjoner introdusert i løpet av forsøksfremgangsmåter [17] antyder muligheten for fortsatt uoppdagede årsaker til gjenstander ved hjelp av plasmaprøver.
Vår prosedyre er optimalisert for våre mål og sosialt miljø, men det er rom for tekniske forbedringer. I tillegg til den sammenkoblede-end metoden [9], til metoder produsere feilfrie sekvenser gjennom gjentatte sekvensering av maler fra et enkelt molekyl [18,19] kan være aktuelt for å forbedre nøyaktighet. Vi benyttet små mengder plasma DNA for PCR forsterkning på grunn av de etiske standarder for våre sykehus og relevante regionsykehusene. Men i en annen sosiale miljø, ved hjelp av en økt mengde av plasma DNA kan forbedre reproduserbarheten av påvisning av lavnivå mutasjoner.
I tillegg til å bli benyttet for ikke-invasiv diagnose av
EGFR
mutasjoner, slik som vist i ovennevnte tidsmessige analyser, er denne metoden også informative for å belyse dynamikken i mutante alleler i løpet av sykdommen. Særlig bør det bemerkes at en skjev reduksjon i det mutante allelet fraksjonen forut for radiologiske forandringer, noe som sannsynligvis vil være nyttig for prediksjon av legemidlets effekt.
Biopsi av avanserte saker og gjentatte biopsier er teknisk krevende, og erstatning med en ikke-invasiv metode ville være fordelaktig. I denne sammenheng vil overvåke T790M med vår metode har betydelige fordeler for pasientbehandling. For eksempel vil påvise T790M mutasjon i blodprøver være nyttig for pasienten utvalg for behandling med ny EGFR-TKI for lungekreft som er resistente mot gefitinib og erlotinib [20].
Nyere to studier tyder på andre muligheter for ctDNA analyse. Dawson et al. fulgt dynamikken i ctDNA ved metastatisk brystkreft pasienter som bruker mutasjoner i
TP53 Hotell og /eller
PIK3CA
, og funnet sin fortjeneste for å overvåke sykdomsutvikling [21]. Bruk av vanlige mutasjoner kan muliggjøre dens anvendelse på en rekke forskjellige tumorer. Tvert imot, er vårt forskningsfokus mer spesifikk, dvs. mutasjonsdeteksjon for terapeutisk beslutninger, selv om vår metode kan også brukes til sitt formål. Murtaza et al. utføres exome sekvensering ved hjelp av plasma DNA fra kreftpasienter [22], kan Analyse av kreft genomer på ethvert stadium av sykdomsforløpet avdekke genetiske endringer som fører til sykdomsprogresjon eller resistens. Analyse av ctDNA vil ha en dyp verdi i vitenskapelige og diagnostiske aspekter av kreftforskning.
Materialer og metoder
Pasient egenskaper
Pasienter med aktiverende EGFR mutasjoner i tumorvev ble rekruttert på Osaka Medical Center for Cancer og hjerte- og karsykdommer. Pleuralvæske, cerebrospinalvæske og /eller urinprøver ble samlet fra noen pasienter. I alle pasientene, aktivering
EGFR
mutasjoner ble funnet i biopsiprøver ved hjelp av PNA-LNA PCR-klemme-metoden [23]. Responsen på behandlingen og sykdomsprogresjon ble i hovedsak vurdert ut fra radiologiske data basert på RECIST kriterier [24].
ekstraksjon av DNA fra væskeprøver
Plasma ble fremstilt via sentrifugering av 4-5 ml EDTA-behandlet blod ved 800
g
i 10 minutter ved romtemperatur. Plasmaet ble overført til et nytt rør og på nytt sentrifugert ved 15 100
g
i 10 minutter ved romtemperatur. Etter sentrifugering ble den øvre plasma overført til et nytt rør. Pleurale fluid og urinprøver ble sentrifugert ved 800
g
i 10 minutter ved romtemperatur, og supernatantene ble overført til nye rør. Sentrifugerte væske prøver ble frosset ved -80 ° C til DNA-ekstraksjon. Cerebrospinalvæsken ble frosset uten sentrifugering. DNA ble ekstrahert 1,5 til 2,0 ml av en væskeprøve (eller 5 ml urin) ved hjelp av QIAamp sirkulerende nukleinsyre kit (Qiagen, Hilden, Tyskland) i henhold til produsentens instruksjoner. DNA-konsentrasjonen ble bestemt ved å måle kopi antall LINE-1 [25] eller bruke qubit ssDNA Assay Kit (Life Technologies, Carlsbad, CA, USA).
Amplicon bibliotek konstruksjon og dyp sekvense
Sequencing bibliotek konstruksjon.
For å forsterke mål regioner av
EGFR
genet, PCR primer parene ble utformet med Primer3 (https://frodo.wi.mit.edu/). Primerpar har 5-nt indekser (for å diskriminere personer) og adapter sekvenser for halvleder-sekvensering. Posisjonene til PCR-mål-regioner og Primersekvensene er vist i tabell S5. PCR-amplifikasjon ble utført i en 50 ul reaksjonsblanding inneholdende plasma DNA oppnådd fra 300 pl av plasma (10 ng eller mer), 20 pmol av hver primere og en enhet av KOD -Plus- DNA-polymerase (Toyobo, Osaka, Japan). Å analysere lesefeil, brukte vi genomisk DNA fra plasma eller leukocytter fra friske individer som PCR mal. Den sykle profil var som følger: 2 minutter ved 94 ° C for innledende denaturering, etterfulgt av 40 sykluser med 15 sek ved 94 ° C for denaturering, 30 sek ved 55 ° C for gløding og 50 sek ved 68 ° C for forlengelse. Produktene ble renset ved anvendelse av QIAquick 96 PCR Purification Kit (Qiagen) eller MinElute PCR Purification Kit (Qiagen), og DNA-konsentrasjonen ble bestemt ved bruk av Quant-iT ™ PICOGREEN® dsDNA Assay Kit (Life Technologies) eller en ND-1000
Hjelpemiddel Informasjon
Fil S1. Figur S2. Figur S3.