PLoS ONE: Sirkulasjons microRNAs som ikke-invasive biomarkører for tidlig deteksjon av ikke-småcellet lungekreft

Abstract

Bakgrunn

Påvisning av lungekreft på et tidlig stadium av sensitive screeningtester kan være en viktig strategi for å bedre prognose. Vårt mål var å identifisere et panel av sirkulerende microRNAs i plasma som skal bidra til tidlig diagnostisering av lungekreft.

Materiale og metode

plasmaprøver fra 100 tidlig stadium (jeg IIIA) ikke- småcellet lungekreft (NSCLC) pasienter og 100 ikke-kreft kontroller ble screenet for 754 sirkulerende microRNAs via QRT-PCR, ved hjelp av TaqMan mikroRNA Arrays. Logistisk regresjon med en lasso straffe ble brukt til å velge et panel av microRNAs som diskriminerer mellom saker og kontroller. Intern validering av modellen diskriminering ble gjennomført ved å beregne bootstrap optimisme korrigerte AUC for den valgte modellen.

Resultater

Vi identifiserte et panel av 24 microRNAs med optimal klassifisering ytelse. Kombinasjonen av disse 24 microRNAs alene kunne diskriminere lunge krefttilfeller fra ikke-kreft-kontroller med en AUC på 0,92 (95% KI: 0,87 til 0,95). Denne klassifiseringen forbedret til en AUC på 0,94 (95% KI: 0,90 til 0,97) etter tilsetning av kjønn, alder og røykestatus til modellen. Intern validering av modellen tyder på at den diskriminerende effekt av panelet vil være høy når den brukes til uavhengige utvalg med en korrigert AUC på 0,78 for 24-miRNA panel alene.

Konklusjon

Vår 24 -microRNA prediktor forbedrer lungekreft prediksjon utover det kjente risikofaktorer

Citation. Wozniak MB, Scelo G, Muller DC, Mukeria A, Zaridze D, Brennan P (2015) Sirkulasjons microRNAs som ikke-invasive biomarkører for tidlig deteksjon av ikke-småcellet lungekreft. PLoS ONE 10 (5): e0125026. doi: 10,1371 /journal.pone.0125026

Academic Redaktør: Jörg D. Hoheisel, Deutsches Krebsforschungszentrum, TYSKLAND

mottatt: 16 oktober 2014; Godkjent: 19 mars 2015; Publisert: 12. mai 2015

Copyright: © 2015 Wozniak et al. Dette er en åpen tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Data Tilgjengelighet: The TaqMan Menneskelig mikroRNA Array eksperimenter er MIAME kompatibel og har blitt deponert på NCBI Gene Expression Omnibus (GEO) database (https://www.ncbi.nlm.nih.gov/geo) under tiltredelse GSE64591

Finansiering:. den forfatterne fikk ingen spesifikke midler til dette arbeidet

konkurrerende interesser:.. forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Lungekreft er den vanligste årsaken til kreft død på verdensbasis. I 2012 ble 1,82 millioner nye tilfeller, og 1,59 millioner dødsfall på grunn av lungekreft innspilt, som representerer henholdsvis 13% av alle krefttilfeller og 19% av alle kreftdødsfall [1]. Ikke-småcellet lungekreft (NSCLC) står for ca 80-85% av alle lungekrefttilfeller og består primært to histologiske typer: adenokarsinom (AC) og plateepitelkarsinom (SCC). Til tross for fremskritt i terapi, [2] er en samlet 5-års overlevelse på bare 16% hovedsakelig på grunn av sent stadium ved diagnose. Påvisning av lungekreft på et tidlig stadium av sensitive screeningtester kan være en viktig strategi for å forbedre kreft prognose lunge.

The National Lung Screening Trial (NLST) med lavdose spiral computertomografi (LDCT) i høy- risiko individer viser at en 20% reduksjon i kreftspesifikk dødelighet lunge og en 6,7% reduksjon i total mortalitet [3] kan oppnås. Likevel høye falske positive tallene for NLST [4], kostnader og mulige skader fra stråling aktualiserer behovet for enklere, ikke-invasiv og mer tilgjengelige metoder for effektiv påvisning tidlig kreft som komplementære biomarkører.

microRNAs (mirnas) er en gruppe av små (~ 22-nukleotider lang) non-koding, single-strandet RNA som regulerer genuttrykk post-transcriptionally. Aberrasjoner i miRNA ekspresjonsnivåer har blitt funnet i forbindelse med onkogenese og tumormetastase [5], inkludert NSCLC. Mer enn 2500 mennesker mirnas sekvenser er for tiden kjent [6]. Flere studier har vist at serum og plasma mirnas (kalt sirkulerende mirnas) til stede store løftet som nye ikke-invasive biomarkører for tidlig diagnose av ulike kreftformer på grunn av deres enkle tilgang og langsiktig stabilitet [7,8]. I lungekreft, har flere miRNA uttrykk profiler blitt identifisert med bemerkelsesverdig høye prediktive verdier, inkludert en 34-miRNA diagnostiske signatur med en AUC på 0,89 [9], en 10-miRNA panel med en AUC på 0,97 i serum samt 16-miRNA forholdstall som en signatur av risiko (AUC: 0,85) og diagnose (AUC: 0,88) [10,11] i plasmaprøver fra NSCLC pasienter

Tidligere studier har vist betydelige uoverensstemmelser selv om disse var basert på begrensede utvalgsstørrelser. eller brukes kandidat miRNA tilnærminger. I tillegg eksisterer et nivå av kontrovers ved at mirnas identifisert i blodet bare indikere forandringer i blodcellene sekundært til en generell dårlig helsetilstand og er ikke spesifikk for tilstedeværelse av kreft i et målorgan. Selv om målingen av miRNA ekspresjon i plasma eller serum er blitt foreslått som en lovende tilnærming i å diagnostisere lungekreft, krever konseptet ytterligere undersøkelser for å demonstrere sin potensielle anvendelse som et klinisk anvendelse. Det er ingen sterke bevis om hvorvidt serum eller plasma er overlegen for miRNA evaluering, men de siste rapportene tyder på at plasma kan være den foretrukne prøven valg gitt at RNA frigjøres under koagulering prosessen kan endre sammensetningen av sirkulerende miRNAs i serumprøver [12 ].

Her presenterer vi et genom-wide miRNA uttrykket skjermen i plasmaprøver fra 100 NSCLC tilfeller og 100 kontroller der vi bestemt en miRNA signatur med høy diagnostisk verdi som ble identifisert gjennom strenge statistiske metoder.

Resultater

Study befolkningen

Det som kjennetegner 200 deltagerne, inkludert 65 pasienter med lunge SCC, 35 pasienter med lunge AC og 100 kontroller er presentert i tabell 1. Det var en forskjell i kjønn (flere menn blant de tilfeller), alder ved intervju (tilfellene var i gjennomsnitt 1,5 år eldre enn kontroller), røykestatus (15% flere som røyker blant tilfeller) og alkohol drikking status (tilfeller inkludert 12% mer tidligere alkohol forbrukere). Lungecancerpasienter var av en tidlig IA-IIIA stadium. Gjennomsnittlig oppfølgingstid var 2,48 år. I løpet av denne oppfølgingsperiode, 64 av de 100 tilfellene døde og 36 fortsatt var i live ved å sensurere.

Micro-RNA profiler i plasma

For å vurdere om spesifikke miRNA signaturer kan påvises i plasmaprøver fra pasienter med tidlige stadier av NSCLC, utførte vi en high-throughput skjermen på 754 mirnas bruker TaqMan menneske mikroRNA Arrays. I gjennomsnitt 235 og 115 mirnas ble oppdaget på kort A og kort B, henholdsvis (til stede i minst 80 av 200 prøver i begge tilfeller eller kontroller) (fig 1). De miRNA uttrykk profiler i plasma var quantile normalisert og forskjells uttrykk analyser mellom NSCLC prøver og kontroller. Av 350 oppdaget mirnas i plasma, ble 61 mirnas funnet å være signifikant forskjellig uttrykt mellom lungekreft tilfellene og kontroller (35 på kort A, 26 på kortet B), inkludert 33 oppregulert og 28 downregulated mirnas (p-verdi 0,05). Disse besto av 21 mirnas forskjellig uttrykt med betydelig justerte p-verdi korrigert for multippel testing (tabell 2). Til tross for den betydelige differensial uttrykk, overvåket hierarkisk clustering analyse viste at dette settet med 61 mirnas var ikke i stand til å skille klart mellom lungekreft tilfellene og kontroller (S1 Fig).

prediksjonsmodeller

for å velge et panel av miRNAs skille mellom saker og kontroller, ble en logistisk regresjonsmodell med lasso straff montert. Denne analysen identifisert et panel av 24 plasma mirnas med en optimal klassifisering ytelse (S2 og S3 figurene). Tabell 3 viser en oversikt over utvalgte miRNAs i panelet. Multippel logistisk regresjonsanalyse viste at kombinasjonen av de 24 mirnas alene kan diskriminere lunge krefttilfeller fra kontrollene med svært høy AUC på 0,92 (95% KI: 0,87 til 0,95). I den logistiske modellen inkludert 24-miRNA panel og justert for hoved lungekreft risikofaktorer, nemlig kjønn, alder på intervju og røykestatus, klassifiseringen forbedret til en AUC på 0,94 (95% KI: 0,90 til 0,97) (fig 2) . Forbedringen i omfanget av diskriminering knyttet til 24-miRNA panelet er betydelig sammenlignet med de viktigste lungekreft risikofaktorer alene. AUC for hele logistiske modeller med og uten 24-miRNA panel var 0,94 (95% KI: 0,90 til 0,97) og 0,72 (95% KI: 0,65 til 0,78), henholdsvis (figur 3). Prediktiv verdi var av samme størrelsesorden (AUC: 0,95; 95% KI: 0,91 til 0,98) når du skifter kategorisk røykestatus variabel ved kontinuerlig pack-årene variabel. Spesielt, selv om avledet fra begge histologiske typer, 24-miRNA panel utføres like godt i begge ACs (AUC: 0,94) og SCCS (AUC: 0,96). Tilsvarende prediktoren gode resultater for kreft i alle stadier (IA-IIIA), med en AUC på 0,96 for trinn I (IA og IB; n = 49) pasienter, 0,98 for trinn II (trinn IIA og IIB; n = 21) pasienter og 0,97 for stadium IIIA (n = 30) pasienter (data ikke vist).

Intern validering av utvalgte 24-miRNA panel modell (dvs. validering sto for variasjon på grunn av parameterestimering) ved hjelp av bootstrap optimisme korrigert AUC tyder på at den diskriminerende effekt av panelet vil være høy når den brukes til uavhengige utvalg (korrigert AUC for 0,86 for 24-miRNA panel alene, 0,87 for modellen inkludert kjønn, alder og røyking status og 0,89 for modellen med paknings år variabel). Bootstrap optimisme korrigert AUC som tok hensyn til hele miRNA klassifikator utvelgelsesprosessen (straffet Lasso logistisk regresjon) var 0,78.

Diskusjoner

Til tross for omfattende forbedringer av bilde og kombinerte behandlingsmetoder, 5- års overlevelse av lungekreft har økt marginalt de siste tiårene [2]. En ikke-invasiv, biomarkør-drevet stratifisering av tidlig stadium lungekreft kan derfor utfylle LDCT screening og forbedre behandlingen ledelse. Vi har utviklet et panel av 24 plasma miRNAs i stand til å skille ut tidlig stadium NSCLC tilfeller fra styringer med høy AUC på 0,92 etter screening 754 mirnas i 100 NSCLC pasienter og 100 ikke-kreft individer. Dette settet med miRNAs ble identifisert gjennom svært strenge statistiske metoder. Så vidt vi vet er dette også en av de største utforskende studier av miRNA i plasma. Tester som disse demonstrere flere fordeler i klinisk setting med ingen krav til invasiv prøvetaking ( «flytende biopsi»), lave kostnader sammenlignet med bildeteknikker, enkle laboratorieprosedyrer og inkludering av et panel av biomarkører i stedet for en enkelt miRNA.

til dags dato har flere studier rapportert miRNA profiler i plasma og serum utviklet for diagnostisering av NSCLCs [9-11,13-16]. Til tross for svært lovende resultater disse studiene har vist en ganske liten overlapp mellom identifiserte miRNA signaturer, og var basert på begrensede utvalgsstørrelser /bassenger av prøver som ikke tillater for vurdering av bidraget av en enkelt pasient til den genetiske pool, eller brukt en kandidat miRNA tilnærming for oppdagelsen av miRNA panel. Variasjonen i pre-analytiske faktorer, som for prøveopparbeidelse prosedyrer, og ulike normaliseringsstrategier gjør sammenligning mellom studier vanskelige. Også forskjellene i miRNA profiler mellom serum og plasma [14] kan forklare noen av mangelen på korrelasjon av miRNA ekspresjonsnivåer mellom tidligere studier. Til slutt kan de beskrevne signaturer er forskjellige på grunn av den iboende mangfold av miRNA målene og deres potensial redundans. Gitt at vår studie evaluert flest miRNA profiler, var vi i stand til å vurdere den prediktive verdien av tidligere rapporterte miRNA signaturer i våre data. Interessant, til tross for lite overlapping av miRNAs mellom prediktorer, ulike pasientpopulasjon, utvalgets behandling, utvinning protokoller og normaliserings prosedyrer som brukes i forhold til tidligere studier [9,10,13], en relativt høy prediktiv verdi (AUC: 0,68 til 0,78) av disse miRNA panelene ble observert i vår studie (S1-S4 Bord, S4 Fig), og dermed fremhever potensialet av sirkulerende mirnas som biomarkører for lungekreft deteksjon. I våre data, ble den beste diskriminering mellom NSCLC tilfeller og kontroller funnet for 34-miRNA signatur rapportert av Bianchi og kolleger [9] viser en AUC på 0,78 (95% KI: 0,72 til 0,84). Lavere prediktiv verdi ble observert ved bruk av underskrift av risiko (utviklet i pre-diagnostiske prøver) og diagnose (utviklet i case-control studie) beskrevet av Boeri og kolleger [10] og nylig godkjent av den samme gruppen [11] viser en AUC på 0,71 (95% KI: 0,65 til 0,78) og AUC på 0,70 (95% KI: 0,63 til 0,76), henholdsvis. Til slutt, den 10-miRNA panel definert av Chen og kolleger ga en AUC på 0,68 (95% KI: 0,61 til 0,74). Når den er montert ved hjelp av våre data [13]

Tidligere rapporter reiste spørsmål om mirnas funnet i sirkulasjon stammer fra svulster. I teorien kan miRNA i plasma eller serum stammer fra tumoren eller fra verts inflammatoriske responser. I fravær av miRNA data fra tumorvev i vårt sett av prøver, sammenlignet vi et panel av 24 mirnas i vårt prediktor for å differensielt uttrykt miRNA fra AC og SCC i lungen erholdt via analyse av de Cancer Genome Atlas (TCGA) miRNA sekvenseringsdata ( https://tcga-data.nci.nih.gov/tcga/). Tolv av miRNA inkludert i prediktor ble også endret på TCGA data i enten histologi. Men retning av foreningen var konsekvent bare for la-7c og MIR-218. Dette tyder på at en prediktiv rolle plasma miRNAs er uavhengig av vev i tråd med tidligere funn av Boeri og kolleger [10].

Nyere studier har også antydet at betydelige variasjoner i overflod av mikroRNA biomarkører rapportert i litteraturen kanskje være et resultat av inkludering av hemolysere prøver [17-19]. For å minimere effekten av hemolyse, prøvene brukes i vår studie fulgte standardiserte protokoller og ble behandlet innen 2 timer fra tidspunktet for blodprøvetaking. I tillegg ble en QC skritt iverksatt for å vurdere potensialet hemolyse ved evaluering av uttrykk nivåer av 10 tidligere rapportert hemolyse-relaterte miRNA, inkludert MIR-451, miRNA MIR-16, MIR-15b, MIR-486-3p, MIR-532- 3p, MIR-886-5p, MIR-636, MIR-1255B, RNU48 og MIR-92a [17,19] blant alle mirnas oppdaget i vår studie. Vi observerte ikke signifikante forskjeller i hemolyse-relaterte miRNA mellom lungekreft tilfellene og kontroller i vår serie med unntak av Mir-15b (p-verdi = 0,024) (S5 tabell). Imidlertid, endringer av MIR-15b er tidligere blitt rapportert i tumorvev [20,21] og MIR-15b er blitt foreslått som et serum biomarkør for deteksjon av NSCLC [22]. Videre ingen av hemolyse-relaterte mirnas var til stede i vår 24-miRNA prediktor

Vår studie har flere bemerkelsesverdige styrker, inkludert:. Nøye utvelgelse av pasienter med alle tilgjengelige kliniske data, standardiserte og ensartet behandling av blodprøver innen 2 timer fra blodprøvetaking, ultrasentrifugering skritt følgende defreezing å fjerne cryoprecipitates og celleavfall, store utvalgsstørrelsen, stort antall mirnas analysert og meget streng statistisk vurdering av miRNA prediktor. Kjente prediktorer for lungekreft ble tvunget inn modeller i studiet uavhengig av statistisk signifikans for å virkelig teste lagt inkrementell verdien av vår 24-miRNA panelet (fig 3).

En begrensning er at, på grunn av case- kontroll design av vår studie ble blodprøver samlet på diagnosetidspunktet. For å delvis løse denne begrensningen vi gjorde begrense vår analyse til tidlig stadium NSCLC. Også vår studie mangler en ekstern validering serien. For å takle denne bekymringen vi gjennomført intern godkjenning ved en bootstrapping metode som indikerte at den prediktive verdien av panelet vil forbli høy når den brukes til en uavhengig serie av prøver.

Den lille størrelsen av modne miRNAs og deres sekvenshomologi forløper miRNA krever følsomme metoder for kvantitativ analyse. Vi brukte den nåværende «gullstandarden» metode for måling av sirkulerende miRNAs. TaqMan Mirna kort bruker en target-spesifikke, stem-loop revers transkripsjon primer for å møte utfordringen med den korte lengden [23]. Til tross for høy nøyaktighet og spesifisitet av QRT-PCR teknikk, kan hver miRNA uttrykket nivå målt påvirkes av både systema eksperimentelle skjevhet og tekniske varianter, inkludert forskjeller i utvalget innkjøp, stabilisering, RNA ekstraksjon og prøve forskjeller. Som et resultat av dette er data normalisering kritisk for å minimere «støy» og oppnå biologisk meningsfylte data og for å utvikle miRNA-baserte biomarkører. I fravær av stabilt uttrykt endogent sirkulerende mirnas å fungere som normalisering kontroller, og for å bekrefte følsomheten av våre resultater flere normaliserings strategier ble testet i vår studie, inkludert quantile normalisering, rang normalisering, geometrisk mener normalisering, normalisering til endogen U6snRNA kontroll og for å ATH-MIR-159a spike-in eksogene kontroll. Basert på letedataanalyse tomter, ustabilitet av endogen kontroll, forskjell i overflod av spike-in vs prøve miRNA, bestemte vi oss for å quantile normalisering ble valgt for analysen. I tillegg, for å redusere confounding fra teknisk variant for eksempel plate-til-plate variasjon og variasjon på grunn av rensing ble fordelt vi prøver slik at diagnostiske variabler var balansert i forhold til dagen for analyse eller plate nummer og randomisert innenfor hver dag og plate.

i sammendraget, vår studie viser at 24-miRNA panel er betydelig og uavhengig assosiert med lungekreft følgende analyse av en flytende biopsi, og legger til lungekreft prognose utover det bidratt med etablerte risikofaktorer. Vår studie bør derfor sees som en utforskende studie som gir en sterk og svært intelligent miRNA panel identifisert gjennom strenge statistiske tilnærminger for ytterligere validering i veldesignede store prospektive kohorter og screening studier. Dersom dagens funn er validert, er det ventet å gi viktige bidrag til klinisk og folkehelse praksis og kan føre til mer effektiv lungekreft screening ved å forbedre innmelding kriterier for å identifisere de som vil dra nytte av ytterligere screening.

Pasienter og metoder

Study befolkningen

lungekreftpasienter og kontroller ble rekruttert gjennom en IARC case-control studie koordinert i Moskva fra 2006 til 2012. tilfeller ble hendelsen kreftpasienter hentet fra den russiske NNBlokhin kreftforskning Centre og Moscow City Clinical Oncology Dispensary serverer Moskva og de omkringliggende områdene. Kontrollene ble rekruttert fra personer som besøker to Moskva somatiske sykehus for lidelser som ikke er relatert til lungekreft og risikofaktorer. Alle deltakerne i studien forutsatt skriftlig informert samtykke og ble intervjuet.

perifert blod ble samlet i EDTA-rør på tidspunktet for intervjuet og behandlet så raskt som mulig (vanligvis innen 2 timer). For tilfeller ble blodprøvetaking utføres før operasjonen og eventuell adjuvant behandling. Plasmaprøver ble isolert ved sentrifugering av fullblod ved 2000xg i 10 minutter ved romtemperatur. Prøvene ble lagret ved -80 ° C. Alle prøvene ble oppnådd i samsvar med Helsinkideklarasjonen retningslinjer og ble godkjent av den lokale Institutional Review Board og IARC etikkomiteen. Til sammen 100 lungekreft tilfeller og 100 kontroller ble inkludert (tabell 1).

RNA isolering

Etter tining plasmaprøver ble sentrifugert ved 16 000 xg i 5 minutter for å fjerne cryoprecipitates og celleavfall . Total RNA ble isolert fra 300 ul plasma ved hjelp NucleoSpin miRNA Plasma kit (MACHEREY-NAGEL, Düren, Tyskland) i henhold til produsentens protokoll med proteinase K digest, tillegg av 2 ug av glykogen bærer og DNAse fordøye trinn. Alle prøver ble tilsatt-i med 10pmol av

Arabidopsis thaliana

syntetisk MIR-159a (syntetisert ved Eurofins MWG Operon, Ebersberg, Tyskland) for å kontrollere for variasjoner i RNA-fremstillingstrinnet. Renset RNA ble holdt ved -80 ° C før den brukes for revers transkripsjon.

Profilering av TaqMan Menneskelig mikroRNA Arrays

Expression nivåer av 754 mirnas (Sanger miRBase V14) ble kvantifisert ved bruk av TaqMan Menneskelig mikroRNA Array A + B-kort Set v3.0 (Applied Biosystems, Foster City, CA) i henhold til produsentens instruksjoner (inkludert pre-forsterkning) (S1 Methods). Kvantitative mirnas uttrykk data ble kjøpt opp av ABI 7900HT SDS programvare v2.4. Syklus terskel (Ct, syklus i hvilken det er den første påvisbare betydelig økning i fluorescens) verdier ble angitt ved hjelp av ExpressionSuite programvare (Applied Biosystems) på de første 60 prøvene (automatisk basislinje og terskel), og disse grenseverdier for Ct ble anvendt for de gjenværende serie . De TaqMan Menneskelig mikroRNA Array eksperimenter er MIAME kompatibel og har blitt deponert på NCBI Gene Expression Omnibus (GEO) database (https://www.ncbi.nlm.nih.gov/geo) under tiltredelse GSE64591.

statistisk analyse

Beskrivende sammenligninger av studie variabler mellom saker og kontroller brukte Chi-kvadrat test for kategoriske data, og t-test for kontinuerlige data. Dataene ble analysert i HTqPCR pakke [24] med R Bioconductor [25]. mirnas med ubestemte Ct verdier i mer enn 120 prøver ble filtrert ut. Data ble quantile normalisert. Etter normalisering Ct-verdier med en indre kvartilområdet (IQR) på mindre enn 1,5 og endogene kontroller ble fjernet fra påfølgende analyse, og limma analyse ble utført for å identifisere ulikt regulert miRNA mellom saker og kontroller. Med limma, er en en-faktoriell lineær modell tilpasset hver miRNA og standardfeil (SE) er moderert ved hjelp av en empirisk Bayes modell som resulterer i moderert

t

-statistics for hver miRNA [26]. P-verdier på mindre enn 0,05 ble ansett som statistisk signifikant. Vi rapporterer også justerte p-verdier korrigert for multippel testing med Benjamini-Holm metode for å kontrollere for falske positive feilrate. Logistisk regresjon med en lasso straff (med straff parameter tuning utført av 20-fold kryssvalidering) ble brukt til å velge et panel av miRNAs for å skille mellom saker og kontroller. Logistisk regresjon modeller ble brukt til å vurdere om 24-miRNA panel ble assosiert med lungekreft etter justering for kjente risikofaktorer for lungekreft (alder, kjønn og røykestatus). Arealet under mottakeren opererer karakteristiske kurven (AUC) ble beregnet for å vurdere den diskriminerende effekt av modellen. Intern validering av den valgte modellen ble gjennomført ved å beregne bootstrap optimisme korrigerte AUC. Denne korreksjonen står for overtilpassing av modellparametre for den valgte modellen. I tillegg ble en optimisme riktig AUC beregnet basert på bootstrapping hele modellen utvelgelsesprosessen. Dette utgjør overfitting i både modellvalg og parameterestimering. Alle analysene ble utført ved hjelp av Stata v11 (STATA, College Station, TX) og R [25]. Alle presenterte p-verdier er tosidig.

Hjelpemiddel Informasjon

S1 Fig. Hierarkisk klassifisering av 61 signifikante forskjellig uttrykt microRNAs (p-verdi 0,05) i lungekreft pasienter sammenlignet med kontroller

NSCLC tilfeller er uthevet i rødt

doi: 10,1371 /journal.pone.0125026.s001

(TIF)

S2 fig. Optimal lambda verdi og kryss validert feil tomt for Lasso logistisk regresjonsanalyse

doi:. 10,1371 /journal.pone.0125026.s002 plakater (TIF)

S3 Fig. Boksplott av de 24 plasma mirnas inkludert i panelet i lungekreft pasienter og kontroller i IARC case-control studie (2006-2012).

Median score er linjen i midten av boksen og 25

th og 75

th persentil er nedre og øvre del av boksen. De Linjene utvides til de mest ekstreme punktet ikke lenger enn 1,5 ganger den indre kvartilområdet vekk fra boksen. Slengere er gitt som prikker

doi:. 10,1371 /journal.pone.0125026.s003 plakater (TIF)

S4 Fig. Vurdering av prediktiv verdi av tidligere beskrevet multi-miRNA signaturer for en tidlig deteksjon av NSCLC pasienter i IARC case-control studie datasett (2006-2012)

doi:. 10,1371 /journal.pone.0125026.s004

(TIF)

S1 metoder. Supplerende metoder

doi:. 10,1371 /journal.pone.0125026.s005 plakater (docx)

S1 Table. Logistisk regresjon prediksjon modell med mikroRNA panel rapportert av Bianchi F

et al product: (2011) [9] evaluert i IARC case-control studie (2006-2012)

doi:. 10,1371 /journal.pone .0125026.s006 product: (docx)

S2 Table. Logistisk regresjon prediksjon modell med mikroRNA panel rapportert av Chen X

et al product: (2012) [13] evaluert i IARC case-control studie (2006-2012)

doi:. 10,1371 /journal.pone .0125026.s007 product: (docx)

S3 Table. Logistisk regresjon prediksjon modellen med 16-mikroRNA forholdet underskrift av risiko rapportert av Boeri M

et al product: (2011) [10] evaluert i IARC case-control studie (2006-2012)

doi.: 10,1371 /journal.pone.0125026.s008 plakater (docx)

S4 Table. Logistisk regresjon prediksjon modellen med 16-mikroRNA forholdet underskrift av diagnose rapportert av Boeri M

et al product: (2011) [10] evaluert i IARC case-control studie (2006-2012)

doi.: 10,1371 /journal.pone.0125026.s009 plakater (docx)

S5 Table. Vurdering av hemolyse-relaterte mirnas i lungekreft pasienter sammenlignet med kontrollene i IARC case-control studie (2006-2012)

doi:. 10,1371 /journal.pone.0125026.s010 plakater (docx)

takk

Vi vil gjerne takke IARC Genetic Services Platform for å gi laboratorieutstyr. Vi står i gjeld til Mrs Priscilia Chopard for teknisk assistanse, Dr. Patrick van Uden for nyttige kommentarer til manuskriptet, og vi vil gjerne takke alle pasientene for sin deltakelse. Vi er også takknemlige for de ansatte på sykehus, intervjuere, data ledere, patologi avdelinger og primærhelsetjenesten sentre som støttet denne studien. Sammendraget ble presentert på 2014 Annual Meeting of American Association for Cancer Research.

Legg att eit svar