Abstract
Lungekreft er en av de viktigste årsakene til kreftdødelighet i verden og ikke-småcellet lungekreft (NSCLC) står for det meste. NSCLC kan videre deles inn i adenokarsinom (ACA) og plateepitelkarsinom (SCC). Det er av stor verdi å skille disse to undergrupper klinisk. I denne studien sammenlignet vi genom-wide kopi nummer endringer (CNAS) mønstre av 208 tidlig stadium ACA og 93 tidlig stadium SCC tumorprøver. Som et resultat av 266 CNA prober stod opp for bedre diskriminering av ACA og SCC. Det ble åpenbart at genene som svarer til disse 266 prober ble anriket i lungekreft relaterte trasé og anriket i kromosomet regioner hvor CNA vanligvis forekommer i lungekreft. Denne studien kaster lys på CNA studie av NSCLC og gir noen innsikt på epigenetisk av NSCLC
Citation. Li BQ, Du J, Huang T, Cai RT (2014) Klassifisering av ikke-småcellet lungekreft basert på Kopier nummer endringer. PLoS ONE 9 (2): e88300. doi: 10,1371 /journal.pone.0088300
Redaktør: Giuseppe Viglietto, UNIVERSITY Magna Graecia, Italia
mottatt: 12. august 2013, Godkjent: 06.01.2014; Publisert: 05.02.2014
Copyright: © 2014 Li et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Dette arbeidet ble støttet med tilskudd fra National Basic Research Program of China (2011CB510101, 2011CB510102), Innovasjon Program of Shanghai Municipal Education Commission (12ZZ087), og tildeling av «The førsteklasses Discipline of Universities in Shanghai». Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer
Innledning
Lungekreft er en av de ledende årsak til kreftdødelighet i verden [1]. Basere på 2011 International Association for studier av Lung Cancer /American Thoracic Society /European Respiratory Society (IASLC /ATS /ERS) lunge adenokarsinom klassifisering, er det nå klassifisert i 5 forskjellige undergrupper: Atypisk adenomatøs hyperplasi (AAH), adenokarsinom in situ (AIS) (nonmucinous, mucinous, eller blandet nonmucinous /mucinous), Minimal invasiv adenokarsinom (MIA) (≤ 3 cm lepidic dominerende svulst med ≤5 mm invasjon), invasive adenokarsinom, og varianter av invasiv adenokarsinom, og hver av dem har sin egen histologisk funksjonen [2]. Ikke-småcellet lungekreft (NSCLC) står for 85% av alle lungekrefttilfellene. De vanligste histologiske subtyper av NSCC er adenokarsinom (ACA) og plateepitelkarsinom (SCC), sto for 50% og 30% av NSCLC tilfeller, henholdsvis [3]. ACA er den vanligste histologiske subtype rapportert med lungekreft i aldri-røykere (LCINS) [4], som er en kreft i en epitel som har utspring i kjertelvevet. SCC er kreft i squamous epitelceller, som oppstår som oftest i segmental bronkiene og relatert til Lobar og hovedstammen bronkie skjer ved sin utvidelse [5], og dens forekomst er korrelert med røyking periode [6], sammenlignet med ACA. Historisk godt differensierte SCC celler inkluderer morfologiske funksjoner som inter bridging, plateepitel perle dannelse og enkelt celle keratinization [5]. I dag har medisin utvikling i NSCLC innført histologisk inndeling i undergrupper, differensiering av ACA fra SCC i biopsiprøver, som en viktig faktor for effektiv behandling valg og molekylær terapi mål. For eksempel pemetrexed, antifolatmiddel, er effektiv i behandling av pasienter med ikke-skvamøs NSCLC, men bør ikke bli anbefalt for behandling av karsinomer [7]. Bevacizumab, kombinert med paclitaxel /karboplatin, har overdreven toksiske effekter i squamous cell carcinoma-[8], mens det kunne gi en betydelig øke den totale overlevelse av pasienter med kreft i ikke-skvamøs histologi [9], [10]. Tradisjonell diagnose metode for å skille adenokarsinom fra plateepitelkarsinom, er basert på histologisk snitt og pasientenes røyking vane. Men på grunn av den individuelle heterogenitet av lungekreft, kan denne metoden ikke korrekt skille ACA og SCC i enkelte tilfeller effektivt. Nylig, immunhistokjemi blir brukt i biopsi og cytologi materiale [11] som et komplement, og flere gener har blitt oppdaget som immunhistokjemisk markør. Kargi et al. funnet thyroid transkripsjonsfaktor-1 (TTF-1) er en markør i farging for ACA, mens p63 og cytokeratins (CK) 5/6 er merker etter SCC [12]. Dessuten har molekylær målrettet terapi blitt mer og mer brukt i NSCLC som lovende behandlingsstrategi de siste årene. Det er vist at en overlegen effekt av tyrosinkinaseinhibitorer (TKI) sammenlignet med standard kjemoterapi for pasienter med EGFR-mutant-tumorer [13]. Kwak et al. også utforsket små-molekyl-inhibitor av ALK tyrosin kinase kan brukes som den virksomme terapi i avanserte ALK-positive tumorer i en tidlig fase klinisk studie [14]. Derfor er det meningsfylt å identifisere gener som har forskjellige genetiske egenskaper i ACA og SCC som kan brukes som prognostisk faktor eller potensielt mål for medisinsk behandling.
Forrige analyse viste CNAs er vanlig i nesten alle kreft hos mennesker [ ,,,0],15], [16]. I NSCLC, CNAs øker med sykdomsprogresjon og CNAs er både positionally og funksjonelt gruppert [17]. Videre Giovanni Tonon el på. funnet til tross for deres forskjellige histopatologiske fenotyper, ACA og SCC genomiske profiler viste en nesten fullstendig overlapping, med bare en klar SCC spesifikke amplicon på 3q26-29 [18].
I denne studien å finne ut de viktigste genene skille ACA og SCC fra hverandre, sammenligner vi genom-wide kopi nummer endringer (CNAS) mønstre av 208 tidlig stadium ACA og 93 tidlig stadium SCC tumorprøver. Ved hjelp av funksjonen utvalg og analysemetoder, herunder Maksimal Relevans Minimum Redundancy metode (mRMR) og Inkrementell funksjonsvalg (IFS) metoden, ble 266 optimale CNA prober valgt for diskriminering av ACA og SCC. Klassifiseringen modellen ble bygget med nærmeste nabo algoritme (NNA). Som et resultat av dette oppnås det en klassifikator generelle MCC på 0,6616. Videre analyser på 266 CNA relaterte gener viste at de var nært knyttet til lungekreft.
Materialer og metoder
Datasett
Vi brukte kopitall forandringer data fra ikke -små kreft studie av Huang et al celle lunge. [19]. I sin studie, ble en serie av 301 snap-frosset tumorprøver fra NSCLC pasienter som samles inn under kirurgi eller biopsi fra Massachusetts General Hospital (MGH), Boston, MA og National Institute of Occupational Health, Oslo, Norge. Den kliniske opplysninger av disse 301 prøvene ble gitt i File S1. Kopien antall profilering av 208 stadium adenokarsinom svulster tidlig (ACA) prøver og 93 scene plateepitelkarsinom tumorer (SCC) tidlig ble hentet fra NCBI Gene Expression Omnibus (GEO) med tiltredelse antall GSE34140. Kopien nummerprofil ble innhentet ved hjelp av å bruke Affymetrix 250 K Nsp Genechip. Bare 256 554 sonder på somatiske kromosomer ble analysert. SNP prober ble kartlagt til RefSeq gener med 2 kb forlengelse både oppstrøms og nedstrøms bruker UCSC Genome Browser. Blant de 256,554 sonder på somatiske kromosomer, ble 104,256 prober kartlagt til 11.700 gener [19].
mRMR metode
Vi brukte Maksimal Relevans Minimum Redundancy (mRMR) metode for å rangere viktigheten av sondene [20]. mRMR metoden kan rangere prober basert på både deres relevans i forhold til klasse av prøver og redundans blant sonder. En mindre indeks av en sonde betegner at den har et bedre bytteforhold mellom maksimal relevans til klasse av prøver og minimum redundans.
Både relevans og redundans ble kvantifisert ved gjensidig informasjon (MI), som anslår hvor mye man vektoren er knyttet til en annen. MI ligningen ble definert som følger: (1)
I ligning (1), er vektorer, er deres felles sannsynlighetstetthet, og og er de marginale sannsynlighetstettheter
La betegne. hele probe sett, betegne den allerede valgt probe sett inneholder
m
prober og betegne å-være-valgt probe sett inneholder
n
sonder. Relevansen mellom en sonde i og klassen av prøven kan beregnes ved: (2)
redundans mellom en sonde i og alle probene i kan beregnes ved: (3)
for å få sonden i med maksimal relevans og minimum redundans, kombinerer mRMR funksjon ligning (2) og ligning (3) og er definert som følger: (4)
mRMR sonde vurdering ville bli henrettet N runder når gitt en sonde sett med N (N = m + n) prober. Etter N runder med kjøring, er en sonde sett produsert: (5)
I, index
h
viser hvilket avrunder at sonden er valgt. Jo mindre hovedside
h
er, jo tidligere sondetilfredsstiller ligning (4) og bedre sonden er.
Nærmeste nabo algoritme (NNA)
Nærmeste nabo Algoritme (NNA) [21], [22], som har blitt mye brukt i bioinformatikk og databiologi [23], [24], [25], [26], [27], ble tatt i bruk for å forutsi den klasse av prøver. Den «nærhet» ble beregnet i henhold til den følgende ligning (6) der og er to vektorer som representerer to eksempler, er deres dot produkt, og er deres moduluses. Jo mindre, jo mer lignende de to prøvene.
For en intuitiv illustrasjon av hvordan NNA fungerer, se figur 5 for [28].
Jackknife kryssvalidering Metode
Jackknife kryssvalidering metode [23], [24], [29], [30] (også kalt La-en-out kryssvalidering, LOOCV) ble brukt til å evaluere resultatene av en klassifikator. Foldekniv i kryssvalidering metode, hver testede prøve av prediktoren som er trenet med alle de andre prøvene. La TP betegner sanne positive. TN betegner sant negativ. FP betegner falsk positiv og FN betegner falsk negativ. For å evaluere resultatene av vår prediktor, prediksjon nøyaktighet, spesifisitet, sensitivitet og MCC (Matthews korrelasjonskoeffisient) ble beregnet som følger: (7)
Inkrementell funksjonsvalg (IFS)
Basert på de rangert prober vurdert av mRMR evaluering, brukte vi Inkrementell funksjonsvalg (IFS) [31], [32], [33] for å bestemme det optimale antallet sonder. Under IFS prosedyren, prober i rangert probe sett lagt en etter en fra høyere til lavere rang. En ny probe sett består når en probe blir tilsatt. Således N sondesett vil være sammensatt gis N rangeres prober. I-te sonde sett er: (8)
For hver av de N-probe-sett, ble en NNA prediktor konstruert og testet ved hjelp av LOOCV. Med N prediksjon nøyaktighet, sensitivitet, spesifisitet og MCC beregnet, får vi en IFS tabell med en kolonne som indeksen i og de andre kolonnene til å være prediksjon nøyaktighet, sensitivitet, spesifisitet og MCC. Den optimale probe sett () er den ene, ved hjelp som prediktor oppnår best prediksjon ytelse.
Funksjonell berikelse analyse av CNAS gener
Funksjonell merknad verktøyet av samle [34] ble brukt for KEGG sti, GO og kromosom region berikelse analyse. Alle gener i det menneskelige genom ble valgt som bakgrunn under berikelse analyse.
Resultater og Diskusjon
Den mRMR Resultat
Oppført i Fil-S2 er to typer utfall oppnås ved å kjøre mRMR programvare: en kalles «MaxRel funksjonen list» som er rangert alle sondene i henhold til deres relevans i forhold til klassen av prøver; den andre er «mRMR funksjonen list» som er rangert sondene i henhold til kriteriene for maksimal relevans og minimum redundans. I sondelisten mRMR, jo mindre er indeksen for en probe var, ville jo viktigere sonden være for diskriminering av to typer NSCLC. Følgelig kunne mRMR funksjonen listen brukes til å etablere en optimal funksjon satt i IFS prosedyren.
IFS og Final Optimal Feature Set
Basert på disse to tabellene, 1000 har undergrupper ble konstruert i henhold til Eq.8. En NNA prediktor ble modellert for hver undergruppe og ble evaluert av LOOCV. Vist i figur 1 er den IFS kurven plottet basert på dataene i File S3. X-aksen er antallet prober som brukes for klassifisering, og y-aksen er MCC-verdiene av klassifiserere evaluert ved LOOCV. Den maksimale MCC var 0,6616 da 266 prober ble utnyttet. Med en slik klassifikator, prediksjon sensitivitet, spesifisitet og nøyaktighet var 0,9567, 0,6452 og 0,8605, henholdsvis. Disse 266 prober ble ansett som den optimale biomarkører for diskriminering av to typer NSCLC. Informasjonen fra disse 266 prober ble gitt i File S4. Vist i Figur 2 er heatmap basert på disse 266 prober. Det kan sees at de fleste av de 208 ACA prøver og 93 SCC prøvene kan skilles.
IFS kurvene ble trukket på grunnlag av dataene i File S3. MCC nådd toppen når antall sonder var 266. De 266 prober dermed oppnådd ble brukt til å komponere det optimale probe sett for diskriminering av adenokarsinom (ACA) og plateepitelkarsinom (SCC).
Prøver som er anordnet langs X-aksen og prober langs Y-aksen. Hver rute representerer kopiantallet av en gitt sonde i en enkelt prøve. Red er økt kopiantall og blå reduseres kopitall i forhold til den betyd- og sample-sentrert skalert kopi-antall på tvers av prøvene. Adenokarsinom (ACA) og plateepitelkarsinom (SCC) prøver ble presentert med grønt og blått, henholdsvis.
KEGG og gå berikelse resultatene av CNAS gener
KEGG vei berikelse analyse av CNAS gener indikerte at de var anriket i Wnt signalveien, fokal adhesjon, ECM-reseptor-interaksjon og så videre (tabell 1). Det er rapportert Wnt signalveien aktiveres under carcinogenesis av NSCLC [35], og hemming av Wnt-2-mediert signalisering kan indusere ikke-små-celle lungecancerceller apoptose [36]. Fokal adhesjon og ECM-reseptor-interaksjon er baner i de biologiske prosesser interaksjoner av celler med ekstracellulære matriks (ECM), som spiller viktige roller i celle motilitet, celleproliferasjon, celledifferensiering, regulering av genekspresjon og celleoverlevelse [37], [38 ]. Proteinene i disse banene blir oppregulert i NSCLCs [39], og ta del i aktiveringen av lokal invasjon og fjernmetastaser av kreftceller [40]. Som KEGG vei berikelse resultat, GO berikelse resultat av disse CNAS genene viser også berikelse i form av celle adhesjon og intracellulær signalering kaskade. GO berikelse Resultatet av disse CNAS gener ble oppført i File S5.
kromosom region berikelse resultat av CNAS gener
Det er rapportert kopiantall gevinst i regionen 3q26 [18], [ ,,,0],41] og i regionen 8p12 [42] synes å være mer vanlig i plateepitel histologi sammenlignet med adenokarsinom. Analysen av våre Resultatet viser at blant annet disse to regionene, kopi antall endringer av 2q34, 10p15, 18q11, 8p23, 3p21, 3q27, 22q12, Xq13, 2q36, 10p11, 10p12 har også betydning i diskriminering mellom SCC og ACA, og fortjent ytterligere undersøkelser på dem (tabell 2).
CNAS gener identifisert i denne studien
i denne studien identifiserte vi flere kandidat gener som tilsvarer 266 CNAS sonder som kan brukes til å skille to typer NSCLC. 50 av dem har også en signifikant korrelasjon til Smoking Pack-året, inkludert TP63, SOX2 og PPP2R2B (se Fil S4). Med litteratur gjenfinning av gen-funksjon og betydning sammenligning av p-verdi, vi fokusert på 8 gener som er mest sannsynlig relatert til å skille ACA og SCC fra hverandre. Blant dem, har TP63 blitt rapportert som en biomarkør for å diskriminere mellom SCC og ACA, og det er oppført øverst i vår resultat. Noen av andre gener er rapportert å ha forskjellig genuttrykk nivå i ACA og SCC eller hos pasienter med ulike røykevaner. I samsvar med den KEGG og GO berikelse resultat, er PPP2R2B et gen i wnt signalveien, mens ITGA9 tar del i fokal adhesjon og ECM-reseptor-interaksjon. Alt ovenfor illustrerer at vårt resultat er biologisk signifikant, og de 8 gener kan være kandidat biomarkører for å skille ACA og SCC fra hverandre og fortjente videre studier på dem. Nedenfor vil vi kort diskutere sine relasjoner med NSCLC.
TP63 (Tumor protein 63) er oppført øverst i optimal sonde satt med et CNA ganger endring av 0,7827 sammenligne ACA med SCC. Det er en p53 tumor suppressor-homolog og en forutsetning for p53 avhengig apoptose i respons til DNA-skade [43]. Mi Jin Kim et al. funnet P63 er et nyttig immunhistokjemisk panel i å skille ACA fra SCC i lungene med den positive hastigheten 91% av SCC og 9% av ACA i sine studier [44]. Kromosomet Plasseringen av TP63 er 3q27-29. Derfor er vårt resultat sammenfaller med tidligere undersøkelser og TP63 kan spille en nøkkelrolle i å skille ACA og SCC fra hverandre.
EPHA4 (Efrin type-A reseptor 4) er relatert til den fjerde sonde i vår optimal probe satt med en CNA gangers endring av 1,0846 sammenligne ACA med SCC, og er et medlem av Ef-reseptorfamilien, den største reseptor-tyrosin-kinase-familien av transmembranproteiner med deres ligander, de ephrins, som påvirker vekst, migrering og invasjon av kreftceller i kultur samt tumorvekst, invasivitet, angiogenese og metastase in vivo [45]. Junya Fukai et al. funnet EphA4 fremmer celleproliferasjon og migrasjon gjennom en roman EphA4-FGFR1 signalveien i menneske glioma U251 cellelinje [46]. En av de Ef reseptorer EphA2 er rapportert i løpet uttrykk i røykere og spår dårlig overlevelse i ikke-småcellet lungekreft [47]. En mutasjon i EphA2 (G391R) ble identifisert i to av 28 squamous celle lunge kreft (7%), men ikke i noen adenokarsinomer eller stor-celle lungekarsinom [48]. Alle disse indikerer at EphA4 kan være en kandidat biomarkør for å skille ACA og SCC fra hverandre og fortjente videre studier på den.
PPP2R2B (Serine /treonin-protein fosfatase 2A 55 kDa regulatorisk subenhet B beta isoformen) er beslektet til den femte sonden i vårt optimal sonde innstilt med en CNA gangers endring av 1,0781 sammenligne ACA med SCC. Det er den regulatoriske subenhet B beta isoformen av PP2A, og er innblandet i den negative kontrollen av cellevekst og deling [49]. Nylig genom-wide forening studie (GWAS) av lungekreft i den kinesiske befolkningen viste at kromosom 5q32 (rs2895680 i PPP2R2B-STK32A-DPYSL3, P = 6,60 × 10-9) var kreft mottakelighet lunge loci og interaksjon med røyking dose [50] . Så vel som PPP2R2B er på toppen av vår resultat, er bidraget fra den i NSCLC verdig til å bli ytterligere belyst.
ITGA9 (Inte a-9) er knyttet til det tolvte sonden i vårt optimal probe sett med en CNA gangers endring av 1,1034 sammenligne ACA med SCC, som tilhører integrinfamilien og blir uttrykt på et bredt spekter av celletyper. Den interagerer med mange ligander for eksempel fibronektin, tenascin-C og ADAM12, og deltar i en rekke prosesser som celle adhesjon, migrasjon, lunge utvikling, lymfatisk og venøs ventil utvikling, og ved sårheling [51]. ITGA9 har vist seg ned ekspresjon i NSCLC [52], og som oppviser kraftig cellevekst inhiberende aktivitet [53]. Statistisk analyse av Alexey en. Dmitriev et al. foreslo at metyleringen /sletting nivå av ITGA9 har betydelige endringer i ACA og SCC [53]. Vår analyse presenterte genkopitallet av ITGA9 er ulik hos NSCLC undergrupper, noe som tyder ITGA9 som kandidat molekylær å diskriminere mellom SCC og ACA.
SOX2 (Sex bestemmende region Y-Box 2) er relatert til det nittende sonde i vår optimal sonde innstilt med en CNA gangers endring av 0,7790 sammenligne ACA med SCC, og er blitt rapportert å bli uttrykt forskjellig mellom ACA og SCC. Den ligger ved kromosom 3q26 og høyt nivå forsterkning av SOX2 er rapportert hos omtrent 20% av lungekreft plateepitelkarsinom [54], [55]. SOX2 er en transkripsjonsfaktor som styrer ekspresjonen av et antall gener involvert i fosterutviklingen og holder neuralceller udifferensierte [56]. Undertrykkelse av SOX2 i amplifiserte SOX2 celler har større antiproliferative effekter sammenlignet med andre gener på 3q26.33 inkludert PIK3CA og TP63.
FHIT (skjør histidin triade) er relatert til trettitredje sonde i vårt optimal sonde innstilt med en CNA ganger endring av 1,1110 sammenligne ACA med SCC, og oppfører seg in vitro som en typisk diadenosine trifosfat hydrolase spalte A-5′-PPP-5’a å gi AMP og ADP [57], men lite er kjent om dens fysiologiske funksjon. Det er regnet som en tumor suppressor i mange humane kreftformer og restaurering i Fhit-negativ kreft cellelinjer undertrykker tumorigenicity og induserer apoptose [58]. Jennifer E. Tseng el på. fant at frekvensen av tap av FHIT uttrykk er relatert til røyking vane i fase I ikke-småcellet lungekreft [59]. I studier av Gemma Toledo et al. FHIT uttrykk var relatert til tumorhistologi: 52 av 54 (96,3%) SCC og 20 av 44 (45,5%) ACA var negative for FHIT (P 0,0001) [60]. Som SCC er nært korrelert med en historie av tobakksrøyking [6], og våre resultater viser kopien antall FHIT er betydelig lavere i SCC, kan FHIT være en mulig biomarkør for NSCLC diagnose og ville være en potensiell medisinsk mål for kreftbehandling.
RBBP8 (Retinoblastoma-bindende protein 8) er en allestedsnærværende uttrykt atom protein som er bindende for svulst suppressor proteiner RB [61] og CtBP [62]. Det er også i samspill med BRCA1 [63] og er antatt å regulere funksjonene av BRCA1 i transkripsjonsregulering, DNA-skade reparasjon, og G2 /M-cellesykluskontrollpunktet kontroll [64], [65]. RBBP8 er nødvendig for DNA dobbel tråd pause (DSB) reseksjon, og derved for rekruttering av proteinkinasen ATR og replikasjon protein A til DSB, og fremmer ATR-aktivering og homolog rekombinasjon [66]. Det er rapportert at DNA-reparasjonskomponenter var signifikant oppregulert inkludert retinoblastom-bindende protein 8 (RBBP8), i lunge SCC sammenlignet med normalt lungevev, men en slik opp-regulering ble ikke funnet i lungene ACA [67]. Som en viktig molekyl i celleprosessen DNA-skade og reparasjon cellesykluskontroll, har RBBP8 potensial til å være en biomarkør og terapi mål for NSCLC og mekanismen for dets distinkte ekspresjonsprofilen i SCC og ACA fortjener videre studier.
GPC5 (Glypican-5) er medlem av glypican genet familien, som er en familie av heparansulfat proteoglykaner som er knyttet til den exocytoplasmic overflaten av plasmamembranen via glykosyl phosphatidylinositol [68]. Uttrykket nivået av GPC5 var betydelig lavere i lunge adenokarsinom vev enn i matchet normalt lungevev hos ikke-røykere [69]. Yang et al. funnet døde ekspresjon av GPC5 er korrelert med redusert overlevelse i ACA, men ikke i SCC [70]. Alle disse indikerer at GPC5 kan være en potensiell tumor suppressor genet i NSCLC, og en kandidat bio-markør for å diskriminere mellom SCC og ACA.
Konklusjon
I denne studien, bygget vi en klassifikator basert på kopien antall endringer (CNA) for å skille to undergrupper av NSCLC. Som et resultat ble 266 CNA prober valgt som de beste diskriminatorene. Analyse av gener som korresponderer til disse 266 CNA sonder tyder på at de ble anriket i lungekreft relatert trasé og anriket i kromosomet regioner hvor CNA vanligvis forekommer i lungekreft. Noen av disse genene, slik som TP63, SOX2, EPHA4, PPP2R2B, ITGA9, FHIT, RBBP8 og GPC5 er nært knyttet til lungekreft og disse kandidat gener kan gi ledetråder for videre forskning og eksperimentere validering.
Støtte Informasjon
Fil S1.
Klinisk informasjon fra adenokarsinom (ACA) og plateepitelkarsinom (SCC) prøver
doi:. 10,1371 /journal.pone.0088300.s001 plakater (docx)
Fil S2.
mRMR resultat for klassifisering. Denne filen inneholder to ark. Den første er den MaxRel funksjonen tabellen, som rangeres de 1000 sonder i henhold til relevans mellom funksjoner og klasse av prøvene. Den andre er mRMR funksjonen tabellen, som rangeres disse 1000 sonder i henhold til redundans og relevanskriterier
doi:. 10,1371 /journal.pone.0088300.s002 plakater (XLSX)
File S3.
følsomhet (Sn), spesifisitet (Sp), nøyaktighet (Ac), Matthews korrelasjonskoeffisient (MCC) for hver kjøring av IFS for klassifisering
doi:. 10,1371 /journal.pone.0088300.s003
(XLSX)
Fil S4.
annotering av de 266 utvalgte prober
doi:. 10,1371 /journal.pone.0088300.s004 plakater (XLSX)
Fil S5.
GO berikelse resultat av CNAS gener
doi:. 10,1371 /journal.pone.0088300.s005 plakater (XLSX)
Takk
Forfatterne ønsker å takke editor for å ta seg tid til å redigere denne artikkelen. Forfatterne vil også gjerne takke de to anonyme lesere for deres konstruktive kommentarer, som var svært nyttig for å styrke presentasjonen av denne studien.