Abstract
Å finne nye peptid biomarkører for magekreft i humant serum som kan implementeres i en klinisk mulig prediksjon metode for overvåking av magekreft. Vi studerte serum peptidome fra to forskjellige biorepositories. Vi først anvendt en C8-reversfase-væskekromatografi tilnærming for prøve rensing, etterfulgt av massespektrometri-analyse. Disse ble påført på serumprøver fra kreftfrie kontroller og magekreftpasienter ved forskjellige kliniske stadier. Deretter har vi laget en bioinformatikk analyse rørledning og identifisert peptid signatur diskriminerende magen adenokarsinom pasienter fra kreftfrie kontroller. Matrix pasning Laser desorpsjon /ionisering-Time of Flight (MALDI-TOF) resultater fra 103 prøver avslørte 9 signatur peptider; med forutsigelse nøyaktighet på 89% i treningssettet, og 88% i valideringssettet. Tre av de diskriminerende peptidene oppdaget var fragmenter av Apolipoproteiner C-I og C-III (Apoc-I og C-III); vi videre kvantifisert serumnivåer, samt CA19-9 og CRP, ansette kvantitative kommersielle kliniske tester i 142 prøver. Apoc-I og Apoc-III kvantitative resultater korrelert med MS resultater. Vi deretter ansatt apoB-100-normalisert Apoc-I og Apoc-III, CA19-9 og CRP-nivåer for å generere reglene for magekreft prognose. For trening, brukte vi sera fra en repository, og for validering, vi brukte sera fra andre depotet. Tips nøyaktighet på 88,4% og 74,4% ble oppnådd i trening og valideringssett, henholdsvis. Serumnivåer av Apoc-I og Apoc-III i kombinasjon med andre kliniske parametre kan tjene som grunnlag for utformingen av en diagnostisk score for mage kreftpasienter
Citation. Cohen M, Yossef R, Erez T, Kugel A, Welt M, Karpasas MM, et al. (2011) Serum Apolipoproteiner C-I og C-III er redusert i magen kreftpasienter: Resultater fra MALDI-Based Peptidome og Immuno-baserte kliniske analyser. PLoS ONE 6 (1): e14540. doi: 10,1371 /journal.pone.0014540
Redaktør: Hana Algül, Technische Universität München, Tyskland
mottatt: 1 juli 2010; Godkjent: 22 november 2010; Publisert: 18 januar 2011
Copyright: © 2011 Cohen et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres
Finansiering:. Funding var levert av det europeiske fellesskap (FP6 GLYFDIS 037661). RNTech SAS Frankrike er angitt som finansiør grunn av det faktum at JT og HB er /var ansatt i dette selskapet; bidragene fra JT og HB er definert som endelig godkjenning av den versjonen som skal publiseres, og de var ikke involvert i bidrag til idé og utforming, eller datainnsamling, eller analyse og tolkning av data eller utkast manuskriptet. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet
Konkurrerende interesser:. Det faktum at to tidligere eller nåværende ansatte i RNTech SAS Frankrike er forfatterne av dette manuskriptet endrer ikke tilslutning til alle de PLoS ONE politikk på deling av data og materialer som beskrevet i online guide for forfattere.
Innledning
Dødeligheten av mange kreftformer har ikke endret seg dramatisk i siste 20 år [1]. Tidlig oppdagelse ble vist å forbedre effekten av kreftbehandling, men oppdagelsen er ofte bare mulig etter utseendet på de første kliniske symptomer, som i noen kreftformer skjer for sent for vellykket intervensjon. Dette skyldes i stor grad mangel på spesifikke og sensitive tester som gjør at tidlig screening og oppfølging av krefttilstander. Derfor er oppdagelsen av nye tumor biomarkører i økende grad betraktet som avgjørende for å forbedre behandling av kreft. I det siste tiåret, har mange studier fokusert på biomarkører. En av de mest lovende kilder for biomarkører er det menneskelige blod, spesielt serum og plasma, noe som kan gjenspeile mange hendelser i kroppen, for i sanntid. Men til tross for enorme anstrengelser, bare et meget lite antall plasmaproteiner har vist seg å ha diagnostisk verdi [2] – [5]. Ofte har disse biomarkører ikke stå alene, og er ledsaget av andre tester for overvåking og diagnostisering. De fleste av dem er ikke spesifikk og sensitiv nok for widescreen diagnose [6], [7].
En mulig kilde til nye kreft biomarkører er peptidome. Begrunnelsen for å fokusere på serum peptider er basert på bevis for at kreft dannelse og utvikling innebærer endring av proteiner «og peptider «metabolisme, og på den økte tilgjengeligheten av metodikk for screening hele peptidome. I forhold til kreftutvikling, kan endringer skje i rekken av intra- og ekstra-cellulære peptider representert i blodet peptidome, som kan være spesifikke for kreft stadium, og dermed ha en diagnostisk potensial [2], [4], [ ,,,0],5]. I form av teknologi for gjenkjenning, nylige fremskritt i MS teknologi aktivere sporing av hundrevis av peptider fra noen få mikroliter serum [8], [9]. Faktisk, tidligere blod peptidome studier har rapportert en rekke signatur peptider i serum som hadde preget sunt fra kreftpasienter (anmeldt i [5]). Dette ble vist for prostata, blære, bryst og thyroid kreft ved Villanueva
et al product: [10], [11]. De rapporterte 61 signatur peptider som kan skille friske personer mellom 3 forskjellige typer av kreftpasienter. Mens alle disse peptider og /eller deres fragmenter er normalt finnes i serum, blir forskjeller i mengde mellom friske og de berørte individer observert. Imidlertid, selv om disse resultatene viser potensialet som peptidome profilene for kreftdiagnostikk, gjenstår det fremdeles å bli vist at denne fremgangsmåten kan utvides til å oppdage biomarkører som er egnet for tidlig diagnose og konsistent overvåking. Først evnen til disse sera peptid biomarkører for å skille pasienter fra kontroller ble stort sett vist for pasienter med høyt avansert eller metastatisk svulster. Dessuten har den robusthet av disse biomarkører blitt utfordret; ukontrollerte variabler, for det meste tilskrives forskjeller i prøvehåndtering, behandler protokoller og dataanalyse, har vist seg å dramatisk endre resultatene av disse analysene [11] – [19]. Ved å sette større fokus på prøve anskaffelse, håndtering, bearbeiding, MS signalbehandling og statistiske analyser mer robuste og reproduserbare resultater kan oppnås [18], [20], [21].
I dette arbeidet har vi fokusert på å oppdage en rekke signatur peptider som kan ha diagnostisk verdi for magekreft. For å oppnå dette, brukes tre forskjellige serum kilder som involverer mage kreftpasienter på forskjellige stadier. En streng protokoll for serum innsamling og behandling ble påført [18], ved bruk av en sammenhengende fremgangsmåte av peptid ekstraksjon og MALDI-TOF opplesninger, med en modifisert analyse rørledning. Sammen, den forbedrede rørledningen tillates for identifisering av et peptid mønster som diskriminerer mellom kreft og kontrollprøver. Disse resultatene ble bekreftet på den opprinnelige og nye sera for tre identifiserte funksjoner fra mønsteret, Apoc-I (to funksjoner) og Apoc-III, ved hjelp av immunbaserte analyser. Vi deretter ansatt serumnivåer av Apoc-I og Apoc-III kombinert med CRP og CA19-9 markører for å diskriminere magen adenokarsinom pasienter fra kreftfrie kontroller.
Materialer og metoder
Serum høsting og håndtering
Sera ble hentet fra to kommersielle kilder. 79 seraprøver fra pre-drift mage kreftpasienter og 33 seraprøver fra kreftfrie matchede kontroller (inkludert 10 gastritt pasienter) ble samlet av RNTech (Paris, Frankrike) i Romania. Sera skjema kreft og ikke-kreftpasienter ble tatt etter faste over natten på følgende måte: 5 ml blod ble trukket inn i en vacuette serum tube (Cat # 456005, Greiner Bio One, Kremsmünster, Østerrike) og venstre for å koagulere i ca 30 minutter, hvoretter røret ble sentrifugert ved 3000 rpm på et Hettich EBA 20S sentrifuge (Hettich Ag, Tuttlingen, Tyskland) i 5 minutter ved romtemperatur. Det separerte serum ble aliquotert i 1 ml alikvoter i sterile kryogen-rør (Nalgene, Rochester, NY, USA) og umiddelbart frosset ved (-70) ° C. 22 pre-operasjon magekreft sera og 21 kontroller ble oppsamlet ved Asterand i USA (Detroit, Michigan, USA) på følgende måte: 10 ml blod ble trukket inn i en BD vakutainer SST pluss plastrør (katt #BEC 367985, BD , San Jose, CA, USA). Røret ble blandet ved å snu den 5 ganger og igjen å koagulere i ca. 30 minutter i en vertikal stilling. Dette trinn ble etterfulgt av en sentrifugering av 1,100-1,300 g i 10 minutter ved romtemperatur. Det separerte serum ble aliquotert i 1 ml alikvoter i sterile kryogen-rør (Nalgene) rør og umiddelbart frosset ved (-70) ° C. For Asterand kilde, ble faste data ikke samlet på noen av blodet trekker i banken sin. Sera prøver fra begge selskapene ble fraktet på tørris og lagret ved (-70) ° C umiddelbart etter ankomst. Sera prøver ble tint på is i omtrent en og en halv time, 50 ul ble porsjonert i lo-bind rør (Eppendorf, Hamburg, Tyskland) og umiddelbart fryses på (-70) ° C. Alle prøve alikvoter ble lagret ved (-70) ° C inntil behandling. En tredje kilde for sera ble oppnådd i vårt laboratorium fra 12 kreftfrie israelske kontroller. Blod ble trukket med røret merket brukes av RNTech (Cat # 456005, Greiner Bio One) og serum håndtering fulgt prosedyren for RNTech. Forbindelsen oppnådd i vårt laboratorium sera ble tatt fra ikke-fastende individer. Begge RNTech og Asterand selskaper har etablert og gjennomført sine aktiviteter etter regelverk og etiske normer, gjennomføring lokalt, nasjonalt, europeisk, amerikansk og internasjonal (FN) regler og anbefalinger spesielt når det er aktuelt å biologisk materiale innsamling og behandling og forskning resultat utnyttelse. Dette inkluderer både skriftlig samtykke fra hver pasient medvirkende til den biologiske og databanken, og skrevet studie tillatelse fra etisk komité for hver klinisk institutt bidrar prøver til selskapenes bankene.
Serum utvalgets behandling og forberedelse for MS- MALDI lesing
Hver serumprøve ble behandlet i to til tre paralleller (fra identiske porsjoner og på egne tilfeldige datoer). Peptidene ble ekstrahert med kuler belagt med C8, vasket, eluert, blandet med CHCA matriks, og avsatt på MALDI sikteplaten. Sera ble behandlet i replikater og avsettes på MALDI platen i duplikater. For detaljert beskrivelse se File S1.
Data analyse av MALDI resulterer
Databehandling ble utført i to trinn. I det første trinnet, ble en intensitet matrise utføres fra rå ASCII-filer av MALDI-TOF avlesninger fra alle sera prøvekilder ved hjelp av re-sampling, samkjøre, og m /z topper deteksjon som beskrevet i Villanueva
et al
[21]. I det andre trinnet ble maskinlæring anvendt for å definere et diskriminerende mønster som kan brukes til å klassifisere pasienter. For dette formål ble fremgangsmåten beskrevet i Villanueva
et al product: [21] ble modifisert som beskrevet nedenfor. Den modifiserte rørledningen helt avhengig åpen kildekode og ytterligere detaljer er beskrevet i bioinformatikk delen i File S1.
(1) en gjengivelse summering og har filtreringstrinn ble lagt til å vurdere nullverdier som spesielle tilfeller. Vår opprinnelige matrisen inneholdt en betydelig mengde nullverdier for ulike funksjoner i ulike prøver. På grunn av generell begrensning av MALDI-teknologi, kan en betydelig andel av disse nullverdier representerer manglende verdier i stedet for ekte null intensitet. For å delvis overkomme denne begrensningen vi leser hver prøve i gjentak, og beregnet gjennomsnittlig intensitet, ignorerer null intensitet målinger. Etter dette replikere oppsummering, det resulterte matrise fortsatt finnes betydelige mengder nullverdier. SVM-baserte modeller kan klassifisere i henhold til null verdier som representerer manglende verdier og ikke sanne null intensitet. Derfor vi filtrert ut funksjoner som fortsatt hadde nullverdier i det minste en av prøvene. Ingen av disse fjernet funksjonene hadde klar preferanse for nullverdier til en bestemt klinisk gruppeoppgave. Den resulterende sub-matrise ble brukt i en maskin læring klassifisering.
(2) En ny tilnærming til funksjonen utvalg parametrisering ble utviklet. Definisjonene for SVM basert analyse var i utgangspunktet som følger: RNTech magen vs. RNTech kontroll, Asterand magen vs. Asterand kontroll. Mann-Whitney p-verdi ble beregnet for hver topp, ifølge klinisk grupper som er definert for analysen. Vi deretter brukt Mann-Whitney p-verdier og peak intensiteter som tidsavgrensninger for å velge et delsett av funksjoner (topper) for bruk i maskinlæringsforsøk. En intensitet cutoff ikke filtrere ut prøver hvor i det minste en gjennomsnittlig lesning hadde intensitet over grenseverdien for toppen testet. Filter verdier ble optimalisert for best ytelse i SVM-baserte klassifiserere (fremstilt av LIBSVM, lineær kjerne) i henhold til ti ganger kryssvalidering ved en to-trinns protokoll. Det første trinnet definert søkekjeder og intervaller for både filtre og gjentar enn alle kombinasjoner. Deretter valgte det andre trinnet kombinasjonen av verdier, som ga best resultat og færrest funksjoner.
(3) En normalisering skritt ble lagt inn i styre for cross-sample og cross-eksperimentet skjevheter. For sera kilder «sammenligning og utvalg av funksjoner som viser lignende tendenser i begge kilder, ble kryss-kilde normalisering av intensiteter utført ved hjelp av R-funksjonen «quantile» for å definere 9 terskler
X
1
.
ni
som deler de skalerte verdier i kontroll klassen i 10 quantiles.
Flere bioinformatikk metoder er gitt i File S1.
Immuno-baserte kommersielle og kliniske analyser for forskjellige apolipoproteins
Apoc-III og apoB-100 ble målt ved Immunoturbidometry på en Olympus 400 autoanalyse, ved hjelp av K-analysesett (cat # KAI-006 og 6142, Kamiya Biomedical, Seattle, WA, USA) som tidligere beskrevet [22]. I huset ELISA for Apoc-III er beskrevet i File S1. Apoc-I-nivåer ble testet ved hjelp av en AssayMax Menneskelig Apolipoprotein C-I ELISA kit (Assaypro, St. Charles, MO, USA) i henhold til produsentens instruksjoner. Rensede humane Apoc-I-standarder ble inkludert i settet.
Resultater
Bruk av MS-basert metode for å identifisere serum peptider signatur for magekreft
Tidligere studier har vist at godt -Designet og omhyggelig kontrollerte sera peptidomics kan separere spesifikke kreftbærende pasienter og ikke-kreft-kontroller basert på karakteristiske mønstre av signatur peptider i serum [10], [11]. Vi undersøkt hvorvidt disse resultatene kan reproduseres for magekreft og hvorvidt slik separasjon er tilstrekkelig for analyse av sera fra forskjellige kilder. Vi først analysert serum peptid-profiler av 62 pasienter med kreft i magesekken i ulike faser, så vel som 41 kontrollserum fra friske frivillige. Disse sera ble hentet fra to kilder: (i) RNTech, et selskap som samlet sera i Bucuresti, Romania; og (ii) Asterand, et selskap som har samlet sera i USA. For hver kilde, ble sera samlet opp ved hjelp av en enkelt standard kliniske protokoll. Protokollene var sammenlign f.eks typen av røret, koaguleringstiden og den første frysing av sera (se Metoder), men bloduttaksrørene var forskjellig. Aldersfordeling, kjønn og kliniske karakteristika av de 103 personer som inngår i denne studien er gitt i tabell 1 og i mer detalj i File S1. Et sammendrag av kliniske stadier av magekreft-avledede sera for begge kilder er gitt i Tabell 1. Eksempel på håndtering etter den første samlingen var ensartet, som involverer 2 fryse-tine-sykluser for å oppnå innledende lagring og påfølgende alikvoteringsprosessen for peptid ekstraksjon og MS-analyse. Alle 103 serumprøver ble bearbeidet manuelt, men identisk anvendelse av ett-trinns revers-fase-ekstraksjon. Seraprøver og prøve replikater ble behandlet og lese tilfeldig på forskjellige datoer å unngå forberedelse date-forbundet bias. Alle sera forberedelse og deponering ble utført av samme person. På samme måte ble alle MALDI målinger utføres av samme tekniker. Den MALDI-TOF instrumentets følsomhet ble rutinemessig kontrolleres og stadig kalibreres ved alle målinger.
Analyse av MS-baserte sera peptidome avdekket en 9-peptid signatur som skiller magen adenokarsinom pasienter fra kreft gratis kontroller
Totalt 637 masse topper (funksjoner) ble identifisert i de 103 undersøkte prøvene. Resultatene av MALDI ble omdannet til en matrise inneholdende signalintensitetene til 637 massetopper (funksjoner) for hver av de studerte serumprøvene med replikater for hver prøve (se metoder, bioinformatikk). Mens unsupervised hierarkisk clustering bruk av alle funksjonene ikke skille kreft og ikke-kreft prøver, PCA analyse av alle funksjoner for hver sera kilde differensiert mellom kreft og ikke-kreft prøver (Tall S1-S3). Dette antydet at funksjonen filtrering og utvalg er viktig før ansette maskinlæring basert klassifikasjon. Derfor har vi (jeg) brukt en funksjon filtrering og utvalg trinn og (ii) ansatt Mann-Whitney p-verdier og peak intensiteter som tidsavgrensninger for å velge et delsett av funksjoner (topper) for bruk i maskinlæringsforsøk. (Se metoder, bioinformatikk). Vi deretter analysert innenfor hver kilde (RNTech og Asterand) om sera fra pasienter og kontroller kan bli separert. Vi fikk gode resultater for hver av de single-source classifiers; SVM-baserte classifiers for RNTech og Asterand hadde 90,0% og 93,0% av forventet nøyaktighet, henholdsvis i henhold til ti-fold kryssvalidering av treningssettet (Tabell 2A). Tilfeldig stokking av gruppemedlemmene resulterte i mye høyere p-verdier (f.eks 0,8) og lav spådd nøyaktighet i trente modeller per hver sera kilde. Dette indikerte betydningen av kliniske tilstander for klassifisering i to klinisk-definerte grupper innenfor hver sera kilde. Imidlertid gjorde de single-source classifiers ikke utføre godt på den andre kilde prøvene, spår riktig klinisk status bare i 35/60 prøver (Asterand på RNTech) og 25/43 (RNTech på Asterand) (tabell 2A). Derfor kilde favorisering av peptidome har en betydelig effekt på nøyaktigheten av prediksjon.
Den manglende evne modeller trent på en kilde til tilstrekkelig forutsi kliniske tilstander fra målinger fra annen kilde (tabell 2A) er bedre presenteres når du sjekker de funksjonene som er valgt av de kildespesifikke classifiers (Tabell 3). Noen av funksjonene som fungerte bra på en kilde viste en motsatt trend på den andre kilden. Andre var viktig for klassifisering i en kilde, men hadde liten eller ingen virkning i den andre. Disse observasjonene førte oss til en komparativ analyse av data fra begge kilder. Vi produserte boksplott for alle peak intensiteter, ifølge kliniske grupper. Disse plottene viste at når man sammenligner kontroll- og kreft intensiteter for hver funksjon i en kilde, kan trenden observert variere mellom de to kildene (f.eks m /z 1520, figur 1A). Selv når trenden var vedvarende i begge kilder, kan intensitetsverdiene være annerledes (f.eks m /z 6431; RNTech høyere enn Asterand, figur 1B). For å skape en forutsigelse modell, vi trengte å (i) forkast kildespesifikke fenomener, og (ii) legger en normalisering skritt som vil redusere effekten av forskjellige intensitetsnivåer hvor trenden ble opprettholdt.
En og B representerer ikke-normaliserte peak intensitet; C og D representerer følgende intensiteter quantile normalisering ifølge kontrollere hver sera kilde (se metoder). Rn, RNTech; As, Asterand.
Bruk av blandet datasett med Mann-Whitney p-verdi cutoff for funksjonsvalg kan forkaste kildespesifikke fenomener. Topper som viste ulike trender i ulike kilder vil ikke være vesentlige i den blandede sett for klinisk gruppebasert separasjon; feature 1520 åpenbarer motsatte trend mellom kilder, ble valgt av hver enkelt kilde klassifikator (figur 1 A, tabell 3). Derfor er det bidratt til mangelen på vellykket resultatene for hver enkelt kilde klassifisereren på den andre kilden (tabell 2A). Som forventet, ble denne funksjonen ikke valgt av noen modell basert på blandet settet. Vi skapte en blandet datasett mens tilfeldig fjerne 21 mage kreftprøver fra den blandede treningssettet, og brukt disse 21 fjernet prøvene for validering. I tillegg brukte vi de 12 kreftfrie kontrollprøver samlet inn i vårt laboratorium som en uavhengig kontroll valideringssettet. Modellen ble valgt i overensstemmelse med en maksimal forutsies nøyaktig i samsvar med et ti-gangers kryssvalidering, som før. Den beste scoring modell for blandet settet var å bruke 9-funksjoner (Mann-Whitney p-verdi filter av 0,044) og hadde en anslått nøyaktighet på 84,1% i henhold til ti-fold kryssvalidering av treningssettet. Viktigere, det nøyaktig spådde 10/12 israelske kontroller. Men, spådde dette klassifikator utilstrekkelig (13 av 21) de 21 fjernet blandet magekreftprøver brukes for validering.
Derfor, for å redusere effekten av kilderelaterte forskjeller i intensitetsnivåer, filterets ytelse i funksjonen valget var forbedret ved å introdusere en quantile normaliseringstrinn. Dette normalisering ble utført i henhold til kontroller for hver sera kilde uavhengig av de andre kilder (se metoder, bioinformatikk). For funksjoner, for eksempel m /z 6431 med en vedvarende trend i begge kilder, korrigert dette trinnet intensiteten skjevhet (figur 1D). Faktisk, 6431 egenskap ble ikke valgt for den ikke-normaliserte mix-baserte klassifikator. Det ble imidlertid valgt for den normaliserte blanding baserte klassifiserings (tabell 3). Likevel, for funksjoner som m /z 1520 med motsatte tendenser i begge kilder, dette trinnet kunne ikke endre trenden, som forventet (figur 1C).
Vi testet quantile normalisering effekt ved å bruke den før i snitt og funksjonsvalg. For å vurdere bedre prediksjonsnøyaktigheten vi ansatt Matthews korrelasjonskoeffisient (MCC) tiltak. MCC brukes i maskinlæring som et mål på kvaliteten av binære (to klasse) klassifikasjoner og returnerer en verdi mellom -1 og +1. En koeffisient på 1 representerer en perfekt prediksjon, 0 gjennomsnittlig tilfeldig prediksjon og -1 en invers prediksjon. MCC er generelt ansett som en balansert tiltak som kan brukes selv om klassene er av forskjellige størrelser. Vi dermed beregnet MCC for ulike klassifiserings eksperimenter for å vise effekten at normalisering hadde på klassifisering. Resultatene er vist i tabell 2. Merk at uten normalisering, MCC var relativt høy for treningssettet, men viste middelmådige resultater på valideringssettet (Tabell 2). Normaliserings trinnet ga lignende høye MCC verdier for trening og valideringssett (tabell 2). Normalisering skritt for å kontrollere grense kilde skjevhet ikke oppheve behovet for maskinlæring baserte klassifikator å definere et diskriminerende mønster; PCA av de to kildene blandet normaliserte datasett resulterte igjen i dårlig skille mellom magekreft og kontrollprøver (figur S4).
Immuno-basert validering for funksjoner som representerer Apoc-I og Apoc-III
klassifiserings resulterte fra den blandede datasettet, etter quantile normaliseringstrinn, anvendes 9-funksjoner (tabell 2). Tre av de 9 funksjoner involvert apolipoproteins: Apoc-III (funksjon 9443) og Apoc-I (funksjoner 6431 og 6629, Tabell 3). For ytterligere å verifisere MALDI-baserte resultater, må vi først utviklet en ELISA-test for kvalitativ påvisning av Apoc-III i serum (se metoder) og testet alle seraprøver fra Asterand og RNTech. Resultater av ELISA fulgt utviklingen av MALDI resultater (figur 2A, B); Intensiteten av Apoc-III var signifikant høyere i kontrollgruppene, sammenlignet med kreft grupper i begge sera kilder. Vi analyseres videre sammenhengen mellom Apoc-III ELISA og 9443 MALDI resultater per hver prøve; ELISA og MALDI Resultatene viste signifikant korrelasjon (p 0,0001, Kendall ran korrelasjon tau). Vi deretter sendt sera porsjoner fra nesten alle prøvene (samme fryse region) til en ekstern klinisk laboratorium for immunoturbidity basert kvantitativ analyse for Apoc-III [22]. Resultater ble oppnådd i mg /dl (figur 2C), og som ovenfor, mengden av Apoc-III var betraktelig høyere i kontrollgrupper av begge sera kilder.
Boxplot presentasjoner av MALDI-funksjonen 9443 (A), kvalitativ ELISA-analysen for Apoc-III (B) og kvantitativ immunoturbidity basert assay for Apoc-III (C). For A, andeler representerer MALDI-basert intensiteter følgende quantile normalisering ifølge kontrollere hver sera kilde (se metoder). For B, andeler representerer OD forholdstall på Apoc-III ELISA følgende normalisering til gjennomsnittet av kontroller for hver sera kilde. For C, andeler representerer Apoc-III-konsentrasjonen i serum. For RNTech (Rn), * p-verdi 0,0001 for A og B, og 0,05 for C. For Asterand (As), * p-verdi 0,01 for A og B, og = 0,06 for C; Wilcoxon rank sum test med kontinuitet korreksjon (alternativ hypotese: true plassering skiftet er større enn 0)
For å verifisere Apoc-I MALDI resultater, vi ansatt en kommersiell kvantitative ELISA kit som inkluderer Apoc-I. standarder og gjenkjenner både 6431 og 6629 varianter av Apoc-i. Resultater ble oppnådd i ug /ml (figur 3B) og fulgte mønsteret observert for de MALDI resultater (figurene 1D og 3A); Intensiteten av Apoc-I var signifikant høyere i kontrollgruppene, sammenlignet med kreft grupper i begge sera kilder. For å vurdere spesifisiteten av Apoc-I og Apoc-III reduksjon i sera av magekreft bærende pasienter, vi analysert apoB-100 nivåer. Prøvene analyseres for Apoc-III i det ytre klinisk laboratorium ble analysert i parallell til apoB-100-nivåer ved hjelp immunoturbidity basert kvantitativ analyse. Resultater ble oppnådd i mg /dl (figur 3C) og viste ingen signifikant trend mellom kontroll og magekreftbærende grupper. Derfor vi kunne gjøre bruk av apoB-100 resultater som en normaliserende faktor for bioinformatikk analyse av kvantitative Apoc-I og Apoc-III resultater (figur 3C, 3B, 2C, henholdsvis).
Boxplot presentasjoner av MALDI-funksjonen 6629 (A), kvantitativ ELISA assay for Apoc-i (B) og kvantitativ immunoturbidity basert assay for apoB-100 (C). For A, andeler representerer MALDI-basert intensiteter følgende quantile normalisering ifølge kontrollere hver sera kilde (se metoder). For B og C enheter representerer Apoc-I og apoB-100-konsentrasjon i serum, respektivt. For RNTech (Rn), * p-verdi = 0,002 for A og 0,0001 for B. For Asterand (As), * p-verdi 0,05 for A og = 0,001 for B; Wilcoxon rank sum test med kontinuitet korreksjon (alternativ hypotese: true plassering skiftet er større enn 0)
Vi analyserte klinisk Apoc-I, Apoc-III og apoB-100 for ytterligere prøver fra magekreftpasienter. og kreftfrie kontroller (RNTech kilde, samme fryse-tilstand, inkludert 10 gastritt pasienter i kreftfrie kontroller, merk Tabell 1 for den totale prøvenumrene). Vi har også analysert klinisk CA19-9 og CRP-nivå for alle prøvene (samme fryse-state). Vi så anvendt Clementine 10,0 programvare på RNTech prøver for å vurdere om regler fastsatt på basis av apoB-100-normalisert CI og C-III, CA19-9 og CRP-serumnivåer kan brukes til å klassifisere mellom sera fra kontroll og magekreft grupper av RNTech kilde som en trening kilde. Kombinasjonen av alle 4 parametere ga bedre prediksjon nøyaktighet i forhold til kombinasjonen av mindre enn 4 parametere (figur 4, og data ikke vist). Prediksjon nøyaktigheten av trening settet var 88,4%. Vi brukt de RNTech oppnådde reglene for Asterand kilde og prediksjon nøyaktighet var 74,4% (figur 4). For både trening og validering sensitiviteten var utmerket (87/90 kombinert), men spesifisiteten var mindre nøyaktig (37/52 kombinert).
(A) Nøyaktighet av prediksjon produsert av beslutningstrær hjelp (1) apoC- I /apoB-100 og Apoc-III /apoB-100; (2) CRP (ug /ml) og CA19-9 (U /ml); og (3) Apoc-I /apoB-100, Apoc-III /apoB-100, CRP (ug /ml) og CA19-9 (U /ml) i løpet av treningssett RNTech og testing satt Asterand. (B) Beslutningstre hjelp av fire har Apoc-I /apoB-100, Apoc-III /apoB-100, CRP (mg /ml) og CA19-9 (U /ml).
diskusjon
I de siste årene, ganske mange rapporter som beskriver MS-identifiserte serum biomarkører /signaturer for kreft stater ble påvist feil [5], [18]. Ulike kilder til skjevhet ble beskrevet blant annet prøve utvalg, håndtering, bearbeiding, lese og analysere [18], [20], [21]. Ved fjerning av skjevhet-medvirkende faktorer, ble det vist at SELDI-TOF MS hele serum proteomikk profilering med IMAC overflaten ikke pålitelig oppdage prostatakreft [23]. Derfor forfatterne foreslo at det er usannsynlig at en massespektrometri tilnærming ved hjelp av ubearbeidet serum ville skille mellom menn med og uten prostatakreft [24]. På den annen side, andre nylige MALDI-TOF-baserte studier som unngikk skjevhet-medvirkende faktorer og ansatt en ett-trinns sera prosessering identifisert diskriminerende biomarkør signaturer for ulike kreftformer, inkludert prostata kreft [11].
I denne studien vi innført et skritt sera behandling tilnærming for identifikasjon av en peptidome basert signatur å skille sera avledet fra magen adenokarsinom pasienter. Vi har gjort en rimelig innsats for å unngå tidligere rapportert skjevhet medvirkende faktorer [18]. Vi analyserte sera fra to biorepositories. Vi har observert at selv når sera håndtering, prosessering, MALDI lesing og analyse er de samme, blir peptidome analyse forspent ved biorepository. I tillegg til de sosio geografiske forskjeller (Romania og USA som kilde for prøvene i henholdsvis RNTech og Asterand,), kilden relatert skjevhet kan være grunn til merket av blod tilbaketrekking tube, som brukes i de forskjellige biorepositories.
Vi brukte en blandet prøvesett fra to sera kilder for funksjonsvalg og lagt en cross-kilde normalisering skritt for å kompensere for kilde bias. Vi fant ut at (i) bruk av den blandede datasett med Mann-Whitney p-verdi cutoff for funksjonsvalg kan forkaste kildespesifikke funksjoner, og (ii) en quantile normalisering skritt bidrar til å velge (for maskinlæring) delvis samstemmige funksjoner , hvori trendene er overensstem mellom kilder, men intensitetsnivåer er forskjellig mellom kildene. Behovet for normalisering, når du arbeider med prøver fra ulike kilder, ble allerede vist for microarray-baserte high throughput teknologi [25].