PLoS ONE: GWAS Meets Mikromatrise: er resultatet av Genome-Wide Association Studier og Gene-Expression Profilerings Konsekvent? Prostata kreft som en Example

Abstract

Bakgrunn

Genome-wide assosiasjonsstudier (GWASs) og global profilering av genuttrykk (microarrays) er to store teknologiske gjennombrudd som gjør at hypotesen fritt identifikasjon av kandidat gener assosiert med tumorigenesis. Det er ikke opplagt om det er en sammenheng mellom kandidatgener identifisert av GWAS (GWAS gener) og de som er identifisert ved profilering av genuttrykk (microarray gener).

metodikk /hovedfunnene

Vi brukte kreft~~POS=TRUNC genetiske markører Følsomhet database for å hente enkeltnukleotidpolymorfi fra kandidatgener for prostatakreft. I tillegg gjennomførte vi en stor meta-analyse av genuttrykk data i normal prostata og prostata svulstvev. Vi identifiserte 13,905 gener som ble forhørt av både GWASs og mikromatriser. På grunnlag av P-verdier fra GWASs, valgte vi 1,649 viktigst forbundet gener for funksjonell annotering av Database for kommentering, visualisering og integrert Discovery. Vi har også gjennomført funksjonell annotering analyse ved hjelp av samme antall av de øverste gener identifisert i meta-analyse av genuttrykk data. Vi fant ut at gener involvert i celle adhesjon var overrepresentert blant både GWAS og microarray gener.

Konklusjon /Betydning

Vi konkluderer med at resultatene av disse analysene tyder på at å kombinere GWAS og microarray data ville være en mer effektiv tilnærming enn å analysere individuelle datasett og kan bidra til å avgrense identifisering av kandidatgener og funksjoner knyttet til tumorutvikling

Citation. Gorlov IP, Gallick GE, Gorlova OY, Amos C, Logothetis CJ (2009) GWAS Meets Mikromatrise: er resultatet av Genome-Wide Association studier og Gene-Expression Profilerings Konsekvent? Prostatakreft som et eksempel. PLoS ONE 4 (8): e6511. doi: 10,1371 /journal.pone.0006511

Redaktør: Eshel Ben-Jacob, Tel Aviv University, Israel

mottatt: May 11, 2009; Godkjent: 29 juni 2009; Publisert: 04.08.2009

Copyright: © 2009 Gorlov et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Denne studien ble støttet av David Koch Senter for anvendt forskning i Genitourinary Cancer. Delvis støtte for denne studien har blitt gitt av amerikanske National Institute of Health gir R01CA121197-01A2 til CA og AR055258 sette bort til OG. Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Microarray-teknologien tillater samtidig vurdering av ekspresjon av praktisk talt alle gener i genomet. Denne tilnærmingen har blitt mye brukt for å identifisere kandidat gener assosiert med cancer utvikling og progresjon [1] – [3]. Genom-wide assosiasjonsstudier (GWASs) har nylig dukket opp som et kraftig verktøy for å identifisere genetiske polymorfismer forbundet med kreftrisiko [4], [5]. I en GWAS, er hundretusener av enkeltnukleotidpolymorfi (SNPs) genotypet i et stort antall tilfeller og kontroller. En forskjell i allele eller genotypefrekvensene mellom saker og kontroller antyder en sammenheng mellom kreftrisiko og SNP og en koblet gen eller regulerende område.

Om disse to tilnærmingene gi sammenlignbare resultater har ikke blitt undersøkt. Nylig Chen et al. [6] identifisert de genene som har en tendens til å bli uttrykt forskjellig på tvers av ulike eksperimentelle forhold og stater bruker gen-uttrykk data fra Gene Expression Omnibus (GEO). De fant at differensielt uttrykte gener er mer sannsynlig å bli oppdaget som sykdom varianter i assosiasjonsstudier.

I denne studien foretok vi en mer direkte tilnærming til å koble GWAS og microarray data. Vi utførte funksjonelle merknader av de beste genene identifisert i prostatakreft GWASs og det samme antall av de øverste kandidat gener identifisert i en meta-analyse av gen-uttrykk data for normal prostata og prostata svulst. Resultatene fra våre analyser tyder på at disse to tilnærmingene gi lignende resultater på funksjonsnivå.

Materialer og metoder

Flere prostatakreft GWASs ble nylig gjennomført, og en rekke kandidat gener ble identifisert ( tabell 1) [7] – [10]. Selv om bare noen få SNP’er med genom-wide signifikansnivå, 10

-7, ble identifisert i disse studiene ble et antall av SNP var signifikant ved nivået for individuelle tester, men ikke-signifikant etter korrigering for multippel testing. Slike SNPs sannsynlig indikere berikelse med årsaks SNPs som ikke kommer til genom-wide signifikansnivå på grunn av sin lille effektstørrelse eller lav allelfrekvens [11].

GWAS data for denne analysen ble hentet fra Kreft genetiske markører Følsomhet (CGEMS) database, https://cgems.cancer.gov/about/executive_summary.asp. Vi brukte Oncomine databasen https://www.oncomine.org/main/index.jsp å gjennomføre en meta-analyse av antall studier som sammen genekspresjon i normale prostatavev med den av lokalisert prostatatumorvevet [12]. Den fullstendige listen over studiene brukt i meta-analysen kan finnes i de supplerende materiale (Tabell S1). Vi brukte en forlengelse av Stouffer metode [13] for meta-analyse. Denne tilnærmingen er basert på estimering standard normalavvik,

Z

, og er lik den nylig foreslått av Ochsner et al tilnærming. [14]. Meta-analysen identifisert en rekke gener uttrykt forskjellig mellom normal prostata og prostata svulst.

Resultater

Som en første validering av vår hypotese om at GWASs og microarrays tendens til å identifisere de samme genene, vi brukes en meta-analyse av Oncomine gene expression-data for å vurdere ekspresjon av de GWAS-identifiserte gener (tabell 1). Vi fant ut at alle unntatt tre (

HNF1B, EHBP1

, og

LMTK2

) av genene ble uttrykt forskjellig mellom normal og tumorous prostata. Derfor 10 av 13 (77%) av de GWAS gener ble uttrykt forskjellig i overgangen fra normal prostata til prostata kreft som er høyere enn man kan forvente å oppdage blant tilfeldig utvalgte 13 gener -1.1 (χ

2 = 20,9, df = 1, P . 0,0001)

prostatakreft GWAS data fra CGEMS fase 1A og fase 1B, ble brukt i analysen. Vi begrenset våre analyser til genet-forbundet SNPs å gjøre GWAS og microarray resultater sammenlignbare. Vi fulgte CGEMS betegnelse av genet-forbundet SNPs. En total 63,831 gen-forbundet SNPs tilhører 16,550 unike gener ble identifisert. For hvert gen, ble en SNP med den minste P-verdi som brukes til å karakterisere en krets. Dersom en gitt SNP var assosiert med multiple gener, ble alle de forbindelser som inngår i vår analyse. Fordi i mange tilfeller aliaser snarere enn offisielle genet navn ble brukt i GWAS, koblet vi ulike genet identifikatorer til de offisielle genet navn og EntrezIDs bruker den nyeste versjonen av NCBI genet databasen (17 januar 2009). Overlapping av de unike GWAS og microarray gener viste at 13,905 gener ble undersøkt i både GWAS og microarray analyser. Listen av genene med tilsvarende GWAS og microarray P-verdiene er vist i tabell S1.

For å vurdere om GWAS og microarray analyser tendens til å identifisere tilsvarende sett med gener vi vurdere en sammenheng mellom -Logg (P) verdier basert på GWAS data og -Logg (P) verdier basert på analyse av genuttrykk. Vi fant en liten, men signifikant (på grunn av den store utvalgsstørrelse) positiv sammenheng mellom GWAS og microarray -log (P) s (figur 1)

Svart linje viser lineær regresjon kurven, rød linje -. Glidende gjennomsnitt beregnet ved hjelp av en skyvevindu på 100 poeng. Spearmans rank-order korrelasjonskoeffisient. R = 0,043, N = 13 905, P = 0,0000001

Database for kommentering, visualisering og integrert Discovery (DAVID) [15] ble brukt for funksjonell annotering av GWAS og microarray gener. Vi valgte gener med GWAS P verdier ≤0.01. Totalt 1,649 gener ble identifisert. Vi brukte nøyaktig det samme antall av de gener som er identifisert i den meta-analyse av gen-ekspresjon av data. For å kontrollere for eventuelle skjevheter i genet utvalg, brukte vi en liste over 13,905 gener som bakgrunn. Funksjonelle merknads diagrammer ble brukt til å hente en utvidet merknad dekning som inkluderte mer enn 40 merknader kategorier [15]. En funksjonell diagram for de beste GWAS genene kan finnes i tabell S2. Mange celle adhesjon relaterte kategoriene er blant de beste merknads kategorier. Clustering av vilkårene i funksjonelle merknader oppsummert alle typer funksjonsbeskrivelse som brukes av DAVID, identifisere celle adhesjon som den øverste klyngen, etterfulgt av plasmamembranen og fibronectin.

Funksjonell annotering av topp differensielt uttrykte gener identifisert cytoskjelettet, fokale vedheft, ekstracellulære matrise, og celle adhesjon som de beste merknads vilkår (Tabell S3). Clustering av vilkårene i funksjonell annotering demonstrert cytoskjelettet, aktin cytoskjelettet, ekstracellulære matrise, og celle adhesjon blant de identifiserte klynger. Figur 2 viser resultatene av clustering av funksjonelle termer av David basert på analyse av toppen GWAS og differensielt uttrykte gener (se også tabell S4). I begge listene, er de fleste av de beste funksjonelle klynger avledet fra GWAS og microarray data direkte eller indirekte relatert til celle adhesjon.

Funksjonell klynger knyttet til celle adhesjon er vist i blått. Detaljert informasjon om sammensetningen av klynger kan finnes i tabell S4.

neste sett for en overlapping mellom topp 1649 GWAS og de beste 1,649 differensielt uttrykte gener. Vi identifiserte 248 vises i begge lister gener (se supplerende materiale for en liste av genene). Dette tallet er høyere enn det som forventes ved en tilfeldighet. Hvis vi tilfeldig prøve 1,649 gener fra blant 13,905 gener, ville det forventede antall gener som finnes i to uavhengige utvalg være (1649/13905) 2 * 1649 = 23,2. Den funksjonelle annotering av disse 248 genene identifisert cytoskjelettet, brennvidde heft, og aktinbindende som topp funksjonelle kategorier. Funksjonell clustering av genene identifisert celle migrasjon, cellemotilitet, cytoskjelettet, og celle adhesjon som de beste klynger.

Diskusjoner

GWAS og microarray analyser både tillate objektiv identifisering av kandidatgener og veier i forbindelse med kreftutvikling. Disse to fremgangsmåter som hver har sine fordeler og ulemper. Ved å kombinere data fra flere uttrykksstudier, analyser av genekspresjon har statistisk styrke til å påvise selv små forskjeller i genuttrykk mellom normale og tumorvev. På den annen side, fordi gener i det humane genom som er involvert i flere interaksjoner, kan modulering av ekspresjon av et enkelt gen forårsake en «ripple-effekt» på flere nedstrøms mål, noe som gjør det vanskelig å skille kausale og induserte endringer i genekspresjon. Dette er lite sannsynlig å være et problem i GWASs. GWASs, men er ofte statistisk underpowered å oppdage SNPs med liten effekt størrelse.

Når vi sammenlignet kandidatgener for prostatakreft identifisert av GWAS med dem identifisert av microarray, bemerket vi en signifikant positiv korrelasjon mellom GWAS og microarray -log (P) s. Korrelasjonen var liten, med det Pearson rang korrelasjonskoeffisient å være bare 0,04, men positiv korrelasjon mellom to rekker er forventet å bli drevet av et forholdsvis lite antall gener årsaks. Ikke alle årsaks genene vil bli oppdaget av GWAS. Selv om genet er mekanistisk forbundet med prostata tumorgenese, kan den bli detektert av GWAS bare hvis den bærer genetiske varianter som modulerer dens funksjon. På den annen side, er gener som er identifisert ved mikromatriseanalyse antas å være en blanding av årsaks gener og de gener som er differensielt uttrykt på grunn av krusningseffekten av årsaks gener. Dette tyder på at bare en brøkdel av genene vesentlige i begge analysene er årsaks gener.

Vi fant at den øverste GWAS og uttrykt forskjellig kandidater ble anriket i celle adhesjon gener. Hvis vi ser på alle kjente celleadhesjonsprosesser gener i genomet, bare 74 gener eller 10% av dem var blant de beste differensielt uttrykte gener. Hvis celle adhesjon veien er forbundet med prostata tumorigenesis, kan man forvente at andre celleadhesjonsprosesser gener-de som ikke gjør det til toppen 1,649 gener-også vil ha en tendens til å bli betydelig positivt forbundet. Vi fant ut at den gjennomsnittlige GWAS-avledet P-verdi for celle adhesjon gener som ikke klarte å nå toppen 1649 var lavere enn gjennomsnittsverdien for de GWAS gener (t test = 2,9, df = 13 902, P = 0,001). Et lignende resultat ble oppnådd for P-verdier utledet fra analyse av genuttrykk: den absolutte Z stillingen var høyere blant celleadhesjonsprosesser gener (unntatt de blant de beste 1649 gener) enn det som var gjennomsnittet Z score (t test = 1,81, df = 17 811, P = 0,07 på den tosidige test og P = 0,03 på den ensidige test). Dette tyder på at celle adhesjon funksjon som helhet er forbundet med prostata tumorigenesis.

Både GWAS og microarray gener danner funksjonelle klynger knyttet til ulike aspekter ved celle adhesjon, inkludert celle adhesjon selv, celle veikryss, ekstracellulære matrix glykoproteiner, fibronektin , aktin cytoskjelettet, og celle-motilitet. Flere andre klynger viser også en mekanistisk assosiasjon med celle adhesjon. For eksempel, cadherin opptak fra celleoverflaten ved endocytose regulerer nivået for de frie cadherins på celleoverflaten og derfor celleadhesjon [16]. Også, sink finger-proteiner med LIM domenet er viktige for fokal adhesjon og celle adhesjon til fibronektin [17], [18]. Modulering av celleadhesjon funksjon synes ikke å være begrenset til noen spesiell type, men adhesjon omfatter cadherins, integriner, og selectins samt adhesjonsmolekyler forbundet med tett veikryss.

Resultatene av en rekke studier foreslo involvering av celleadhesjon system i prostata kreftutvikling. Cadherins spille en rolle i regulering av tumorcelle-proliferasjon gjennom cykliner og cyklin-avhengige kinaser [19]. Griner er involvert i ulike aspekter av prostata tumordannelse, blant annet celleproliferasjon, celle motilitet, og apoptose [20] – [22]. Modulering av celleadhesjon kan spille en viktig rolle i epitelial-til-mesenchymale overgang som antas å være et viktig steg i malign transformasjon [23] – [25]. Også resultatene av en rekke studier suggestd en involvering av celle adhesjon i angiogenese [26] – [28]

GWAS-identifiserte gener anses å være kreftresistensgener som i hovedsak forbundet med startfasen.. Vi mener imidlertid at gener identifisert av GWAS er også sannsynlig å inkludere gener som er viktige for tumorprogresjon. Faktisk, påvisning av tumor er vanligvis symptomatisk: svulsten må nå en viss størrelse som skal påvises. Dette tyder på at gener involvert i tumorprogresjon vil være blant GWAS-oppdagede kandidat gener. Derfor kan GWAS og analyse av genuttrykk målrette hovedsak de samme sett av gener, som gir det teoretiske grunnlaget for felles analyse av GWAS og microarray data.

I sammendraget, vår analyse fant en betydelig overlapping mellom prostatakreft gener identifisert ved GWAS og de som er identifisert av global profilering av genekspresjon. Vi identifiserte celleadhesjon som en biologisk funksjon i forbindelse med prostata tumorigenesis. Resultatene av denne studien tyder også på at å kombinere GWAS og microarray data kan være en mer effektiv tilnærming enn å bruke bare analysen av de enkelte datasett, og kan bidra til å avgrense identifisering av kandidatgener og /eller funksjoner som er involvert i tumorutvikling.

Hjelpemiddel Informasjon

Tabell S1.

doi: 10,1371 /journal.pone.0006511.s001 plakater (0,83 MB PDF)

Tabell S2.

doi: 10,1371 /journal.pone.0006511.s002 plakater (0,07 MB XLS)

tabell S3.

doi: 10,1371 /journal.pone.0006511.s003 plakater (0,33 MB XLS)

Tabell S4.

doi: 10,1371 /journal.pone.0006511.s004 plakater (0,33 MB XLS)

Legg att eit svar