PLoS ONE: Automatisk Tumor-Stroma Separasjon i fluorescens TMA Aktiverer Kvantitativ høy gjennomstrømming analyse av flere Cancer Biomarkers

Abstract

Den kommende kvantifisering og automatisering i biomarkører basert histologisk tumor evalueringen vil kreve beregningsmetoder i stand til automatisk å identifisere kreft områder og skille dem fra stroma. Som ingen enkel regel som gjelder svulst biomarkør er tilgjengelig, bruker patologi rutinemessig morfologiske kriterier som en romlig referansesystem. Vi her presentere og vurdere en metode som kan utføre klassifiseringen i immunfluorescens histologisk lysbilder utelukkende ved hjelp av en DAPI bakgrunn flekken. På grunn av begrensningen til en enkelt fargekanal dette er iboende utfordrende. Vi dannede celle grafer basert på den topologiske fordeling av vev cellekjerner og ekstraheres de tilsvarende graf-egenskaper. Ved å bruke topologisk, morfologiske og intensitet baserte funksjoner kan vi systematisk kvantifisere og sammenligne diskriminering evnen enkelte funksjoner bidra til den generelle algoritmen. Vi her viser at når klassifisere fluorescens vev lysbilder i DAPI kanalen, morfologiske og intensitet baserte funksjoner klart større enn topologiske de som har blitt brukt utelukkende i beslektede tidligere tilnærminger. Vi samlet de 15 beste funksjonene å trene en støtte vektor maskin basert på Keratin farget kreftområder. På en test sett av TMA med 210 kjerner av triple negative brystkreft vår klassifikator var i stand til å skille mellom tumor og stroma vev med en total samlet nøyaktighet på 88%. Vår metode gir først resultater på diskriminering evnen til trekk-grupper som er avgjørende for en automatisert tumordiagnostikk. Dessuten gir det en objektiv romlig referansesystem for multipleks analyse av biomarkører i fluorescens immunhistokjemi

Citation. Lahrmann B, Halama N, Sinn HP, Schirmacher P, Jaeger D, Grabe N (2011) Automatisk Tumor- stroma Separasjon i fluorescens TMA Aktiverer Kvantitativ høy gjennomstrømming analyse av flere Cancer Biomarkers. PLoS ONE 6 (12): e28048. doi: 10,1371 /journal.pone.0028048

Redaktør: Pierre Busson, Institute of Cancerology Gustave Roussy, Frankrike

mottatt: 21 september 2011; Godkjent: 31 oktober 2011; Publisert: 02.12.2011

Copyright: © 2011 Lahrmann et al. Dette er en åpen-tilgang artikkelen distribueres under betingelsene i Creative Commons Attribution License, som tillater ubegrenset bruk, distribusjon og reproduksjon i ethvert medium, forutsatt den opprinnelige forfatteren og kilden krediteres

Finansiering:. Funding var gitt av den tyske departementet for forskning og utdanning (BMBF) i sine MEDSYS og forsys finansiering programmer. Grant Numbers: 0315401B (MEDSYS), 0.315.263 (Forsys). Finansiører hadde ingen rolle i studiedesign, datainnsamling og analyse, beslutning om å publisere, eller utarbeidelse av manuskriptet

Konkurrerende interesser:.. Forfatterne har erklært at ingen konkurrerende interesser eksisterer

Innledning

Automasjon i immunhistokjemi bildebehandling er i dag en viktig teknologisk utvikling som finner sted i den kliniske jakten på objektive biomarkører innen forskning og diagnostikk. I kreftforskning en av de viktigste, men også ekstreme utfordringene er utvikling av metoder for automatisk separasjon av tumorvevet, og stroma [1], [2]. Suksess her vil ha en enorm innvirkning på anvendelsen av biomarkører i rutinekreftdiagnostikk og behandling samt den store generasjonen av histologiske vev data til forskningsformål. En viktig metode som rutinemessig brukes i denne sammenheng, som vi her bruker for å illustrere problemet er det Tissue Microarray (TMA) teknologi, som ble innført i 1998 [3]. TMA tillate samtidig immunhistokjemisk analyse av flere hundre vev på et enkelt lysbilde [4] – [6]. Men som regel i alle felt av patologi, manuell visuell scoring av TMA er rutinemessig basert på kvantitativ analyse av protein nivåer av patologer eller andre eksperter er subjektive, arbeidskrevende, er tidkrevende og viktigst lider av intra og inter-observatør variabilitet [7]. Som en løsning, har fluorescerende stand mikroskopiske hel-slide skannere blitt tilgjengelig nylig, men er fortsatt bare sjelden brukes selv om de vil ha en nøkkelrolle i å transformere histologisk evaluering til objektivitet. Fluorescens basert flekker her er viktig som den seirer nøkkelen problemet med lysfelt flekker av objektiv og automatisk fange av forskjellige biomarkør signaler [8]. Selv fluorescens hjelper i kvantifisering av enkeltceller, gjør det ikke i seg hjelp i å skille tumor og stroma. I fluorescens vev glir ofte motfarget med DAPI (4 «, 6-diamidino-2-fenylindol) ta rollen som en konvensjonell bakgrunnsflekker. Dette gjør den tumor-stroma separasjon mer komplisert som den primære visuell informasjon i vevet struktur er mye vanskeligere å gjenkjenne i DAPI kanal enn i kromogene histologi. En histologisk biomarkør som utelukkende ville sette flekker svulstvev er ikke tilgjengelig. I stedet heterogenitet av romlige protein uttrykk mønstre er iboende til kreft. Et utmerket eksempel her er de aggressive trippel negative brystkreft vev som ikke uttrykker genene for de mest verdifulle prognostisk markør som østrogenreseptoren (ER), progesteron markør (PR) og human epidermal vekstfaktor-reseptor type 2 (Her2) [9]. Fraværet av uttrykk mønstre av disse biomarkørene forbyr å bruke noen eneste av dem som en referanse protein biomarkør og gjør det viktig å skille kreft fra sunne /bindevev ved hjelp av objektive, standardiserte behandlings algoritmer basert på morfologiske kriterier. Dermed bruker patologisk evaluering rutinemessig morfologiske kriterier som en romlig referanse system for å bestemme tumorområdet i kreft histologi. Vi konkluderer med at å kombinere fordelene med fluorescens med automatisk bilde kjøp og behandling krever utvikling av algoritmer for tumor-stroma separasjon utelukkende fra en DAPI bakgrunn flekken blir ofte brukt i immunfluorescens.

Derfor har vi her satt ut for å utvikle en slik automatisk algoritme basert bare på DAPI kanalen (figur 1 B-D). Flere fremgangsmåter for separasjon av kreftvev fra andre typer vev av morfologiske kriterier er tilgjengelige i litteraturen. Amaral et al. [10], [11] presentere to ulike metoder der fargefunksjoner brukes for klassifisering av hele TMA-kjerner. I [12] teksturelle egenskaper hjelpe til å skille forskjellige vev regioner på en TMA og i [13] teksturelle egenskaper anvendes for påvisning av patologiske områder i histologiske preparater. Men alle disse metodene fungerer på kromogene farget vevsprøver der for klassifisering av ulike typer vev informasjon av alle 3 RGB-kanalene var oppnåelig. Klassifisere svulstvev bare i DAPI kanalen tvinger oss til å forholde seg til mindre informasjon tilgjengelig for klassifisering skritt i forhold til de foregå andre tilnærminger. Bare noen få publikasjoner håndtere klassifisering av fluorescently farget vev. I [14] Forfatterne bruker kjernefysiske egenskaper oppnådd fra DAPI-kanal for å skjelne hvorvidt hele vev er kreft eller sunt i stedet for å klassifisere de forskjellige typer som er tilstede på vevet. Mesteparten av det publiserte arbeidet i biomarkør forskningsbruk to biomarkører for samlokalisering eller manuelt segment kreftvev i stedet for en automatisert måte [15] -. [18]

(a) Representasjon av alle tre kanal av en fluorescens-farget kjerne i RGB fargerom. Glyphs oppsto på grunn av TMA forberedelse. Red representerer stromal markør (vimentin), grønn svulsten markør (CK19) og blå DAPI kanalen fremhever cellekjerner; (B) den DAPI kanal av (a) som et intensitetsbilde: generelt tumorceller er mørkere og tettere enn tilkoblede stromaceller; (C) en annen DAPI bilde av en kjerne med en høy tetthet av celler; (D) et eksempel på en kjerne med en lavere tetthet av celler som viser høy heterogenitet blant kjernene.

Gunduz et al. [19] publiserte en ny metode for klassifisering av kromogene farget hjernen vevsprøver. De dannet celle grafer basert på den topologiske fordeling av vev celler og hentet de tilsvarende grafen beregninger for å trene en klassifikator. Klassifikator var i stand til å skille mellom kreft og friskt vev. En graf her er en abstrakt representasjon av objekter (noder) hvor par av disse objektene er forbundet med kanter. Metoden ble videreutviklet i [20] og [21]. Bilgin et al. [22] – [23] har vist at de med hell analysert bryst og ben vevsprøver ved hjelp av celle grafer. De evaluert sin metode på håndplukkede og ikke-biomarkør preget brystkreftprøver.

Her har vi utviklet denne tilnærmingen ved å utvikle en ny metode som kan klassifisere fluorescerende fargede microarray videre. Vår metode bruker celle grafer basert på tre ulike kategorier av funksjoner som gjenspeiler egenskapene til cellene som finnes i grafen (noder) og deres likhet (kanter). Fra en potensiell sett av funksjoner vi bestemme de som er best i stand til å skille tumor og stroma vev. Åpenbart, utføre en nøyaktig tumor stroma separasjon er allerede en utfordrende oppgave. Bruke dessuten bare DAPI-kanal for denne oppgaven krever en enda høyere ytelse i segmentering og klassifisering.

Som første skritt vi utført vannskille segmentering og da har vi bygget celle grafer ved å knytte de segmenterte cellekjernene i henhold til hverandre. Koblingen av cellene er basert på nye regler spesielt tilpasset for fluorescens-farget TMA som kan bestå av flere ulike vev typer. I stedet for å bruke bare topologiske graf beregninger for celle-grafen klassifisering, vi også bestemme morfologiske og intensitet basert celle funksjoner i hver celle-graf. Ved å kombinere alle tre har typene vi var i stand til å få en vellykket vev klassifikator for fluorescerende histologiske lysbilder.

Vi demonstrerer vår metode på 180 kjerne bilder av TMA fra invasive triple negative brystkreft biopsier inneholder kreftvev samt stroma (bindevev). Vår metode metoden var i stand til å skille tumor og bindevev som eksistere på samme vev kjerne med en total samlet nøyaktighet på 88.80 (± 07,73)%.

Materialer og metoder

Vevsprøver

data~~POS=TRUNC settet~~POS=HEADCOMP totalt består av 210 tissue microarray kjerne bilder av invasive triple negative brystkreft biopsier innhentet fra seks TMA. Vevet ble hentet fra vevet bank av National Center for tumorsykdommer (NCT) ved Universitetssykehuset i Heidelberg. Innhenting vevsprøver ble godkjent av etisk komité for Det medisinske fakultet Heidelberg. Ifølge de offisielle reglene i universitetets Tissue Bank bestemmes ved hjelp av nevnte etikkutvalg ingen individuell samtykke skal innhentes fra den enkelte pasient for pasientprøver som er eldre enn 3 år. Dokumentasjon av alle prosedyrer er håndtert på en ISO sertifisert prosessen ved NCT vev bank. Hver TMA inneholder to kjerner med diameter 1 mm fra 42 ulike pasienter (totalt 84 kjerner per TMA). Én kjerne er erholdt fra periferien av tumoren og den andre er hentet fra svulsten sentrum. Vi ekskluderte kjerner fra våre datasett om sitt område var under femti prosent av en vanlig kjerne eller hvis ubrukelig. Hvert bilde er tatt i et 20 gangers forstørrelse og har en gjennomsnittlig størrelse på 2800 x 2900 piksler. Alle TMA er farget med 3 fluorescerende fargestoffer. Hver TMA ble farget med DAPI utheving cellekjerner som counterstain De brukte antistoffer (vimentin, CK19 og CK5 /6) ble konjugert med Alexa Fluor® 488 (FITC alternativ, grønn fluorescerende fargestoff) eller Alexa Fluor® 594 (rødt fargestoff) . Figur 1A illustrerer en vev kjerne farget med 2 forskjellige biomarkører og DAPI som counterstain. Figur 1B-D viser videre representative eksempler på DAPI kanalen i tre forskjellige vev-kjerner.

Bilde oppkjøpet

fluorescens-farget TMA ble automatisk avbildes ved hjelp av Nanozoomer HT Scan System (Hamamatsu Photonics, Hamamatsu Japan) som kan skanne hele lysbilder. Glass ble skannet ved 20 gangers forstørrelse (oppløsning på 0,46 mikrometer /pixel). For skanning av glassplater, oppdager lysbilde skanner automatisk regionen av interesse som inneholder rekken av kjerner og også angir automatisk en gyldig fokusplanet for skanning. De resulterende virtuelle lysbilder hadde en gjennomsnittlig filstørrelse på 5 GB. Single Core bilder med en gjennomsnittsstørrelse på 2800 × 2900 piksler ble lokalisert og hentet fra TMA bruker malen matchende [24].

Generelt bildeanalyse arbeidsflyt

Det sentrale begrepet i dette manuskriptet er celle diagram som vi bruker for å fange opp den topologiske cellen fordeling i vev, så vel som de romlig sammenhørende lokale cellefunksjoner for klassifisering. De viktigste trinnene i denne tilnærmingen er segmentering av cellekjernene i DAPI kanalen ved hjelp av vannskillet segmentering, bygging av celle grafer, utpakking av topologiske og lokale cellefunksjoner fra disse grafene og bruke dem til å trene en klassifikator. Bildebehandlingsalgoritmer ble utviklet ved hjelp av Matlab ™ (Mathworks, Natick, Mass, USA.) Med bildebehandling verktøykassen

Vår bildeanalyse rørledning inneholder følgende konseptuelle trinn (figur 2).

etter å ha fått bildene, pre-behandlingstrinn forbedre bildekvaliteten og vannskille segmentering for den påfølgende segmentering er brukt. Følgelig celle grafene genereres og funksjoner er datastyrt. Det siste trinnet bruker en SVM å klassifisere grafene som enten svulst eller stroma

2.1 Pre-prosessering:.. Vi først brukt flere bildeforbedring metoder for å forberede bildet for den påfølgende segmentering trinnet

2,2 Cell segmentering: En Watershed-Transformation ble søkt om cellekjerner segmentering

2,3 Cell grafen generasjon. Basert på segmenterte kjerner vi generert celle grafer som representerer den topologiske fordeling av kjernene på vev kjerner. Vi beregnet flere funksjoner for hver (sub-) graf og også beregnet intensitet og morfologiske basisfunksjoner for hver enkelt kjerne på en kjerne

2.4 Klassifisering og funksjonsvalg. En Support Vector Machine ble trent for klassifisering trinn og F-Score ble beregnet for funksjonsvalg.

2.1 Forbehandling

i dette første trinnet, vi brukt flere metoder for å forbedre kvaliteten på core image for den påfølgende klassifisering. Vi begynte å fjerne skygge gjenstander, som avgrense et resultat av ulike optiske fenomener som linsevignettering eller foto bleking. Shading gjenstander i fluorescens bildebehandling kan også være forårsaket på grunn auto fluorescens av prøvene eller monteringsmedium. Skyggelegging korreksjon (flat feltkompensering) ble brukt for å kompensere for linsevignettering så vel som for inhomogenitet i belysningen. Shading korreksjon ble oppnådd ved å utføre en svart balanse kalibrering ved hjelp av tydelige bakgrunnsområder. Det neste trinnet i bildebehandlingen rørledningen var fjerning av støy og andre små partikler som ikke var egnet for senere analyse. For å utelukke uspesifikke og diffuse bakgrunnen flekker alle piksler med intensitetsnivåer under en terskel på 25 ble satt til null. En Median-filteret med en 3 x 3 kjerne ble anvendt for å glatte bildet. Det resulterende bilde ble omdannet til et binært bilde (ved bruk av Otsu metode [25]), der objekter med et areal mindre enn 150 piksler (mindre enn størrelsen av bindevev kjernen) er fjernet. Objekter utenfor den vanlige kjerne formen ble fjernet ved hjelp av morfologiske operasjoner som lukking eller åpning kombinert med areal filter. Til slutt ble det isolerte kjerner observert inne i kjernen. Vi antok at disse isolerte kjerner tilhører ikke tumerous celler og ble dermed ekskludert fra svulstvev. For å oppnå dette, bestemt vi den minste markeringsrammen av objektene og utvidet det ved 20px i hver retning. Ut fra denne nye koordinater, ble et bilde beskjæres fra det opprinnelige binære bildet, og de foreliggende objekter i bildet ble tellet. Hvis bare ett objekt var til stede, ble gjenstanden fjernes mens nærværet av mer enn en gjenstand innebærer kontakt til andre celler og objektet forble. Videre i flere kjerner oppdaget vi store overstained områder med maksimal intensitet. Disse områdene, som kan være forårsaket av agglomererte bindevevscellekjerner på TMA forberedelse eller for høye eksponeringstider, er ikke egnet for videre analyse og ble fjernet. Figur 3B viser resultatene av forbehandlingstrinn

(a) opprinnelig bilde av DAPI-kanalen.; (B) bildet etter skyggelegging korrigering og støy fjerning; (C) resultatet av vannskillet segmentering, er segmenterte celler markert med grønn kontur; (D) bildet etter fjerning av enkeltceller; (E) viser at cellene som var koblet via grafen genereringstrinnet i samme farge (celler som er merket med den samme farge tilhører samme sub-graf); (F) cellen graf fremstilling av cellene. De røde prikkene er noder som representerer de celler, de svarte linjene er kantene mellom dem.

2,2 Cell Segmentering

Automatisert celle segmentering i fluorescens-farget TMA kan være problematisk på grunn som inkluderer celle overlapping eller grupperte celler, kompleks vev struktur, rusk og ujevn bakgrunn intensitet på grunn av auto fluorescens. En annen vanskelighet er intensitetsvariasjon mellom de kjerner som kan føre til over-segmentering av cellekjerner. På grunn av disse intensitetsvariasjoner mellom kjernene, vi først delt inn bildet i ett bilde som representerer bare objekter med en lysere belysning og en som representerer de mørkere stedene. Vi deretter påført segmenter trinn separat på begge disse bildene. Dette skillet ble gjort ved å beregne en terskel basert på Otsu metode [25] overser bakgrunns piksler. En segmenteringsalgoritme som har vist seg å være svært nyttig for mange atomkjerner eller cellesegmenterings tilfeller er vannskillet segmenter [26] – [28]. Vi søkte seeded vannskille segmentering for segmentering. Last vannskille segmentering midler, som starter regioner, som er kalt frø, er gitt som innspill til vannskillet segmentering. Vi setter frøene i en automatisert måte ved hjelp av h-maxima forvandle [29]. Resultatet av dette segmentering trinnet er vist i figur 3C.

2,3 Cell grafen Generation

En graf betegnes som et sett av objekter der noen par av stedene er koblet sammen med koblinger. De tilkoblede objektene er representert ved matematiske abstraksjoner som kalles noder (også kalt hjørner), og koblingene som forbinder noen par av noder kalles kanter. Formelt er en graf et ordnet par

G = (V, E)

der

V

er sett av noder og

E

settet med kanter som forbinder nodene

V

. I vårt arbeid, ble hver av de tidligere segmenterte cellekjernene anvendt som en node. Figur 4 viser en konseptuell fremstilling av celle grafer

(a) Kunstig skisse av 3 forskjellige tre celletype. Tumorceller i blått, lymfocytter i hvitt og i fiolett fibroblast. (B) Celle graf representasjon av (a). Cellene er avbildet som noder og koblinger mellom dem representerer biologiske relasjoner.

Ulike tilnærminger er presentert i litteraturen for å generere celler grafer, som representerer den topologiske oppførsel av vev eller celler i ulike vitenskapelige spørsmål [19], [21] – [23], [30]. I [19] Gunduz et al. gjøre bruk av Waxman modell for celle grafen generasjon. Bilgin et al. [22] og Gunduz et al. [21] bruker en sannsynlighetsfunksjon for å knytte cellene seg imellom. I sine tilnærminger sannsynligheten for linking celler henfaller med en voksende euklidske avstanden mellom cellene centroids. I [23], [30] celler er enkelt bundet hvis den euklidske avstanden mellom deres centroids er under en bestemt avstand. Tumorceller vanligvis vises i klynger, tilsvarende de kan forventes i en marginal avstand fra hverandre eller appearingly «rørende» hverandre. Derved denne «berøring» av atomkjerner oppstår på grunn av den tredimensjonale strukturen av de histologiske snitt. Ved å bruke kjerner centroids for avstandsmålinger alene, er det mulig at celler blir koblet selv om de er mer fra hverandre enn vanlige tumorceller. I vårt tilfelle er vi utfører en pre-klassifisering ved bare å bygge koblinger mellom cellekjerner berører hverandre og dermed unntatt ensomme celler (bindevev opprinnelse) fra grafen byggetrinn. I vår metode tester vi om celler berører hverandre ved følgende trinn. Vi først konvertere et resultat av vannskillet segmentering til et binært bilde, og deretter vi utvider seg hver av de segmenterte cellekjerner separat. Utvidelse av en (cellekjernen) -Image

I

med en strukturerende element

S

, betegnet som

I⊕S

, er definert som den innstilte driften hvor S angir symmetrisk strukturerende element. Vi valgte en diamantformet strukturerende element med en avstand fra origo til 2. Vi deretter avgjøre, om cellekjernene var i meget nær kontakt ( «berøring» utseende) og setter en forbindelse mellom dem, hvis deres pikselovergang var ikke en tom sett etter utvidelse trinn: (1) der

i og J

er de spesielle bilder av to nabocellekjerner. I vev, er kreftceller etter hvert tett omgitt av bindevev celler som kunne, etter å ha påført ovenfor beskrevne avstand regel føre til strukturelle feil i cellen grafen. Vanligvis er kreftceller vises med lavere intensitet enn bindevev cellene. Derfor kobler vi bare celler, hvis forskjellen mellom deres intensitetsnivå er lavere enn en bestemt terskel. Denne grensen er avhengig av variasjoner i farging og fluorescens signalfangsten effektivitet. Vi her empirisk bestemt en forskjell på 30 intensitetsverdier som et gjeldende terskel for vår datasettet. Avslutter, er nabocellekjerner med en intensitet forskjell under denne terskelen knyttet: (2) Hvor er det aritmetiske gjennomsnittet av cellen bildeintensitetsnivå, X antall rader, Y antall kolonner og S = X * Y. Oppsummering, sette en kobling mellom to cellekjerner i vår modell er avhengig av sannsynligheten for å berøre hverandre, og at forskjellen av deres intensitet nivåer er lavere enn en bestemt terskel. Figur 4D viser et eksempel bilde hvorved enkeltceller fjernes. Figur 4E fremhever cellekjerner, som ble bundet gjennom denne grafen genereringstrinnet i samme farge. En visuell graf fremstilling av dette trinnet er vist i figur 4F. Celler som ikke var koblet under grafen genereringsprosessen ble behandlet i et ekstra trinn som er beskrevet i avsnittet «enkelt celle klassifisering».

Cell Graph Funksjoner

Når du har generert celle grafer, beregnet vi flere funksjoner for opplæring av klassifikator. Totalt beregnes vi 22 funksjoner som kan deles inn i tre ulike kategorier. De første 10 trekk, i litteraturen vanligvis kalt grafen beregninger [19], [23], fange den topologiske oppførsel av grafene som antall celler i en graf, antall koblinger mellom dem eller ytterligere topologiske relasjoner mellom cellene (funksjon kategorien T). De resterende 12 funksjoner fange morfologiske egenskaper (funksjonen kategori M) som område, form samt intensitet basert egenskaper (funksjonen kategori I) av de enkelte cellekjerner av en graf og ble valgt på grunnlag av deres forventede egnethet. De to siste grupper av egenskaper blir først beregnet for hver enkelt cellekjernen og deretter gjennomsnitts er brukt som en funksjon av den tilsvarende graf. Husk at flere av disse intensitetsbaserte funksjoner avhenger av bilde forhold som eksponeringstiden, konsentrasjonen av biomarkør, tidsforsinkelsen mellom flekker og bildebehandling på grunn av fotobleking og ytterligere mer. Det krever at disse forholdene forblir konstant over datasettene. I tabell 1 anvendt funksjoner og tegne beregninger er beskrevet i detalj.

2.4 Klassifisering og funksjonsvalg

Support vektor maskiner (SVMer) [31] blir ofte brukt som overvåket læringsformer for klassifisering i databiologi og bildeprosesseringsoppgaver [32] – [34]. Utgangspunkt for opplæring av en SVM er et sett med treningsdata som har klassen medlemskap er kjent: (3) hvor er funksjonen vektorer og deres respektive klasse etiketter (tumorceller eller bindevevsceller). Den SVM kartene disse innsats vektorene inn i en høyere dimensjonale rom og konstruerer en optimal hyperplan som skiller de data inn i to grupper. Ved å løse et kvadratisk optimeringsproblem programmering, beregner SVM normalvektoren og forspenn b til separering av hyperplan som maksimerer margin mellom støtte vektorer av forskjellige klasser. Bredden på margin er lik, og dermed den bredeste marginen mellom de vektorer som er funnet ved å minimalisere under de restriksjoner, som krever en separerbar datasettet. Den hyperplan deretter anvendes som et tegn funksjon for klassifisering av hver funksjon vektor av testsettet. Klassifiseringen funksjonen returnerer enten en om testdataene er medlem av klassen eller -1 hvis det ikke er. Når perfekt separasjon ikke er mulig, blir en slakk variabel innført for hver vektor. Begrensningene for beregning av optimal hyper blir deretter formulert som og hyperplan kan finnes ved å minimere: (4) der

C

er en kostnad parameter som bestemmer effekten av outliners på den resulterende hyper planet. Den beskrevne SVM er i stand til å separere lineære data. For å lage en klassifikator som er i stand til å klassifisere lineære data kjernen trikset er brukt. Nøkkelen Ideen er å forvandle seg til en høyere dimensjonale rommet for å finne et skille hyper fly via en kjerne. Dette tillater algoritmen for å passe til den maksimale margin hyper flyet i en transformert funksjon plass. Ligning 4 kan omskrives som (5) 🙁 5) (6) hvor verdiene er Lagranges multiplikatorer, som kan være positiv eller negativ, på grunn av likestilling begrensninger og er kjernen funksjon. I denne artikkelen har vi brukt en radial basis kernel (RBF) som også er kjent som Gaussian kernel.

funksjonsvalg

Vi beregnet F-score for valg av funksjonene som inngår i SVM. Feature valget er en teknikk for å finne en undergruppe av funksjoner ved å fjerne mest uviktige og redundante funksjoner fra funksjonen plass. Denne teknikken generelt bidrar til å forbedre den totale ytelsen til klassifikator, påskynde læringsprosessen, gir en bedre representasjon av viktige funksjoner og resultater i en gjenværende funksjon sett med opprettholdt diskriminerende makt. F-poengsum måler diskriminering mellom to sett av funksjoner [35]. En høyere F-poengsum indikerer en høyere diskriminere funksjon enn en funksjon med et lavere F-poeng. Vi beregnet F-score for hver funksjon

i

som beskrevet i (7) med de gitte trenings vektorer: (7) hvor er middelverdier av

i

th funksjon av svulsten , stroma, og hele datasettet. betegnes som

i

th funksjon av svulsten forekomst og

i

th funksjon i stroma eksempel.

Enkelt celle klassifisering

Basert på de to kriteriene for cellen grafen generasjon (intensitet og avstand), kan det forekomme at de enkelte celler som ikke er knyttet til en hvilken som helst annen celle. Dermed er disse cellene ikke inkludert i klassifiseringstrinnet og vi behandler dem med en ytterligere algoritme i en egen enkeltcelle klassifiseringstrinn. Vi først prøve å identifisere betennelsesceller (lymfocytter f.eks) og fibroblaster som er en del av stromal klassen. Vanligvis, inflammatorisk cellekjerner vises som små roundish cellekjerner med en meget høy intensitet sammenlignet med andre celler i kjernen. Cellekjerner er derfor klassifisert som inflammatoriske celler når: cellekjernen intensiteten er høyere enn et bestemt nivå, er en beregning som beregner rundheten er høyere enn en terskelverdi, og området er mindre enn 500 piksler: (8) der er den aritmetiske middelintensitet , S = X * Y i feltet, og w omkretsen av en cellekjerne. Fibroblaster generelt har en elliptisk form og ble identifisert ved: (9) hvor det er major- og den mindre aksen av cellekjerner. Disse verdiene benyttes til å beregne eksentrisiteten av en ellipse. Eksentrisiteten av en sirkel er 0 og en ellipse som eksentrisitet er 1 er et linjesegment. De gjenværende cellekjerner ble klassifisert ved anvendelse av en støttevektormaskin. Vi brukte 12 morfologiske og intensitet baserte funksjoner som allerede er nevnt i avsnittet «Cell graffunksjoner» for å klassifisere hver enkelt cellekjernen. Vi trente SVM med enkeltcellekjerner av vår trening sett og evaluert algoritmen separat som avbildet i følge pkt.

Resultater

Det overordnede målet for vår tilnærming var å automatisk klassifisere hver celle en TMA kjerne ved hjelp av den genererte celle grafer. Treningen og klassifiseringen er kun basert på DAPI kanalen primært flekker kjerner. Figur 5 viser resultatene av vår tilnærming på 4 forskjellige TMA-kjerner

(a-d) viser de originale RGB kjerne bilder.; (E-h) viser den tilsvarende DAPI kanal som en intensitet bilde av kjernene (a-d); (I-l) resultatene av klassifikasjonstrinn, grønn = celler som er klassifisert som kreftceller, blå = celler klassifisert som stromaceller.

Cell segmentering skritt

Celle kjerner segmentering var evaluert på 3 tilfeldig utvalgte ekte kjerne bilder hentet fra en TMA. Totalt 5162 kjerner ble brukt og bakken sannheten ble hentet fra en ekspert som merket over- og under-segmentert cellekjerner. Vannskille algoritmen foreslått her kan riktig segment 94,1% (± 3,75) av kjernene. Tabell 2 viser de detaljerte segmentering resultater og Figur 3C viser et eksempel på dette trinnet der de segmenterte kjerner er omgitt av en grønn kontur.

Feature utvalg

Feature utvalg forenkler og forkorter trening av en klassifikator, og forbedrer ofte også sin nøyaktighet. For funksjonen utvalg fra 30 core image vi først generert totalt 7888 topologisk adskilte celle grafer som fører til bruke samme totale antallet har vektorer. Denne totale sett av funksjoner omfatter 4065 har vektorer for svulst klasse og 3823 for stroma klassen. De har verdier forekommer innenfor stor grad varierende numeriske områder. Derfor normalisert vi dem til området [0,1] for å forbedre læringsforløp.

Vi beregnet F-score (diskriminerende effekt av en funksjon) for hver av de 22 funksjonene fra tabell 1 for å bestemme beste funksjonene for klassifisering oppgaven. Basert på resultatene vist i tabell 3 vi plukket ut de beste 15 funksjoner for opplæring av støttevektor maskinen.

Legg att eit svar