Líffræðifélag Íslands
Líffræðiráðstefnan 2013
Erindi 16



Púslun (assembly) genafjölskyldna í de Bruijn netum ofnum úr umritunargögnum.



Jóhannes Guðbrandsson (1) og Páll Melsted (2,3)

1) Líf- og Umhverfisvísindastofnun, Háskóla Íslands
2) Iðnaðarverkfræði-, vélaverkfræði- og tölvunarfræðideild, Háskóla Íslands
3) deCODE genetics

Kynnir/Tengiliður: Jóhannes Guðbrandsson (jog7@hi.is)

Með raðgreiningarbyltingu síðustu ára hefur möguleg rannsóknarsvið erfða- og erfðamengjafræðinnar víkkað frá fáum tilraunalífverum til nánast allra afkima lífheimsins. Raðgreining á umritunarmengjum (transcriptome) hefur þá kosti að á samtímis fást upplýsingar um genatjáningu og erfðabreytileika. Úrvinnsla á umritunargögnum er þó ekki þrautalaus. Raðir (read) eru yfirleitt stuttar (~ 150 basapör) og er þeim því yfirleitt raðað á erfðamengi sömu tegundar til að meta tjáningu. Í mörgum tilfellum er þó erfðamengi ekki til staðar og því nauðsynlegt að púsla genunum saman úr lesröðunum sjálfum. Vinsæl leið til að púsla saman erfða- og umritunarmengjum er að vefa de-Bruijn net úr lesröðunum og finna síðan leiðir gegnum netið sem mynda basaröð einstakra gena.

Þar sem oft eru mismunandi splæsiútgáfur af sama geni og mörg gen úr sömu genafjölskyldu til staðar er viðbúið að netið hafi flóknara byggingu í tilfelli umritunarmengja en erfðamengja, en sé aftur á móti mun minni þar sem einungis lítill hluti erfðamengisins er umritaður.

Við höfum þróað hugbúnað til að takast á við þetta verkefni. Við nýtum okkur tjáningarmun milli gena og paraðar raðir (paired-end reads) til að finna leiðir í gegnum hlutnet úr raðgreiningargögnum. Verkefnið er leyst með heiltölubestun og er bygging netsins notuð til að skorða af útkomumengið. Hugbúnaðurinn hefur verið reyndur á hermdum og raunverulegum gagnasettum með góðum árangri.