Sammendrag
High throughput technologies, like next generation sequencing, in combination with assays for probing epigenetic marks, have made it possible to map the epigenetic landscapes of cell types. With the new information the relation between gene expression and the epigenomic configuration of associated genomic regions can be studied. Cancer develops as a consequence of gene deregulation, which in turn is driven by genetic and epigenetic changes. A main theme of my PhD project was to test existing software and develop novel scripts for integrative analysis of such changes. Their interactive influence on gene expression in osteosarcoma is for instance analyzed. The information is in addition used to identify pathways contributing to osteosarcoma.
A software called The Genomic HyperBrowser for manipulation and statistical analyze of genomic data has been developed at the University of Oslo. The Genomic HyperBrowser has, together with scripts developed in the statistical programming language R, been used to study the dependencies, and select genes, based on genomic, epigenomic and transcriptomic alterations in samples from osteosarcoma and immune cells.
The gene expression, promoter methylation and DNA copy number data was acquired by oligonucleotide microarray technology, and the histone modification data was acquired by technology based on chromatin immune precipitation and next generation sequencing (ChIP-seq).
For the analysis of osteosarcoma a method was used that was based on selection of genes that were deregulated, and in addition were annotated with genomic and/or epigenomic alterations, in a minimum number of analyzed samples.
For the analysis of immune cells, a statistical test was developed and used to identify association between the number of histone modifications (of a given type) in a gene promoter and the transcriptional activity of the gene.
A tool, integrated in the HyperBrowser environment that allows for the application of software for clustering of gene expression data to epigenomic data was also developed.
Nye metoder for DNA sekvensering på massiv skala har gjort det mulig å kartlegge individers epigenomiske landskap. Med den nye informasjonen kan sambandet mellom gen ekspresjons og den epigenomiske konfigurasjonen av gen assosierte regioner studeres. Kreft oppstår som en konsekvens av geners forandrede ekspresjon, som i sin tur drives av genomiske og epigenomiske forendringer. Et hoved tema i denne avhandlingen er å teste eksisterende programvarer og utvikle nye skript for integrativ analyse av sådanne førendringer. Deres interaktive påvirkning av gene ekspresjon i osteosarkom (ben kreft) undersøkes for eksempel. Informasjonen brukes i tillegg til å identifisere signalerings nettverk som bidrar til kreft.
En programvare med navnet The Genomic HyperBrowser for manipulering og statistisk analyse av genomisk data har blitt utviklet på Universitetet i Oslo. The GenomicHyperBrowser har, sammen med skript utviklede i det statistiske programspråket R, blitt brukt for å studere beroende av, og velge gener basert på, genomiska, epigenomiska og transkriptomiska førendringer i prøver ifra osteosarkom og immun celler.
Gen ekspresjon, promoter metylering og DNA kopitals data ble innhentet med oligonukleotid mikromatris teknologi, og histon modifikasjons data ble innhentet med teknologi basert på kromatin immunoprecipitation og andre generasjons sekvensering (ChIP-seq).
Vid analysen av osteosarkom bruktes en metode basert på seleksjon av gener med førendret expression som også er annotert med genomisk og/eller epigenomisk førendring i minst et minimum av analyserte prøver.
Ved analysen av immunceller, ble en statistisk test utviklet og brukt for å påvise en assosiasjon mellom antallet histone modifiseringer i gen promoter og genens aktivitet.
Et verktøy som muliggjør bruket av programvare for klustring av gen ekspresjons data på epigenomisk data ble også utviklet.