Hide metadata

dc.date.accessioned2016-05-19T08:08:50Z
dc.date.available2016-05-19T08:08:50Z
dc.date.issued2015
dc.identifier.urihttp://hdl.handle.net/10852/50310
dc.description.abstractFlerkjerne-prosessorer som grafikkprosessorer (GPUer) og Xeon Phi leverer enorm beregningskraft med et lavt effektforbruk. Denne egenskapen har ført til at slike prosesseringsenheter på kort tid har blitt svært populære til bruk i vitenskapelig tungregning. Stadig flere moderne superdatamaskiner og tungregningsklyng er utstyres med slike prosesseringsenheter i tillegg til tradisjonelle prosessorer (CPUer). Utfordringen med flerkjerne-prosessorer er imidlertid at de er betydelig vanskeligere å programmere enn CPUer, og det mangler gode tilpassede programmeringsspråk og modeller – noe som fører til at store deler av maskinvaren forblir ubenyttet. Ringvirkningene er aller mest synlige i de største klyngene der lav ytelse og dårlig skalering setter en stopper for utviklingen av mer kompliserte simuleringer. Målet med denne avhandlingen er å bidra til nye og mer effektive programmeringsmetoder som forbedrer ressursutnyttelsen i superdatamaskiner utstyrt med GPUer. Ved å fordele beregninger mellom GPU og CPU viser vi at slike heterogene beregninger er vesentlig mer effektive sammenliknet med mer etablerte beregningsmodeller der beregningene foregår utelukkende på GPU eller CPU. For å redusere kompleksiteten som kommer med heterogene beregninger, har vi utviklet et rammeverk bestående av en programmeringsmodell og en kompilator som gjør det enkelt å oversette sekvensielle beregninger til distribuerte og parallelle heterogene beregninger som kan kjøres på en superdatamaskin utstyrt med både GPU-og CPU-er.en_US
dc.language.isoenen_US
dc.relation.haspartPaper I: Effective Multi-GPU Communication Using Multiple CUDA Streams and Threads. Mohammed Sourouri, Tor Gillberg, Scott B. Baden, Xing Cai. Published in the proceedings of the 20th IEEE International Conference on Parallel and Distributed Systems (ICPADS), 2014, Pages 981-986 Accepted version is included in the thesis. Copyright 2014 IEEE. Reproduced with permission. The published version is available at http://dx.doi.org/10.1109/PADSW.2014.7097919
dc.relation.haspartPaper II: CPU+GPU Programming of Stencil Computations for Resource-Efficient Use of GPU Clusters. Mohammed Sourouri, Johannes Langguth, Filippo Spiga, Scott B. Baden, Xing Cai. Accepted for publication in the proceedings of the 18th IEEE International Conference on Computational Science and Engineering, 2015. Accepted version is included in the thesis. Copyright 2015 IEEE. Reproduced with permission.The published version is available at http://dx.doi.org/10.1109/CSE.2015.33
dc.relation.haspartPaper III: Scalable Heterogeneous CPU-GPU Computations for Unstructured Tetrahedral Meshes. Johannes Langguth, Mohammed Sourouri, Glenn T. Lines, Scott B. Baden, Xing Cai. Published in IEEE Micro, Volume 35, Issue 4, Pages 6-15, 2015. Accepted version is included in the thesis. Copyright 2015 IEEE. Reproduced with permission.The published version is available at http://dx.doi.org/10.1109/MM.2015.70
dc.relation.haspartPaper IV: Panda: A Compiler Framework for Concurrent CPU+GPU Execution of 3D Stencil Computations on GPU-accelerated Supercomputers. Mohammed Sourouri, Scott B. Baden, Xing Cai. Published in Int J Parallel Prog (2016). The article is not available in DUO due to publisher restrictions. The published version is available at Springer Nature content sharing http://rdcu.be/kJ5D and http://dx.doi.org/10.1007/s10766-016-0454-1
dc.relation.urihttp://dx.doi.org/10.1109/PADSW.2014.7097919
dc.relation.urihttp://dx.doi.org/10.1109/CSE.2015.33
dc.relation.urihttp://dx.doi.org/10.1109/MM.2015.70
dc.relation.urihttp://dx.doi.org/10.1007/s10766-016-0454-1
dc.titleScalable Heterogeneous Supercomputing: Programming Methodologies and Automated Code Generationen_US
dc.typeDoctoral thesisen_US
dc.creator.authorSourouri, Mohammed
dc.identifier.urnURN:NBN:no-53942
dc.type.documentDoktoravhandlingen_US
dc.identifier.fulltextFulltext https://www.duo.uio.no/bitstream/handle/10852/50310/1/1703-Sourouri-DUO.pdf


Files in this item

Appears in the following Collection

Hide metadata