Computing data cubes over GPU clusters.

Silva, Lucas Henrique Moreira

Use este identificador para citar ou linkar para este item: http://www.monografias.ufop.br/handle/35400000/1527

Título:	Computing data cubes over GPU clusters.
Autor(es):	Silva, Lucas Henrique Moreira
Orientador(es):	Lima, Joubert de Castro
Membros da banca:	Fortes, Reinaldo Silva Silva, Rodrigo Rocha Lima, Joubert de Castro
Palavras-chave:	Tecnologia OLAP Redes de computadores
Data do documento:	2018
Referência:	SILVA, Lucas Henrique Moreira. Computing data cubes over GPU clusters. 2018. 50f. Monografia (Graduação em Ciência da Computação) - Instituto de Ciências Exatas e Biológicas, Universidade Federal de Ouro Preto, Ouro Preto, 2018.
Resumo:	O cubo de dados é um operador relacional fundamental para sistemas de suporte à tomada de decisão, dessa forma útil para a análise de Big Data. O problema apresentando nesse trabalho é: como reduzir os tempos de resposta de consultas multidimensionais complexas? Tal problema se torna ainda mais agravado se atualizações recorrentes nos dados de entrada acontecem e se existe um grande volume de dados de alta dimensionalidade a ser analisado. A hipótese deste trabalho é que uso de clusters de dispositivos CPU-GPU acelerará consultas em cubos de dados holísticos de alta dimensão que são constantemente atualizados. A solução alternativa proposta neste trabalho, chamada de JCL-GPU-Cubing, particiona a base de dados em múltiplas representações de cubos parciais sem introduzir redundância de dados. Tais cubos parciais são usados para executar consultas em CPU ou CPU-GPU de maneira eficiente. As avaliações experimentais preliminares demonstraram que a versão baseada em clusters de CPU escala bem quando ambos os dados de entrada e o tamanho do cluster aumentam.
Resumo em outra língua:	The data cube is a fundamental relational operator for decision support systems, thus very important for analytics. Unfortunately, a full data cube with all of its tuples has exponential complexity in terms of runtime and memory consumption as the dimensions increase linearly, so algorithms to reduce query response times continue under development. The problem stated in this work is: how can we reduce complex multidimensional queries response times from high dimensional data cubes? The problem is aggravated if recurrent updates occur and if there is a huge volume of high dimensional data to be managed. The hypothesis of this work is that clusters of CPU-GPU devices can speedup queries from high dimensional holistic data cubes that are updated constantly. The alternative solution presented in this work, named JCL-GPU-Cubing, partitions the base relation into multiple independent sub- cubes. These multiple sub-cubes represent a partial data cube to reduce the exponentiality and they are used to perform queries in CPU or in CPU-GPU computer architectures efficiently. The experimental evaluations using complex multidimensional queries demonstrated that the CPU cluster version scaled well when the base relation increased and the CPU-GPU version outperformed the CPU only version in certain scenarios.
URI:	http://www.monografias.ufop.br/handle/35400000/1527
Licença:	Autorização concedida à Biblioteca Digital de TCC’s da UFOP pelo(a) autor(a) em 19/12/2018 com as seguintes condições: disponível sob Licença Creative Commons 4.0 que permite copiar, distribuir e transmitir o trabalho desde que sejam citados o autor e o licenciante. Não permite o uso para fins comerciais nem a adaptação.
Aparece nas coleções:	Ciência da Computação

Arquivos associados a este item:

Arquivo	Descrição	Tamanho	Formato
MONOGRAFIA_ComputingDataCubes.pdf		1,07 MB	Adobe PDF	Visualizar/Abrir

Mostrar registro completo do item Visualizar estatísticas

Este item está licenciado sob uma Licença Creative Commons