Please use this identifier to cite or link to this item: http://dspace.utpl.edu.ec/handle/20.500.11962/24105
Title: Implementación de un Cluster Distribuido de Nodos a través de la herramienta Dask
Authors: Elizalde Solano, René Rolando
Armijos Rengel, Dickson Fabian
Keywords: Ecuador.
Tesis digital.
Issue Date: 2019
Citation: Armijos Rengel, D. F. Elizalde Solano, R. R. (2019) Implementación de un Cluster Distribuido de Nodos a través de la herramienta Dask [Tesis de Grado, Universidad Técnica Particular de Loja]. Repositorio Institucional. https://dspace.utpl.edu.ec/handle/20.500.11962/24105
Abstract: Abstract:The fast growth of technology has made the analysis and processing of large volumes of data a great challenge for many researchers, according to the Internet Live stats website, which allows you to follow the Internet live, says that in just a second There have been 58,836GB of Internet traffic, 8,101 tweets have been written, 855 photos have been uploaded to Instagram, 3,228 Skype calls have been made, 68,006 Google searches. With the enormous amount of data that is generated day by day, it produces that the treatment of large volumes of data by companies and research groups, makes use of tools that allow to face these new technological challenges, in order to perform an analysis of said information. In the present work of titling proposes the use of a tool denominated Dask linked in the philosophy of the language of programming Python, for the analysis of big volumes of information through a cluster Distribution of Nodes.
Description: Resumen: El crecimiento a pasos agigantados de la tecnología hace que el análisis y procesamiento de grandes volúmenes de datos sea un gran reto para muchos investigadores, según el sitio web Internet Live stats, que permite seguir Internet en directo, afirma que en un segundo se ha producido 58.836GB de tráfico en Internet, que se han escrito 8.101 tweets, subido 855 fotos a Instagram, realizado 3.228 llamadas por Skype, 68.006 búsquedas de Google. Con la enorme cantidad de datos que se genera día a día produce que el tratamiento de grandes volúmenes de datos por parte de empresas y grupos de investigación, hagan uso de herramientas que permiten enfrentarse a estos nuevos retos tecnológicos, con la finalidad de realizar un análisis de dicha información. En el presente trabajo de titulación se propone el uso de una herramienta denominada Dask vinculada en la filosofía del lenguaje de programación Python, para el análisis de grandes volúmenes de información a través de un cluster Distribuido de Nodos.
URI: https://bibliotecautpl.utpl.edu.ec/cgi-bin/abnetclwo?ACC=DOSEARCH&xsqf99=121072.TITN.
Appears in Collections:Ingeniero en Sistemas Informáticos y Computación



Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.