sábado, 8 de julio de 2017

Transformación de Datos con Power Query en Excel (ETL - BI)

Hola a todos, hoy vamos a continuar trabajando con Power Query, y realizaremos nuestra primera transformación de datos con dicha herramienta

El ejercicio lo ejecutaremos en un archivo de excel, que es el resultado de una encuesta practicada con la ayuda de la herramienta para encuestas de Google. Lo que tenemos es un archivo en el que cada linea es una encuesta y en cada columna tenemos la respuesta a cada una de las preguntas realizadas:


En la primera fila tenemos los encabezados de la base de datos. Hacia la derecha, tenemos un total de 40 columnas, una columna por cada pregunta realizada.

La persona que va a realizar la minería de datos sobre esta base, quiere que en una sola columna tengamos todas las preguntas y al lado la respuesta a cada una. Esto, con el objetivo de poder construir una tabla dinámica en la que solo tenga que vincular una columna para tener todas las preguntas incluidas en un solo paso, y no tener que repetir la misma operación 40 veces.

Una opción sería realizar la transposición de las columnas una a una, copiando y pegando, e insertando las filas necesarias. Otra opción, es construir una macro en vba. Nosotros lo vamos a resolver con las herramientas para Transformar datos, que están incluidas en Power Query.

Lo primero será entonces crear un set de datos en Power Query desde un Rango:

miércoles, 7 de junio de 2017

Extracción de Datos desde Archivos de Texto Usando Power Query de Excel (ETL - BI)

Hola, hoy vamos a continuar con los posts sobre extracción de datos (ETL) utilizando Power Query. Hoy realizaremos la extracción, desde un archivo de texto CSV (separado por comas o punto y comas).

Iniciemos por crear un nuevo archivo de Excel y vayamos al menú de Power Query:


El archivo que vamos a extraer tiene la siguiente estructura:

miércoles, 31 de mayo de 2017

Tres métodos diferentes para realizar la operación SUMAPRODUCTO en excel

Hola, hoy vamos a trabajar en la construcción de tres métodos diferentes con los que realizaremos la operación SUMAPRODUCTO en excel. Para los tres métodos, vamos a utilizar fórmulas de excel, revisando las bondades de cada uno.

Vamos a trabajar con un archivo que tiene la siguiente información:


Con estos datos, calcularemos el producto y la sumatoria de los mismos.

En nuestro primer método, vamos a calcular en una columna adyacente, el producto del Lote A y el Lote B:

martes, 23 de mayo de 2017

Extracción de Datos desde Páginas Web Usando Power Query de Excel

Hola, hoy vamos a escribir el primer post sobre extracción de datos. Iniciaremos con la opción de extracción de data de páginas web.

Power query ofrece muchas más fuentes para extraer datos, tales como: SQL Server, Oracle, facebook, listas de Share Point, archivos de Hadoop, MySQL etc. La lista es amplia y diversa y con seguridad suficiente para responder a la mayoría de las necesidades que tengamos.

En los próximos posts, trataremos la extracción de información desde archivos de excel, access, texto y xml.

Iniciemos por crear un nuevo archivo de Excel y vayamos al menú de Power Query:


En la parte izquierda del menú, tenemos las opciones para Obtener datos externos. La primera opción, es para traer datos desde tablas creadas en páginas web. Vamos a probarlo, utilizando la siguiente dirección web: https://msdn.microsoft.com/en-us/library/office/ff834966.aspx

Dicha dirección corresponde a la siguiente página de microsoft:


domingo, 21 de mayo de 2017

Iniciando a trabajar con Power Query en Excel (Business Intelligence - BI) - ¿Cómo Instalarlo?

Hoy vamos a dar inicio a una serie de posts en los que vamos a explorar las herramientas de Business Intelligence (BI) que Microsoft Excel trae y que nos van a permitir realizar análisis con enormes volúmenes de datos (incluso archivos de Hadoop - Big Data), con diversidad de fuentes y lo mas importantes, diseñadas por usuarios finales, sin necesidad de tener conocimientos en programación y sin tener que recurrir a un batallón de miembros de TI.

Las herramientas con las que trabajaremos son: Power Query, Power Pivot y Power View. Un poco más adelante, cuando ya tengamos dominadas estas herramientas, vamos a pasar a trabajar con Power BI, que incorpora estas tres últimas en una práctica e intuitiva solución para diseñar tableros de control de una manera rápida, sencilla pero poderosa.

¿Qué es Power Query? Básicamente se trata de un complemento para Excel, que nos va a permitir realizar procesos de extracción de datos desde múltiples fuentes, transformación de los mismos y cargue para uso final. Es lo que en el argot de las bases de datos se conoce como ETLs (Extract, Transform y Load). Solo que en esta oportunidad, Microsoft lo pone al alcance y al nivel de usuarios finales, no hace falta ser un técnico para poder utilizarlos.

Los datos que carguemos usando Power Query, los podemos cargar directamente a excel, en una tabla en una de las hojas que componen el libro, o podemos decirle que cargue el resultado del query en: El modelo de datos de Excel. Y ¿qué es eso? El modelo de datos es un motor de base de datos interno, que hace parte del archivo de excel y que se encarga de optimizar las operaciones que vamos a realizar con nuestros datos y con el almacenamiento de los mismos.

Veamos entonces, como instalar Power Query en nuestro Excel. Lo primero que vamos a hacer, es abrir excel desde cero y decirle que nos cree un nuevo libro de trabajo: