[Azure Machine Learning] Importar/Exportar datos con SQL Azure y bases de datos locales

En una anterior publicación aprendimos como utilizar Azure blob storage para la adquisición de datos en Azure Machine Learning Studio y no fue nada complicado, pero ¿cómo podríamos hacer si nuestra fuente de datos es una base de datos relacional como SQL Azure?.

Importando desde SQL Azure

Para nuestro beneficio, este proceso es similar al realizado con Azure blob storage, lo único que tenemos que hacer es utilizar el módulo de importación de datos y, a través del formulario o el asistente de importación, establecer las credenciales correspondientes a nuestra base de datos.

Para completar el presente ejemplo tenemos que adaptar el conjunto de datos descargado en el anterior capítulo y utilizar la estructura definida por el siguiente script:

Una vez todo listo, solo falta establecer la consulta de base de datos, aceptar y verificar que todo nuestro conjunto de datos este correctamente importado.

Exportar desde SQL Azure

Ahora si lo que deseamos es realizar el proceso inverso, esto es ya no leer de SQL Azure, sino escribir, tenemos que utilizar el módulo de exportación. La única consideración que hay que tener en este punto es que el orden y los nombres de las columnas de la tabla de destino en nuestra base de datos deben corresponder con el orden y los nombres de columna listados y separados por coma que serán guardados.

Importar desde base de datos local

Hasta ahora nada complicado, pero ¿qué deberíamos hacer si el conjunto de datos que necesitamos para trabajar se encuentra en una base de datos local?

La instalación de Microsoft Data Management Gateway es requerida para que Azure Machine Learning Studio pueda conectarse a una base de datos local y vale resaltar que esto solo se puede hacer si contamos con un recurso de Machine Learning Studio workspace del tipo Standard aprovisionado a través de nuestro portal de Azure. Adicionalmente, hay una serie de consideraciones con este componente:

  • Solo se puede instalar un Data Management Gateway por computadora.
  • Un Power BI Gateway y un Data Management Gateway no pueden ser instalados en una misma computadora.
  • No es necesario que el gateway este instalado en el mismo servidor de base de datos y no es recomendable tampoco porque podría afectar la eficiencia ya que competirían por recursos locales.
  • El Data Managament Gateway no puede ser compartido a través de workspaces.
  • Solo el administrador del workspace puede crear un gateway.
  • La computadora local necesita contar con la habilidad de acceder a los datos, el puerto por defecto es el 8050 y estas características deben considerarse para la configuración de los firewalls existentes.

Para crear un Data Gateway tenemos que ir a Settings del portal de Azure Machine Learning Studio, establecer un nombre para la puerta de acceso, guardar la llave auto-generada, descargar el Data Management Gateway, ejecutar el instalador, dar continuar todo el tiempo, abrir la aplicación instalada y dar continuar hasta el momento que nos pidan ingresar la llave para registrar la puerta de enlace.

Una vez hecho todo eso, ya podemos empezar a hacer uso de nuestro módulo de importación y por un asunto de compatibilidad, se recomienda utilizar Microsoft Edge. Continuamos seleccionando la opción On-Premise SQL Database, establecemos los datos de conexión correspondientes junto con nuestras credenciales y establecemos la consulta a la base de datos.

Completadas aquellas tareas solo quedaría verificar nuestro conjunto de datos y festejar.

Agregue un comentario

Su dirección de correo no se hará público.