[Azure Machine Learning] Importar/Exportar datos con Azure blob storage

Si recordamos el proceso de la Ciencia de Datos, nuestro descubrimiento de conocimiento empieza con la compresión y adquisición de datos. Para ello, Azure Machine Learning Studio nos permite trabajar con una variedad de fuentes de información y en esta ocasión aprenderemos como hacerlo con Azure blob storage.

Importando desde Azure Blob Storage

Para importar un conjunto de datos desde Azure blob storage lo primero tenemos que tener en cuenta es que Azure Machine Learning Studio sólo admite el tipo de cuenta Storage (general purpose v1), y que sólo en el caso de que elijamos como tipo de autenticación “Storage Account”, la cuenta de almacenamiento debe tener desactivada la configuración “Secure transfer required”. Para el caso de una autenticación del tipo “Public or SAS” no hay nada de qué preocuparse, basta con que la URL sea válida.

Exportando a Azure Blob Storage

En Azure Machine Learning Studio también tenemos un módulo para exportar a Azure blob storage, esto es útil si por ejemplo deseamos guardar estados en el experimento, y la configuración es similar a la del módulo de importación, sólo hay que tener en cuenta el formato de exportación.

En el anterior ejemplo, el modo de escritura del blob storage esta en Sobrescribir, lo cual significa que los datos serán sobrescritos cada vez que el conjunto de datos sea ejecutado. Si deseáramos realizar la operación de escritura solo cuando los datos tengan algún cambio, deberíamos seleccionar la opción Use cached results. Si el modo de escritura del blob storage esta en Error, que es la preferencia por defecto, recibiremos un error si es que el archivo ya existe.

Agregue un comentario

Su dirección de correo no se hará público.