Skip to content

Creación de Azure Databricks

Para poder utilizar el recurso de Azure Databricks, es necesario no pertenecer a la capa gratuita de Azure, ya que en esta capa no nos permitirá crear el servidor (Compute) dedicado para el procesamiento en Databricks.

  • 1.-Realizamos clic en el botón "Upgrate".
  • 2.-Nos abrirá la interfaz de 'Upgrade', donde para este proyecto utilizaremos el plan "Basic".
  • 3.-Procedemos a dar clic en el botón "Upgrade to pay as you go"

Create Azure Databricks

  • Recargamos la página y esperamos unos minutos a que nuestra cuenta de Azure se actualize al nuevo plan.

Create Azure Databricks

  • Verificamos que ya no pertenezcamos a la capa gratuita de Azure, a veces podría tardar varios minutos.
  • Nos dirigimos grupo de recursos creado previamente. => Revisar aki
  • En el grupo de recursos, Haz clic en el botón "+ Create".

Create Azure Databricks

  • Se apretura la página Marketplace, busca "Azure Databricks" y selecciona "Azure Databricks" de los resultados de búsqueda.

Create Azure Databricks

  • Una vez seleccionada la opción "Azure Databricks", haz clic en el botón "Create".

Create Azure Databricks

  • 1.- Suscripción: Selecciona la suscripción que deseas usar.
  • 2.- Grupo de recursos: Crea uno nuevo o selecciona uno existente.
  • 3.- Nombre de la máquina virtual: Asigna un nombre, como ejemplo para el proyecto le asignamos "dbw-project-etl-001", el cual cumple con la Definición de su convención de nomenclatura establecida por Azure como buenas prácticas para el nombramiento de recursos.
  • 4.- Región: Selecciona la región donde deseas crear el recurso.
  • 5.- El pricing tier en Azure Databricks se refiere al plan de precios que determina los recursos y costos asociados. Los niveles comunes incluyen Standard Tier para equilibrio entre rendimiento y costo, y Premium Tier para mayor potencia y escalabilidad. Es importante elegir el nivel adecuado según las necesidades de tu proyecto. Para el proyecto seleccionamos el "Standard".
  • 6.- Clic en "Review + create".

Create Azure Databricks

  • Una vez configurado hacemos clic en el botón "Create".

Create Azure Databricks

  • Nos dirigimos al recurso haciendo Clic en "Go to resource"

Create Azure Databricks

  • Una vez dentro del recurso de Databricks, podemos acceder al panel de Azure Databricks haciendo clic en el botón "Launch Workspace".

Create Azure Databricks

Visualizamos la interfaz de trabajo de Azure Databricks; Nos dirijiremos a crear el "Compute"(servidor físico) para realizar el procesamiento y ejecución de los Notebooks:

  • 1.- Clic en "Compute".
  • 2.- Luego clic en "Create Compute".

Create Azure Databricks

Completa los detalles básicos como:

  • 1.- Definimos el nombre del clúster,
  • 2.- Establecemos el modo si será "Single mode" o "Multi node".
  • 3.- Establecemos el access mode en "No isolation shared", para permitir el acceso al entorno de trabajo a mas usuraios que la cuenta principal.
  • 4.- Elegimos el Databricks Runtime, se recomienda no seleccionar ni el primero ni los últimos para poder trabajar con una versión estable, para el proyecto seleccionamos la version "Runtime: 12.2 LTS".
  • 5.- Mantener desactivado la opción de "Phothon Aceleration", devido a que representa un gasto adicional, se recomienda activarlo en caso requiera mejorar el rendimiento de las operaciones de Python en el clúster.
  • 6.- Selecionamos el tipo de nodo (CPU o GPU), ajusta los tamaños y cantidades de nodos según tus necesidades de rendimiento y presupuesto, para el proyecto elegimos "Standard_DS3_V2".
  • 7.- Establecemos los minutos de inactividad del clúster para que se apague automáticamente cuando no esté en uso.
  • 8.- Finalmente le damos clic al botón "create compute".

Recuerda que puedes definir las características de escalado automático, si deseas que el clúster se ajuste automáticamente según la carga de trabajo. . Create Azure Databricks

  • Validamos que el clúster se haya creado satisfactoriamente.

Create Azure Databricks

Cargamos lo NoteBooks a Azure Databricks:

  • Nos dirigimos a Workspace
  • En el directorio Shared, importamos los notebooks, los cuales deben tener una extensión ".dbc".

Create Azure Databricks

  • Finalmente, ya tenemos el clúster creado y listo para llamarlo al abrir los notebooks.

Create Azure Databricks

Creando SECRET SCOPES conectado a AZURE KEY VAULT (kv)

  • Ir al workspace, luego a nuestro notebook de “Mount Storage”, finalmente modificar la url del workspace desde el “#”.
  • reemplazar en parte de la url: "#secrets/createScope". Sintaxis:
https://<your_azure_databricks_url>#secrets/createScope

Create Azure Databricks

Una vez realizado el paso anterior, nuestra ventana cambiará al Homepage “Create Secret Scope”

  • a. Scope name: “sc-adls”
  • b. Manage principal: “All Workspace Users”
  • c. CONFIGURACIÓN AZURE KEY VAULT

Ir a nuestro recurso “Key Vault”

a. Ir a properties

b. copiar y pegar DNS = Vault URI

c. Copiar y pegar Resource ID

Create Azure Databricks

  • Aplicamos cambios, clic en “ok”.

Create Azure Databricks