Dedicated SQL Pools Vs Serverless SQL Pools in Azure Synapse Analytics

 

SQL pools are a term that will appear frequently in Azure Synapse Analytics. 

It is useful to understand the distinction between the two and how they function.

No requirement will be the same as the previous one, and end users may require different types of usage for each project. When designing Azure Synapse analytics, Microsoft kept this in mind and ensured that end users could use different approaches to manage their compute availability for different scenarios. Compute and storage are the fundamental building blocks, but in Synapse analytics, they are kept separate, allowing us to scale compute independently of the data stored in the system.

Dedicated SQL Pool

Dedicated SQL Pool is a high-performance MPP (Massively Parallel Processing) distributed query engine designed for big data and data warehousing workloads. 

The performance is determined by the DWU (Data Warehouse Units) that are selected when the resource is created. 

There will be one compute node for each DWU of 100. We can choose to double our DWU to 200, giving us two compute nodes and doubling the performance of a single node. 

The best part is that we can pause our Dedicated SQL Pool resources to save money and resume them when needed. 

We can, for example, process a batch of data and then pause it once it is finished. When we only need the data for reading, we can simply scale down to 100 DWUs rather than pausing completely.

Please keep in mind that storage costs apply even when the Dedicated SQL Pool is paused.

Serverless SQL Pool

A Serverless SQL Pool is an auto scale compute environment in which we can query the ADLS directly using the TSQL capabilities. 

It employs a straightforward model in which the Serverless SQL Pool serves as the compute engine and the ADLS servers serve as storage. 

As a default configuration, every Synapse analytics workspace that we create will include a Serverless SQL Pool endpoint. 

Serverless SQL Pools can be used to query data from ADLS (including parquet, CSV formats). 

It is more popular than a dedicated SQL pool because it provides greater billing control, which assists customers in approaching budgets and forecasting. 

It imposes a pay-per-query model and assists customers with ad hoc querying. 

Because Serverless SQL Pools lack local storage, all queries are routed to external endpoints, and reading from storage may impact query performance.