Passerelle de données sur site : guide d'installation et de configuration
La passerelle de données sur site constitue le pont entre le service Power BI (cloud) et vos sources de données sur site. Sans cela, toutes les données hébergées derrière le pare-feu de votre entreprise (bases de données SQL Server, instances PostgreSQL, systèmes Oracle, partages de fichiers, sources ODBC) ne peuvent pas être actualisées dans le service Power BI. La passerelle est également requise pour les connexions live/DirectQuery depuis le cloud vers des bases de données sur site.
Malgré son rôle essentiel, la passerelle est souvent considérée comme une réflexion secondaire. Les organisations l'installent sur l'ordinateur portable d'un développeur, ignorent la configuration haute disponibilité et se demandent pourquoi les actualisations planifiées échouent chaque week-end. Ce guide couvre le cycle de vie complet : décisions d'architecture, installation, clustering, configuration de la source de données, surveillance, réglage des performances et dépannage des erreurs les plus courantes.
Points clés à retenir
- La passerelle de données sur site est disponible en deux modes : personnel (utilisateur unique, pas de partage) et standard/entreprise (partagé dans toute l'organisation, prend en charge le clustering)
- Les passerelles d'entreprise doivent toujours être installées sur un serveur dédié (jamais un poste de travail de développeur) avec une alimentation, un réseau et une disponibilité fiables.
- Le clustering de passerelle avec deux nœuds ou plus offre une haute disponibilité --- si un nœud tombe en panne, l'autre continue de gérer les demandes d'actualisation
- Toutes les communications sont sortantes de la passerelle vers Azure Service Bus --- aucun port de pare-feu entrant ne doit être ouvert
- Les informations d'identification de la source de données sont cryptées localement sur la machine passerelle à l'aide de la clé de récupération --- la perte de cette clé signifie reconfigurer toutes les sources de données
- Les journaux de passerelle constituent la ressource de dépannage la plus utile, située dans le dossier GatewayComponents sous les données de l'application locale de l'utilisateur.
- Les performances peuvent être améliorées en activant le regroupement de connexions pour les sources relationnelles, en définissant des valeurs de délai d'attente appropriées et en garantissant que la machine passerelle dispose de suffisamment de RAM et de CPU.
Architecture de passerelle
Comment fonctionne la passerelle
La passerelle établit une connexion sortante à Azure Service Bus à l'aide du port TCP 443 (HTTPS). Aucun port entrant ne doit être ouvert dans votre pare-feu. Le flux de communication est :
- Un utilisateur ouvre un rapport Power BI dans le service ou une actualisation planifiée se déclenche
- Le service Power BI envoie une demande de requête à Azure Service Bus
- La passerelle (interrogation Azure Service Bus) récupère la requête
- La passerelle exécute la requête sur la source de données sur site
- La passerelle chiffre les résultats et les renvoie via Azure Service Bus
- Le service Power BI reçoit les résultats et restitue le rapport ou termine l'actualisation
Cette architecture signifie que la passerelle ne reçoit jamais de connexions entrantes en provenance d'Internet. Il initie toutes les communications sortantes, ce qui simplifie considérablement la configuration du pare-feu.
Passerelle personnelle vs passerelle standard (entreprise)
| Fonctionnalité | Passerelle personnelle | Passerelle standard |
|---|---|---|
| Utilisateurs | Utilisateur unique uniquement | Partagé dans toute l'organisation |
| Sources de données | Sources propres de l'utilisateur | Sources gérées de manière centralisée |
| Regroupement | Non pris en charge | Jusqu'à 10 nœuds |
| Administration | Libre-service utilisateur | Rôle d'administrateur de passerelle |
| Fonctionne comme | Applications Windows | Service Windows |
| Requête directe | Non pris en charge | Pris en charge |
| Flux de données | Non pris en charge | Pris en charge |
| Connexion en direct | Non pris en charge | Pris en charge |
| Réseau virtuel | Non pris en charge | Pris en charge (Premium) |
| Recommandation | Prototypage personnel uniquement | Utilisation en production |
Pour tout déploiement de production, utilisez la passerelle standard (entreprise). La passerelle personnelle convient uniquement aux utilisateurs individuels qui créent des prototypes avec leurs propres sources de données.
##Installation
Prérequis
Avant d'installer la passerelle, assurez-vous que la machine cible répond à ces exigences :
| Exigence | Minimum | Recommandé |
|---|---|---|
| Système d'exploitation | Windows Serveur 2016 | Windows Serveur 2022 |
| Processeur | 4 cœurs | 8 cœurs |
| RAM | 8 Go | 16 Go |
| Disque | 50 Go gratuits | Disque SSD de 100 Go |
| .NET-Framework | 4.8 | 4.8 (dernière mise à jour cumulative) |
| Réseau | 1 Gbit/s | 1 Gbit/s avec une faible latence vers les sources de données |
| TLS | 1.2 requis | 1.2 (1.0/1.1 désactivé) |
Critique : N'installez pas la passerelle sur le même serveur que votre base de données. La passerelle est en concurrence pour le processeur et la RAM lors des opérations d'actualisation, et sa colocalisation avec la base de données peut dégrader les performances de la passerelle et de la base de données.
Étapes d'installation
- Téléchargez le dernier programme d'installation de la passerelle à partir de la page de téléchargement officielle de Microsoft.
- Exécutez le programme d'installation et sélectionnez « Passerelle de données sur site (recommandée) » pour le mode entreprise.
- Acceptez les termes de la licence et choisissez le répertoire d'installation
- Connectez-vous avec votre compte organisationnel (le compte doit être dans le même locataire Azure AD que votre service Power BI)
- Sélectionnez "Enregistrer une nouvelle passerelle sur cet ordinateur"
- Nommez la passerelle (utilisez un nom descriptif : par exemple, "PROD-GW-NY-01" pour la passerelle de production, New York, nœud 1)
- Définissez la clé de récupération --- stockez-la en toute sécurité dans un gestionnaire de mots de passe ou un coffre-fort de clés. Vous en aurez besoin pour ajouter des nœuds de cluster ou récupérer la passerelle
- Terminez l'installation
Le service de passerelle démarre automatiquement et s'exécute par défaut sous le compte « NT SERVICE\PBIEgwService ».
Modification du compte de service
Par défaut, la passerelle s'exécute en tant que compte de service local. Pour accéder aux ressources réseau (partages de fichiers, bases de données jointes à un domaine avec authentification Windows), vous devrez peut-être remplacer le compte de service par un compte de domaine :
- Ouvrez les services Windows (services.msc)
- Recherchez « Service de passerelle de données sur site »
- Cliquez avec le bouton droit, sélectionnez Propriétés, puis l'onglet Connexion.
- Sélectionnez "Ce compte" et entrez les informations d'identification du domaine
- Redémarrez le service
Accordez au compte de service les éléments suivants :
- Politique locale « Connexion en tant que service »
- Accès en lecture aux sources de données dont il a besoin pour interroger
- Accès réseau aux serveurs de sources de données
Clustering de passerelle pour la haute disponibilité
Une seule passerelle est un point de défaillance unique. Si la machine tombe en panne, toutes les actualisations planifiées et les connexions DirectQuery échouent. Le clustering de passerelle résout ce problème en distribuant les requêtes sur plusieurs nœuds.
Création d'un cluster
- Installez la passerelle sur une deuxième machine en suivant les mêmes étapes d'installation
- Lors de l'étape "Enregistrer une nouvelle passerelle", sélectionnez "Ajouter à un cluster de passerelle existant"
- Sélectionnez le nom de la passerelle existante dans la liste déroulante
- Entrez la clé de récupération (la même clé utilisée pour le premier nœud)
- Terminez l'installation
Le cluster comporte désormais deux nœuds. Les requêtes sont réparties sur les nœuds sains.
Configuration de l'équilibrage de charge
Par défaut, les clusters de passerelle distribuent les requêtes de manière aléatoire. Vous pouvez configurer l'équilibrage de charge :
Round-robin : distribue les requêtes uniformément sur tous les nœuds. Idéal pour les clusters avec un matériel identique.
Routage pondéré : Dirige davantage de requêtes vers des nœuds plus puissants. Configurez dans le portail d’administration Power BI sous les paramètres de la passerelle.
Failover uniquement : Toutes les demandes sont adressées au nœud principal. Les nœuds secondaires ne s'activent que si le nœud principal n'est pas disponible. Idéal pour les déploiements économiques avec un serveur de secours.
Topologie de cluster recommandée
Pour les déploiements de production, ECOSIRE recommande un minimum de deux nœuds de passerelle :
| Composant | Nœud 1 | Nœud 2 |
|---|---|---|
| Rôle | Primaire | Secondaire |
| Localisation | Centre de données principal | Site DR ou même DC |
| Matériel | 8 cœurs, 16 Go de RAM | 8 cœurs, 16 Go de RAM |
| Réseau | 1 Gbit/s, faible latence | 1 Gbit/s, faible latence |
| Fenêtre de maintenance | Dimanche 2h-4h | Samedi 2h-4h |
Décalez les fenêtres de maintenance afin que les deux nœuds ne soient jamais arrêtés simultanément. Les mises à jour Windows, les correctifs .NET et les mises à niveau de la version de la passerelle doivent être appliqués à un nœud à la fois.
Configuration de la source de données
Ajout d'une source de données
Après avoir installé la passerelle, configurez les sources de données dans le service Power BI :
- Accédez à Paramètres (icône d'engrenage), puis Gérer les passerelles.
- Sélectionnez votre cluster de passerelle
- Cliquez sur "Ajouter une source de données"
- Choisissez le type de source de données (SQL Server, PostgreSQL, Oracle, ODBC, etc.)
- Entrez les détails de connexion (nom du serveur, nom de la base de données)
- Sélectionnez la méthode d'authentification (Windows, Basic, OAuth2)
- Entrez les informations d'identification
- Testez la connexion
Types de sources de données pris en charge
La passerelle standard prend en charge plus de 80 types de sources de données. Les plus courants pour Power BI :
| Source de données | Méthodes d'authentification | Requête directe | Remarques |
|---|---|---|---|
| Serveur SQL | Windows, Basique, OAuth | Oui | Source d'entreprise la plus courante |
| PostgreSQL | De base | Oui | Utilisé par Odoo, de nombreuses applications open source |
| Oracle | Windows, de base | Oui | Nécessite un client Oracle sur la passerelle |
| MySQL | De base | Oui | Connecteur communautaire |
| SAP HANA | De base, SAML | Oui | Nécessite le client SAP HANA |
| Fichier (CSV/Excel) | N/A | Non | Les fichiers doivent être sur un partage réseau |
| ODBC | De base, Windows | Oui | Connecteur générique pour toute source ODBC |
| API Web | Anonyme, basique, OAuth | Non | Pour les points de terminaison REST/OData |
Cryptage des informations d'identification
Les informations d'identification de la source de données sont cryptées à l'aide de la clé de récupération et stockées localement sur la machine passerelle. Ils ne sont jamais envoyés vers le cloud en clair. Lorsque vous ajoutez un nœud de cluster, les informations d'identification sont synchronisées à l'aide de la clé de récupération partagée.
Important : Si vous perdez la clé de récupération et que tous les nœuds de passerelle échouent, vous devez :
- Installez une nouvelle passerelle avec une nouvelle clé de récupération
- Reconfigurez toutes les sources de données et informations d'identification
- Remappez tous les ensembles de données du service Power BI vers la nouvelle passerelle
Stockez la clé de récupération dans Azure Key Vault ou dans le gestionnaire de mots de passe de votre organisation.
Regroupement de connexions
Pour les bases de données relationnelles (SQL Server, PostgreSQL, Oracle), activez le regroupement de connexions pour réutiliser les connexions de base de données lors des opérations d'actualisation :
Dans le fichier de configuration de la passerelle (Microsoft.PowerBI.EnterpriseGateway.exe.config) :
<setting name="PoolConnections" serializeAs="String">
<value>True</value>
</setting>
<setting name="MinPoolSize" serializeAs="String">
<value>2</value>
</setting>
<setting name="MaxPoolSize" serializeAs="String">
<value>20</value>
</setting>
Le regroupement de connexions réduit la surcharge liée à l'établissement de nouvelles connexions à la base de données pour chaque requête, en particulier lors des charges de travail DirectQuery avec de nombreux utilisateurs simultanés.
Configuration d'actualisation planifiée
Configuration de l'actualisation programmée
Après avoir publié un jeu de données sur le service Power BI :
- Accédez aux paramètres de l'ensemble de données
- Sous « Connexion à la passerelle », sélectionnez votre passerelle et la source de données configurée.
- Sous « Actualisation programmée », activez le bouton
- Définissez la fréquence de rafraîchissement (quotidienne, hebdomadaire ou heures spécifiques)
- Configurez le fuseau horaire
- Configurez éventuellement les notifications d'échec
Limites de fréquence d'actualisation
| Licence | Actualisations maximales par jour | Intervalle minimum |
|---|---|---|
| Power BI Pro | 8 | 3 heures |
| Power BI Premium (par capacité) | 48 | 30 minutes |
| Power BI Premium par utilisateur | 48 | 30 minutes |
Actualiser les fenêtres et échelonner
Ne planifiez pas toutes les actualisations des ensembles de données en même temps. La passerelle dispose d'un processeur et d'une mémoire limités, et les actualisations simultanées se disputent les ressources.
Bonne pratique : Créez une planification d'actualisation qui échelonne les ensembles de données sur la fenêtre disponible :
| Temps | Ensemble de données | Priorité |
|---|---|---|
| 01h00 | Finances - Résumé GL | Critique |
| 01h30 | Ventes - Pipeline | Critique |
| 02h00 | RH - Effectif | Élevé |
| 02h30 | Inventaire - Niveaux de stock | Élevé |
| 3h00 | Fabrication - OEE | Moyen |
| 3h30 | Marketing – Métriques de campagne | Moyen |
Les ensembles de données critiques sont actualisés en premier, garantissant qu'ils sont terminés même si les actualisations ultérieures rencontrent des problèmes.
Actualisation incrémentielle et passerelle
L'actualisation incrémentielle réduit considérablement le volume de données traitées via la passerelle. Au lieu d'actualiser l'intégralité de l'ensemble de données, seules les lignes nouvelles et modifiées sont récupérées. Ceci est particulièrement important pour les grands ensembles de données où une actualisation complète prendrait des heures et consommerait des ressources de passerelle excessives.
Configurez l’actualisation incrémentielle dans Power BI Desktop (voir l’approche des paramètres RangeStart/RangeEnd), puis publiez sur le service. La passerelle gère automatiquement les requêtes paramétrées.
Configuration du pare-feu et du proxy
Connexions sortantes requises
La passerelle nécessite un accès HTTPS sortant (TCP 443) pour :
| Destination | Objectif |
|---|---|
| *.servicebus.windows.net | Azure Service Bus (relais de requêtes) |
| *.frontend.clouddatahub.net | Enregistrement et mises à jour de la passerelle |
| *.core.windows.net | Stockage Blob Azure (transfert de données) |
| connexion.microsoftonline.com | Authentification Azure AD |
| *.msftncsi.com | Vérification de la connectivité réseau |
| télécharger.microsoft.com | Mises à jour de la passerelle |
Si votre pare-feu nécessite une liste blanche IP explicite au lieu de domaines génériques, utilisez le fichier JSON Azure IP Ranges de Microsoft (mis à jour chaque semaine) pour rechercher les plages IP pour Azure Service Bus dans votre région.
Configuration du serveur proxy
Si la passerelle doit transiter par un proxy d'entreprise :
- Modifiez
Microsoft.PowerBI.EnterpriseGateway.exe.config - Ajoutez la configuration du proxy dans la section
<system.net>:
<system.net>
<defaultProxy useDefaultCredentials="true">
<proxy proxyaddress="http://proxy.company.com:8080"
bypassonlocal="true" />
</defaultProxy>
</system.net>
- Redémarrez le service de passerelle
Si le proxy nécessite des informations d'identification spécifiques (pas d'authentification Windows directe), vous devrez peut-être utiliser un fichier PAC proxy ou configurer le proxy pour autoriser le compte de service de la passerelle sans authentification supplémentaire.
###Configuration TLS
La passerelle nécessite TLS 1.2. Si votre environnement a toujours TLS 1.0 ou 1.1 activé, la passerelle utilisera TLS 1.2 par défaut. Toutefois, si le serveur de source de données prend uniquement en charge TLS 1.0, la connexion échouera.
Vérifiez que TLS 1.2 est activé dans le registre Windows :
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SecurityProviders\SCHANNEL\Protocols\TLS 1.2\Client
Enabled = 1 (DWORD)
DisabledByDefault = 0 (DWORD)
Surveillance et journalisation
Journaux de la passerelle
La passerelle écrit des journaux détaillés dans :
C:\Users\<ServiceAccount>\AppData\Local\Microsoft\On-premises data gateway\
Fichiers journaux de clés :
| Fichier | Contenu |
|---|---|
| GatewayInfo*.log | Opérations générales de la passerelle, démarrage, arrêt |
| GatewayErrors*.log | Erreurs et exceptions |
| Application composite*.log | Opérations du moteur Power Query (M) |
| Rapport*.log | Détails d'exécution des requêtes, compteurs de performances |
Activation de la journalisation supplémentaire
Pour le dépannage, activez la journalisation détaillée :
- Ouvrez l'application de configuration de la passerelle
- Accédez à Diagnostics
- Activez « Journalisation supplémentaire »
- Reproduire le problème
- Exportez les journaux à l'aide du bouton "Exporter les journaux" (crée un ZIP de tous les fichiers journaux)
- Désactivez la journalisation supplémentaire après le dépannage (cela génère de gros volumes de journaux)
Compteurs de performances
La passerelle expose les compteurs de performances Windows dans la catégorie « Passerelle de données sur site » :
| Compteur | Descriptif | Seuil d'alerte |
|---|---|---|
| Connexions actives | Connexions ouvertes actuelles aux sources de données | > 50 |
| Requêtes exécutées/s | Débit des requêtes | Référence + 50 % |
| Durée moyenne des requêtes | Temps d'exécution des requêtes | > 30 secondes |
| Longueur de la file d'attente | Requêtes en attente d'exécution | > 10 |
| Utilisation de la mémoire | Consommation de mémoire du processus de passerelle | > 80% des disponibles |
| Utilisation du processeur | Consommation du processeur du processus de passerelle | > 70% soutenu |
Configurez Windows Performance Monitor ou un outil de surveillance (Prometheus, Datadog, Azure Monitor) pour suivre ces compteurs et alerter sur les seuils.
Surveillance du portail d'administration Power BI
Dans le portail d’administration Power BI :
- Accédez au portail d'administration, puis à Gateway Management.
- Affichez toutes les passerelles, leur statut (en ligne/hors ligne) et leur version
- Voir les statistiques d'utilisation des sources de données
- Surveiller les taux de réussite/échec du rafraîchissement
Configurez les notifications par e-mail pour les événements hors ligne de la passerelle et les échecs d'actualisation.
Optimisation des performances
Dimensionnement du matériel
Les performances de la passerelle sont principalement liées par :
- CPU — pour l'analyse des requêtes, la compression des données et le chiffrement
- RAM — pour conserver les résultats de requêtes intermédiaires
- Réseau — pour transférer des données vers Azure Service Bus
Consignes de dimensionnement :
| Scénario | Processeur | RAM | Réseau |
|---|---|---|---|
| 5 ensembles de données, actualisation quotidienne | 4 cœurs | 8 Go | 100 Mbit/s |
| 20 ensembles de données, deux fois par jour | 8 cœurs | 16 Go | 1 Gbit/s |
| Plus de 50 ensembles de données, DirectQuery | 16 cœurs | 32 Go | 1 Gbit/s |
| DirectQuery lourd, nombreux utilisateurs simultanés | 16+ cœurs | 64 Go | 10 Gbit/s |
Paramètres du moteur d'application composite
La passerelle utilise le moteur Power Query (Mashup) pour la transformation des données. Configurez dans l'application passerelle :
Nombre maximal de requêtes simultanées : La valeur par défaut est le nombre de cœurs de processeur multiplié par 2. Augmentation pour les charges de travail liées aux E/S (en attente de sources de données lentes). Diminution des charges de travail liées au processeur (transformations lourdes).
Limite de mémoire par requête : La valeur par défaut est aucune limite. Définissez une limite (par exemple, 2 Go) pour empêcher une seule requête incontrôlable de consommer toute la RAM disponible.
Optimisation du réseau
Localisez la passerelle à proximité de la source de données. La latence du réseau entre la passerelle et la source de données est multipliée par le nombre de requêtes par actualisation. Une passerelle dans le même centre de données que la base de données minimise la latence.
Ne localisez pas la passerelle en fonction de sa proximité avec Azure. La connexion Azure Service Bus est une connexion TCP persistante unique. La latence vers Azure affecte la configuration initiale de la connexion, mais pas le débit des requêtes.
Utilisez une connexion filaire. N'exécutez jamais une passerelle de production sur Wi-Fi. La connectivité intermittente provoque des échecs d’actualisation.
Optimisation des requêtes à la source
Le moyen le plus rapide d’améliorer les performances de la passerelle consiste à optimiser les requêtes qu’elle exécute :
- Utilisez des requêtes SQL personnalisées au lieu d'importer des tables entières (réduisez le volume de données)
- Créer des index de base de données sur les colonnes utilisées dans les clauses WHERE et JOIN
- Utiliser des vues avec des pré-jointures et des pré-agrégations pour des modèles de données complexes
- Activer le repliement des requêtes dans Power Query pour pousser les transformations vers la base de données
- Implémenter une actualisation incrémentielle pour réduire le volume de données par cycle d'actualisation
Dépannage des erreurs courantes
"La passerelle n'est pas accessible"
Cause : Le service de passerelle est arrêté, la machine est en panne ou la connectivité réseau à Azure est bloquée.
Résolution :
- Vérifiez si le service Windows de la passerelle est en cours d'exécution (services.msc)
- Vérifiez que le HTTPS sortant vers *.servicebus.windows.net est autorisé
- Vérifiez les paramètres du proxy si vous êtes derrière un proxy d'entreprise
- Vérifiez que la machine passerelle dispose d'une connectivité Internet
- Vérifiez si la version de la passerelle est obsolète (les mises à jour automatiques peuvent échouer silencieusement)
"Impossible de se connecter à la source de données"
Cause : Informations d'identification incorrectes, connectivité réseau à la source de données ou problèmes de pilote.
Résolution :
- Testez la connexion dans l'application de configuration de la passerelle (Diagnostics, puis Test de connexion)
- Vérifiez que le serveur de source de données est accessible depuis la machine passerelle (ping, telnet vers le port)
- Vérifiez que les informations d'identification sont correctes et que le compte n'est pas verrouillé/expiré.
- Pour Oracle et SAP, vérifiez que les bibliothèques client requises sont installées sur la machine passerelle.
- Vérifiez que le pare-feu de la source de données autorise les connexions à partir de l'adresse IP de la passerelle.
"L'actualisation de la passerelle de données sur site prend trop de temps"
Cause : Ensemble de données volumineux, requêtes lentes, ressources de passerelle insuffisantes ou goulot d'étranglement du réseau.
Résolution :
- Activez l'actualisation incrémentielle pour réduire le volume de données
- Optimiser les requêtes SQL (ajouter des index, réduire les colonnes, filtrer les lignes)
- Vérifiez l'utilisation du processeur et de la RAM de la machine passerelle pendant l'actualisation.
- Échelonner les calendriers d'actualisation pour réduire la charge simultanée
- Envisagez d'ajouter un deuxième nœud de passerelle pour la répartition de la charge
"Les informations d'identification de la source de données ne sont pas valides"
Cause : Mot de passe modifié, compte verrouillé ou délégation Kerberos mal configurée.
Résolution :
- Ressaisissez les informations d'identification dans le service Power BI (paramètres du jeu de données, puis connexion à la passerelle)
- Si vous utilisez l'authentification Windows avec Kerberos, vérifiez :
- Le compte de service de passerelle dispose de privilèges de délégation dans Active Directory
- Les SPN sont correctement configurés pour la source de données
- Le KDC (contrôleur de domaine) est accessible depuis la passerelle
"La version de la passerelle est obsolète"
Cause : La mise à jour automatique a échoué ou a été désactivée.
Résolution :
- Téléchargez le dernier programme d'installation de la passerelle de Microsoft
- Exécutez le programme d'installation sur la machine passerelle existante (il est mis à niveau sur place)
- Pour les clusters, mettez à niveau un nœud à la fois avec un intervalle entre les mises à niveau
- Vérifiez la version de la passerelle dans le portail d'administration Power BI après la mise à niveau
Bonnes pratiques de sécurité
Principe du moindre privilège
- Le compte de service de passerelle doit avoir un accès en lecture seule aux sources de données
- N'utilisez pas de comptes d'administrateur de domaine ou d'administrateur de base de données
- Créez des comptes de service dédiés par type de source de données si votre politique de sécurité l'exige
- Faites pivoter les mots de passe des comptes de service selon un calendrier régulier et mettez à jour la configuration de la source de données de la passerelle
Gestion des clés de récupération
La clé de récupération chiffre toutes les informations d'identification stockées localement. Traitez-la avec le même soin qu'une clé principale de base de données :
- Stocker dans Azure Key Vault ou dans un gestionnaire de mots de passe d'entreprise
- Document qui a accès à la clé de récupération
- Incluez la rotation des clés de récupération dans votre politique de gestion des clés
- Testez la récupération en restaurant une passerelle à partir d'une sauvegarde avec la clé de récupération
Segmentation du réseau
Placez la passerelle dans un segment de réseau pouvant atteindre :
- Serveurs de sources de données (SQL Server, PostgreSQL, Oracle, etc.)
- Azure Service Bus (HTTPS sortant)
- Azure AD (HTTPS sortant)
Bloquez tout autre trafic entrant et sortant. La passerelle n'a pas besoin de connexions entrantes provenant d'aucune source.
Piste d'audit
Activez l'audit de sécurité Windows sur la machine passerelle pour suivre :
- Événements de connexion au compte de service
- Modifications de la configuration de la passerelle
- Modèles d'accès aux sources de données
Transférez ces événements à votre SIEM (Splunk, Sentinel, Datadog) pour une surveillance centralisée.
Scénarios de migration et de mise à niveau
Migration vers une nouvelle machine passerelle
- Installez la passerelle sur la nouvelle machine
- Lors de l'inscription, sélectionnez « Migrer, restaurer ou reprendre une passerelle existante »
- Entrez la clé de récupération de la passerelle d'origine
- La nouvelle machine hérite de toutes les configurations et informations d'identification de la source de données
- Vérifiez que toutes les sources de données s'affichent comme connectées dans le portail d'administration Power BI.
- Mettez à jour toutes les règles de pare-feu basées sur IP pour inclure l'adresse IP de la nouvelle machine.
- Mettez hors service l'ancienne machine de passerelle
Mise à niveau des versions de passerelle
Microsoft publie des mises à jour de passerelle mensuellement. Bonnes pratiques :
- Abonnez-vous aux notes de version de la passerelle pour être informé à l'avance des modifications
- Testez d'abord les nouvelles versions dans un cluster de passerelle hors production
- Pour les clusters de production, mettez à niveau un nœud à la fois avec un intervalle de 24 heures
- Vérifier les taux de réussite de l'actualisation après chaque mise à niveau de nœud
- Conserver au moins un nœud sur la version précédente jusqu'à ce que la nouvelle version soit validée
La passerelle prend en charge la compatibilité des versions N-1 dans les clusters : les nœuds n'ont pas besoin d'exécuter exactement la même version.
##FAQ
Puis-je installer la passerelle sur une machine virtuelle ?
Oui. La passerelle s'exécute sur des machines physiques et virtuelles, notamment des machines virtuelles Azure, AWS EC2 et Hyper-V ou VMware sur site. Pour les machines virtuelles Azure, envisagez d’utiliser la passerelle de données VNet (en préversion pour les capacités Premium) qui élimine entièrement le besoin d’une passerelle autogérée. Pour les machines virtuelles sur site, assurez-vous que la machine virtuelle dispose de ressources CPU et RAM dédiées (non partagées), et que l'hyperviseur ne surexploite pas de manière agressive les ressources.
Combien de sources de données une seule passerelle peut-elle prendre en charge ?
Il n'y a pas de limite stricte quant au nombre de sources de données par passerelle. En pratique, les passerelles prennent généralement en charge 50 à 100 sources de données sans problème. Le facteur limitant est la charge de requêtes simultanées pendant les fenêtres d'actualisation, et non le nombre de sources de données configurées. Si les temps d'actualisation se dégradent, ajoutez des nœuds de cluster plutôt que de créer des installations de passerelle supplémentaires.
La passerelle prend-elle en charge Linux ?
Non. La passerelle de données sur site nécessite Windows (Server 2016 ou version ultérieure). Si vos sources de données s'exécutent sous Linux, installez la passerelle sur une machine Windows disposant d'un accès réseau aux serveurs de sources de données Linux. La passerelle se connecte à la source de données via le réseau : elle n'a pas besoin de s'exécuter sur le même système d'exploitation que la source de données.
Que se passe-t-il si les deux nœuds de passerelle d'un cluster se déconnectent simultanément ?
Toutes les actualisations planifiées échouent et toutes les connexions DirectQuery renvoient des erreurs. Le service Power BI détecte l'état hors ligne et envoie des notifications aux administrateurs de passerelle (si configurés). Les rapports utilisant des données mises en cache (mode Importation) continuent d'afficher les dernières données actualisées avec succès. Lorsqu'au moins un nœud revient en ligne, les demandes d'actualisation en attente sont traitées automatiquement. Pour éviter ce scénario, échelonnez les fenêtres de maintenance et placez les nœuds de cluster sur une infrastructure physique distincte.
La passerelle peut-elle gérer les données en streaming en temps réel ?
La passerelle est conçue pour les modèles requête-réponse, et non pour le streaming. Pour les données en temps réel, envisagez les ensembles de données de streaming Power BI (qui contournent entièrement la passerelle), Azure Stream Analytics ou Azure Event Hubs avec les tableaux de bord en temps réel Power BI. La passerelle prend en charge DirectQuery pour un accès en temps quasi réel aux bases de données sur site, mais chaque interaction de rapport déclenche une nouvelle requête plutôt que de recevoir un flux de données continu.
Rédigé par
ECOSIRE Research and Development Team
Création de produits numériques de niveau entreprise chez ECOSIRE. Partage d'analyses sur les intégrations Odoo, l'automatisation e-commerce et les solutions d'entreprise propulsées par l'IA.
Articles connexes
Fonctionnalités Power BI AI : Copilot, AutoML et analyse prédictive
Maîtrisez les fonctionnalités de Power BI AI, notamment Copilot pour les rapports en langage naturel, AutoML pour les prédictions, la détection d'anomalies et les récits intelligents. Guide des licences.
Guide complet de développement de tableaux de bord Power BI
Découvrez comment créer des tableaux de bord Power BI efficaces avec une conception KPI, des bonnes pratiques visuelles, des pages d'accès au détail, des signets, des mises en page mobiles et la sécurité RLS.
Modélisation de données Power BI : conception de schémas en étoile pour la Business Intelligence
Maîtrisez la modélisation des données Power BI avec la conception de schémas en étoile, les tableaux de faits et de dimensions, les mesures DAX, les groupes de calcul, l'intelligence temporelle et les modèles composites.