Passerelle de données sur site : Guide d'installation et de configuration

Installez et configurez la passerelle de données Power BI sur site. Mode personnel ou entreprise, clustering, paramètres de pare-feu, surveillance et dépannage.

E
ECOSIRE Research and Development Team
|17 mars 202622 min de lecture4.9k Mots|

Passerelle de données sur site : guide d'installation et de configuration

La passerelle de données sur site constitue le pont entre le service Power BI (cloud) et vos sources de données sur site. Sans cela, toutes les données hébergées derrière le pare-feu de votre entreprise (bases de données SQL Server, instances PostgreSQL, systèmes Oracle, partages de fichiers, sources ODBC) ne peuvent pas être actualisées dans le service Power BI. La passerelle est également requise pour les connexions live/DirectQuery depuis le cloud vers des bases de données sur site.

Malgré son rôle essentiel, la passerelle est souvent considérée comme une réflexion secondaire. Les organisations l'installent sur l'ordinateur portable d'un développeur, ignorent la configuration haute disponibilité et se demandent pourquoi les actualisations planifiées échouent chaque week-end. Ce guide couvre le cycle de vie complet : décisions d'architecture, installation, clustering, configuration de la source de données, surveillance, réglage des performances et dépannage des erreurs les plus courantes.


Points clés à retenir

  • La passerelle de données sur site est disponible en deux modes : personnel (utilisateur unique, pas de partage) et standard/entreprise (partagé dans toute l'organisation, prend en charge le clustering)
  • Les passerelles d'entreprise doivent toujours être installées sur un serveur dédié (jamais un poste de travail de développeur) avec une alimentation, un réseau et une disponibilité fiables.
  • Le clustering de passerelle avec deux nœuds ou plus offre une haute disponibilité --- si un nœud tombe en panne, l'autre continue de gérer les demandes d'actualisation
  • Toutes les communications sont sortantes de la passerelle vers Azure Service Bus --- aucun port de pare-feu entrant ne doit être ouvert
  • Les informations d'identification de la source de données sont cryptées localement sur la machine passerelle à l'aide de la clé de récupération --- la perte de cette clé signifie reconfigurer toutes les sources de données
  • Les journaux de passerelle constituent la ressource de dépannage la plus utile, située dans le dossier GatewayComponents sous les données de l'application locale de l'utilisateur.
  • Les performances peuvent être améliorées en activant le regroupement de connexions pour les sources relationnelles, en définissant des valeurs de délai d'attente appropriées et en garantissant que la machine passerelle dispose de suffisamment de RAM et de CPU.

Architecture de passerelle

Comment fonctionne la passerelle

La passerelle établit une connexion sortante à Azure Service Bus à l'aide du port TCP 443 (HTTPS). Aucun port entrant ne doit être ouvert dans votre pare-feu. Le flux de communication est :

  1. Un utilisateur ouvre un rapport Power BI dans le service ou une actualisation planifiée se déclenche
  2. Le service Power BI envoie une demande de requête à Azure Service Bus
  3. La passerelle (interrogation Azure Service Bus) récupère la requête
  4. La passerelle exécute la requête sur la source de données sur site
  5. La passerelle chiffre les résultats et les renvoie via Azure Service Bus
  6. Le service Power BI reçoit les résultats et restitue le rapport ou termine l'actualisation

Cette architecture signifie que la passerelle ne reçoit jamais de connexions entrantes en provenance d'Internet. Il initie toutes les communications sortantes, ce qui simplifie considérablement la configuration du pare-feu.

Passerelle personnelle vs passerelle standard (entreprise)

FonctionnalitéPasserelle personnellePasserelle standard
UtilisateursUtilisateur unique uniquementPartagé dans toute l'organisation
Sources de donnéesSources propres de l'utilisateurSources gérées de manière centralisée
RegroupementNon pris en chargeJusqu'à 10 nœuds
AdministrationLibre-service utilisateurRôle d'administrateur de passerelle
Fonctionne commeApplications WindowsService Windows
Requête directeNon pris en chargePris en charge
Flux de donnéesNon pris en chargePris en charge
Connexion en directNon pris en chargePris en charge
Réseau virtuelNon pris en chargePris en charge (Premium)
RecommandationPrototypage personnel uniquementUtilisation en production

Pour tout déploiement de production, utilisez la passerelle standard (entreprise). La passerelle personnelle convient uniquement aux utilisateurs individuels qui créent des prototypes avec leurs propres sources de données.


##Installation

Prérequis

Avant d'installer la passerelle, assurez-vous que la machine cible répond à ces exigences :

ExigenceMinimumRecommandé
Système d'exploitationWindows Serveur 2016Windows Serveur 2022
Processeur4 cœurs8 cœurs
RAM8 Go16 Go
Disque50 Go gratuitsDisque SSD de 100 Go
.NET-Framework4.84.8 (dernière mise à jour cumulative)
Réseau1 Gbit/s1 Gbit/s avec une faible latence vers les sources de données
TLS1.2 requis1.2 (1.0/1.1 désactivé)

Critique : N'installez pas la passerelle sur le même serveur que votre base de données. La passerelle est en concurrence pour le processeur et la RAM lors des opérations d'actualisation, et sa colocalisation avec la base de données peut dégrader les performances de la passerelle et de la base de données.

Étapes d'installation

  1. Téléchargez le dernier programme d'installation de la passerelle à partir de la page de téléchargement officielle de Microsoft.
  2. Exécutez le programme d'installation et sélectionnez « Passerelle de données sur site (recommandée) » pour le mode entreprise.
  3. Acceptez les termes de la licence et choisissez le répertoire d'installation
  4. Connectez-vous avec votre compte organisationnel (le compte doit être dans le même locataire Azure AD que votre service Power BI)
  5. Sélectionnez "Enregistrer une nouvelle passerelle sur cet ordinateur"
  6. Nommez la passerelle (utilisez un nom descriptif : par exemple, "PROD-GW-NY-01" pour la passerelle de production, New York, nœud 1)
  7. Définissez la clé de récupération --- stockez-la en toute sécurité dans un gestionnaire de mots de passe ou un coffre-fort de clés. Vous en aurez besoin pour ajouter des nœuds de cluster ou récupérer la passerelle
  8. Terminez l'installation

Le service de passerelle démarre automatiquement et s'exécute par défaut sous le compte « NT SERVICE\PBIEgwService ».

Modification du compte de service

Par défaut, la passerelle s'exécute en tant que compte de service local. Pour accéder aux ressources réseau (partages de fichiers, bases de données jointes à un domaine avec authentification Windows), vous devrez peut-être remplacer le compte de service par un compte de domaine :

  1. Ouvrez les services Windows (services.msc)
  2. Recherchez « Service de passerelle de données sur site »
  3. Cliquez avec le bouton droit, sélectionnez Propriétés, puis l'onglet Connexion.
  4. Sélectionnez "Ce compte" et entrez les informations d'identification du domaine
  5. Redémarrez le service

Accordez au compte de service les éléments suivants :

  • Politique locale « Connexion en tant que service »
  • Accès en lecture aux sources de données dont il a besoin pour interroger
  • Accès réseau aux serveurs de sources de données

Clustering de passerelle pour la haute disponibilité

Une seule passerelle est un point de défaillance unique. Si la machine tombe en panne, toutes les actualisations planifiées et les connexions DirectQuery échouent. Le clustering de passerelle résout ce problème en distribuant les requêtes sur plusieurs nœuds.

Création d'un cluster

  1. Installez la passerelle sur une deuxième machine en suivant les mêmes étapes d'installation
  2. Lors de l'étape "Enregistrer une nouvelle passerelle", sélectionnez "Ajouter à un cluster de passerelle existant"
  3. Sélectionnez le nom de la passerelle existante dans la liste déroulante
  4. Entrez la clé de récupération (la même clé utilisée pour le premier nœud)
  5. Terminez l'installation

Le cluster comporte désormais deux nœuds. Les requêtes sont réparties sur les nœuds sains.

Configuration de l'équilibrage de charge

Par défaut, les clusters de passerelle distribuent les requêtes de manière aléatoire. Vous pouvez configurer l'équilibrage de charge :

Round-robin : distribue les requêtes uniformément sur tous les nœuds. Idéal pour les clusters avec un matériel identique.

Routage pondéré : Dirige davantage de requêtes vers des nœuds plus puissants. Configurez dans le portail d’administration Power BI sous les paramètres de la passerelle.

Failover uniquement : Toutes les demandes sont adressées au nœud principal. Les nœuds secondaires ne s'activent que si le nœud principal n'est pas disponible. Idéal pour les déploiements économiques avec un serveur de secours.

Topologie de cluster recommandée

Pour les déploiements de production, ECOSIRE recommande un minimum de deux nœuds de passerelle :

ComposantNœud 1Nœud 2
RôlePrimaireSecondaire
LocalisationCentre de données principalSite DR ou même DC
Matériel8 cœurs, 16 Go de RAM8 cœurs, 16 Go de RAM
Réseau1 Gbit/s, faible latence1 Gbit/s, faible latence
Fenêtre de maintenanceDimanche 2h-4hSamedi 2h-4h

Décalez les fenêtres de maintenance afin que les deux nœuds ne soient jamais arrêtés simultanément. Les mises à jour Windows, les correctifs .NET et les mises à niveau de la version de la passerelle doivent être appliqués à un nœud à la fois.


Configuration de la source de données

Ajout d'une source de données

Après avoir installé la passerelle, configurez les sources de données dans le service Power BI :

  1. Accédez à Paramètres (icône d'engrenage), puis Gérer les passerelles.
  2. Sélectionnez votre cluster de passerelle
  3. Cliquez sur "Ajouter une source de données"
  4. Choisissez le type de source de données (SQL Server, PostgreSQL, Oracle, ODBC, etc.)
  5. Entrez les détails de connexion (nom du serveur, nom de la base de données)
  6. Sélectionnez la méthode d'authentification (Windows, Basic, OAuth2)
  7. Entrez les informations d'identification
  8. Testez la connexion

Types de sources de données pris en charge

La passerelle standard prend en charge plus de 80 types de sources de données. Les plus courants pour Power BI :

Source de donnéesMéthodes d'authentificationRequête directeRemarques
Serveur SQLWindows, Basique, OAuthOuiSource d'entreprise la plus courante
PostgreSQLDe baseOuiUtilisé par Odoo, de nombreuses applications open source
OracleWindows, de baseOuiNécessite un client Oracle sur la passerelle
MySQLDe baseOuiConnecteur communautaire
SAP HANADe base, SAMLOuiNécessite le client SAP HANA
Fichier (CSV/Excel)N/ANonLes fichiers doivent être sur un partage réseau
ODBCDe base, WindowsOuiConnecteur générique pour toute source ODBC
API WebAnonyme, basique, OAuthNonPour les points de terminaison REST/OData

Cryptage des informations d'identification

Les informations d'identification de la source de données sont cryptées à l'aide de la clé de récupération et stockées localement sur la machine passerelle. Ils ne sont jamais envoyés vers le cloud en clair. Lorsque vous ajoutez un nœud de cluster, les informations d'identification sont synchronisées à l'aide de la clé de récupération partagée.

Important : Si vous perdez la clé de récupération et que tous les nœuds de passerelle échouent, vous devez :

  1. Installez une nouvelle passerelle avec une nouvelle clé de récupération
  2. Reconfigurez toutes les sources de données et informations d'identification
  3. Remappez tous les ensembles de données du service Power BI vers la nouvelle passerelle

Stockez la clé de récupération dans Azure Key Vault ou dans le gestionnaire de mots de passe de votre organisation.

Regroupement de connexions

Pour les bases de données relationnelles (SQL Server, PostgreSQL, Oracle), activez le regroupement de connexions pour réutiliser les connexions de base de données lors des opérations d'actualisation :

Dans le fichier de configuration de la passerelle (Microsoft.PowerBI.EnterpriseGateway.exe.config) :

<setting name="PoolConnections" serializeAs="String">
    <value>True</value>
</setting>
<setting name="MinPoolSize" serializeAs="String">
    <value>2</value>
</setting>
<setting name="MaxPoolSize" serializeAs="String">
    <value>20</value>
</setting>

Le regroupement de connexions réduit la surcharge liée à l'établissement de nouvelles connexions à la base de données pour chaque requête, en particulier lors des charges de travail DirectQuery avec de nombreux utilisateurs simultanés.


Configuration d'actualisation planifiée

Configuration de l'actualisation programmée

Après avoir publié un jeu de données sur le service Power BI :

  1. Accédez aux paramètres de l'ensemble de données
  2. Sous « Connexion à la passerelle », sélectionnez votre passerelle et la source de données configurée.
  3. Sous « Actualisation programmée », activez le bouton
  4. Définissez la fréquence de rafraîchissement (quotidienne, hebdomadaire ou heures spécifiques)
  5. Configurez le fuseau horaire
  6. Configurez éventuellement les notifications d'échec

Limites de fréquence d'actualisation

LicenceActualisations maximales par jourIntervalle minimum
Power BI Pro83 heures
Power BI Premium (par capacité)4830 minutes
Power BI Premium par utilisateur4830 minutes

Actualiser les fenêtres et échelonner

Ne planifiez pas toutes les actualisations des ensembles de données en même temps. La passerelle dispose d'un processeur et d'une mémoire limités, et les actualisations simultanées se disputent les ressources.

Bonne pratique : Créez une planification d'actualisation qui échelonne les ensembles de données sur la fenêtre disponible :

TempsEnsemble de donnéesPriorité
01h00Finances - Résumé GLCritique
01h30Ventes - PipelineCritique
02h00RH - EffectifÉlevé
02h30Inventaire - Niveaux de stockÉlevé
3h00Fabrication - OEEMoyen
3h30Marketing – Métriques de campagneMoyen

Les ensembles de données critiques sont actualisés en premier, garantissant qu'ils sont terminés même si les actualisations ultérieures rencontrent des problèmes.

Actualisation incrémentielle et passerelle

L'actualisation incrémentielle réduit considérablement le volume de données traitées via la passerelle. Au lieu d'actualiser l'intégralité de l'ensemble de données, seules les lignes nouvelles et modifiées sont récupérées. Ceci est particulièrement important pour les grands ensembles de données où une actualisation complète prendrait des heures et consommerait des ressources de passerelle excessives.

Configurez l’actualisation incrémentielle dans Power BI Desktop (voir l’approche des paramètres RangeStart/RangeEnd), puis publiez sur le service. La passerelle gère automatiquement les requêtes paramétrées.


Configuration du pare-feu et du proxy

Connexions sortantes requises

La passerelle nécessite un accès HTTPS sortant (TCP 443) pour :

DestinationObjectif
*.servicebus.windows.netAzure Service Bus (relais de requêtes)
*.frontend.clouddatahub.netEnregistrement et mises à jour de la passerelle
*.core.windows.netStockage Blob Azure (transfert de données)
connexion.microsoftonline.comAuthentification Azure AD
*.msftncsi.comVérification de la connectivité réseau
télécharger.microsoft.comMises à jour de la passerelle

Si votre pare-feu nécessite une liste blanche IP explicite au lieu de domaines génériques, utilisez le fichier JSON Azure IP Ranges de Microsoft (mis à jour chaque semaine) pour rechercher les plages IP pour Azure Service Bus dans votre région.

Configuration du serveur proxy

Si la passerelle doit transiter par un proxy d'entreprise :

  1. Modifiez Microsoft.PowerBI.EnterpriseGateway.exe.config
  2. Ajoutez la configuration du proxy dans la section <system.net> :
<system.net>
  <defaultProxy useDefaultCredentials="true">
    <proxy proxyaddress="http://proxy.company.com:8080"
           bypassonlocal="true" />
  </defaultProxy>
</system.net>
  1. Redémarrez le service de passerelle

Si le proxy nécessite des informations d'identification spécifiques (pas d'authentification Windows directe), vous devrez peut-être utiliser un fichier PAC proxy ou configurer le proxy pour autoriser le compte de service de la passerelle sans authentification supplémentaire.

###Configuration TLS

La passerelle nécessite TLS 1.2. Si votre environnement a toujours TLS 1.0 ou 1.1 activé, la passerelle utilisera TLS 1.2 par défaut. Toutefois, si le serveur de source de données prend uniquement en charge TLS 1.0, la connexion échouera.

Vérifiez que TLS 1.2 est activé dans le registre Windows :

HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SecurityProviders\SCHANNEL\Protocols\TLS 1.2\Client
  Enabled = 1 (DWORD)
  DisabledByDefault = 0 (DWORD)

Surveillance et journalisation

Journaux de la passerelle

La passerelle écrit des journaux détaillés dans :

C:\Users\<ServiceAccount>\AppData\Local\Microsoft\On-premises data gateway\

Fichiers journaux de clés :

FichierContenu
GatewayInfo*.logOpérations générales de la passerelle, démarrage, arrêt
GatewayErrors*.logErreurs et exceptions
Application composite*.logOpérations du moteur Power Query (M)
Rapport*.logDétails d'exécution des requêtes, compteurs de performances

Activation de la journalisation supplémentaire

Pour le dépannage, activez la journalisation détaillée :

  1. Ouvrez l'application de configuration de la passerelle
  2. Accédez à Diagnostics
  3. Activez « Journalisation supplémentaire »
  4. Reproduire le problème
  5. Exportez les journaux à l'aide du bouton "Exporter les journaux" (crée un ZIP de tous les fichiers journaux)
  6. Désactivez la journalisation supplémentaire après le dépannage (cela génère de gros volumes de journaux)

Compteurs de performances

La passerelle expose les compteurs de performances Windows dans la catégorie « Passerelle de données sur site » :

CompteurDescriptifSeuil d'alerte
Connexions activesConnexions ouvertes actuelles aux sources de données> 50
Requêtes exécutées/sDébit des requêtesRéférence + 50 %
Durée moyenne des requêtesTemps d'exécution des requêtes> 30 secondes
Longueur de la file d'attenteRequêtes en attente d'exécution> 10
Utilisation de la mémoireConsommation de mémoire du processus de passerelle> 80% des disponibles
Utilisation du processeurConsommation du processeur du processus de passerelle> 70% soutenu

Configurez Windows Performance Monitor ou un outil de surveillance (Prometheus, Datadog, Azure Monitor) pour suivre ces compteurs et alerter sur les seuils.

Surveillance du portail d'administration Power BI

Dans le portail d’administration Power BI :

  1. Accédez au portail d'administration, puis à Gateway Management.
  2. Affichez toutes les passerelles, leur statut (en ligne/hors ligne) et leur version
  3. Voir les statistiques d'utilisation des sources de données
  4. Surveiller les taux de réussite/échec du rafraîchissement

Configurez les notifications par e-mail pour les événements hors ligne de la passerelle et les échecs d'actualisation.


Optimisation des performances

Dimensionnement du matériel

Les performances de la passerelle sont principalement liées par :

  1. CPU — pour l'analyse des requêtes, la compression des données et le chiffrement
  2. RAM — pour conserver les résultats de requêtes intermédiaires
  3. Réseau — pour transférer des données vers Azure Service Bus

Consignes de dimensionnement :

ScénarioProcesseurRAMRéseau
5 ensembles de données, actualisation quotidienne4 cœurs8 Go100 Mbit/s
20 ensembles de données, deux fois par jour8 cœurs16 Go1 Gbit/s
Plus de 50 ensembles de données, DirectQuery16 cœurs32 Go1 Gbit/s
DirectQuery lourd, nombreux utilisateurs simultanés16+ cœurs64 Go10 Gbit/s

Paramètres du moteur d'application composite

La passerelle utilise le moteur Power Query (Mashup) pour la transformation des données. Configurez dans l'application passerelle :

Nombre maximal de requêtes simultanées : La valeur par défaut est le nombre de cœurs de processeur multiplié par 2. Augmentation pour les charges de travail liées aux E/S (en attente de sources de données lentes). Diminution des charges de travail liées au processeur (transformations lourdes).

Limite de mémoire par requête : La valeur par défaut est aucune limite. Définissez une limite (par exemple, 2 Go) pour empêcher une seule requête incontrôlable de consommer toute la RAM disponible.

Optimisation du réseau

Localisez la passerelle à proximité de la source de données. La latence du réseau entre la passerelle et la source de données est multipliée par le nombre de requêtes par actualisation. Une passerelle dans le même centre de données que la base de données minimise la latence.

Ne localisez pas la passerelle en fonction de sa proximité avec Azure. La connexion Azure Service Bus est une connexion TCP persistante unique. La latence vers Azure affecte la configuration initiale de la connexion, mais pas le débit des requêtes.

Utilisez une connexion filaire. N'exécutez jamais une passerelle de production sur Wi-Fi. La connectivité intermittente provoque des échecs d’actualisation.

Optimisation des requêtes à la source

Le moyen le plus rapide d’améliorer les performances de la passerelle consiste à optimiser les requêtes qu’elle exécute :

  • Utilisez des requêtes SQL personnalisées au lieu d'importer des tables entières (réduisez le volume de données)
  • Créer des index de base de données sur les colonnes utilisées dans les clauses WHERE et JOIN
  • Utiliser des vues avec des pré-jointures et des pré-agrégations pour des modèles de données complexes
  • Activer le repliement des requêtes dans Power Query pour pousser les transformations vers la base de données
  • Implémenter une actualisation incrémentielle pour réduire le volume de données par cycle d'actualisation

Dépannage des erreurs courantes

"La passerelle n'est pas accessible"

Cause : Le service de passerelle est arrêté, la machine est en panne ou la connectivité réseau à Azure est bloquée.

Résolution :

  1. Vérifiez si le service Windows de la passerelle est en cours d'exécution (services.msc)
  2. Vérifiez que le HTTPS sortant vers *.servicebus.windows.net est autorisé
  3. Vérifiez les paramètres du proxy si vous êtes derrière un proxy d'entreprise
  4. Vérifiez que la machine passerelle dispose d'une connectivité Internet
  5. Vérifiez si la version de la passerelle est obsolète (les mises à jour automatiques peuvent échouer silencieusement)

"Impossible de se connecter à la source de données"

Cause : Informations d'identification incorrectes, connectivité réseau à la source de données ou problèmes de pilote.

Résolution :

  1. Testez la connexion dans l'application de configuration de la passerelle (Diagnostics, puis Test de connexion)
  2. Vérifiez que le serveur de source de données est accessible depuis la machine passerelle (ping, telnet vers le port)
  3. Vérifiez que les informations d'identification sont correctes et que le compte n'est pas verrouillé/expiré.
  4. Pour Oracle et SAP, vérifiez que les bibliothèques client requises sont installées sur la machine passerelle.
  5. Vérifiez que le pare-feu de la source de données autorise les connexions à partir de l'adresse IP de la passerelle.

"L'actualisation de la passerelle de données sur site prend trop de temps"

Cause : Ensemble de données volumineux, requêtes lentes, ressources de passerelle insuffisantes ou goulot d'étranglement du réseau.

Résolution :

  1. Activez l'actualisation incrémentielle pour réduire le volume de données
  2. Optimiser les requêtes SQL (ajouter des index, réduire les colonnes, filtrer les lignes)
  3. Vérifiez l'utilisation du processeur et de la RAM de la machine passerelle pendant l'actualisation.
  4. Échelonner les calendriers d'actualisation pour réduire la charge simultanée
  5. Envisagez d'ajouter un deuxième nœud de passerelle pour la répartition de la charge

"Les informations d'identification de la source de données ne sont pas valides"

Cause : Mot de passe modifié, compte verrouillé ou délégation Kerberos mal configurée.

Résolution :

  1. Ressaisissez les informations d'identification dans le service Power BI (paramètres du jeu de données, puis connexion à la passerelle)
  2. Si vous utilisez l'authentification Windows avec Kerberos, vérifiez :
  • Le compte de service de passerelle dispose de privilèges de délégation dans Active Directory
  • Les SPN sont correctement configurés pour la source de données
  • Le KDC (contrôleur de domaine) est accessible depuis la passerelle

"La version de la passerelle est obsolète"

Cause : La mise à jour automatique a échoué ou a été désactivée.

Résolution :

  1. Téléchargez le dernier programme d'installation de la passerelle de Microsoft
  2. Exécutez le programme d'installation sur la machine passerelle existante (il est mis à niveau sur place)
  3. Pour les clusters, mettez à niveau un nœud à la fois avec un intervalle entre les mises à niveau
  4. Vérifiez la version de la passerelle dans le portail d'administration Power BI après la mise à niveau

Bonnes pratiques de sécurité

Principe du moindre privilège

  • Le compte de service de passerelle doit avoir un accès en lecture seule aux sources de données
  • N'utilisez pas de comptes d'administrateur de domaine ou d'administrateur de base de données
  • Créez des comptes de service dédiés par type de source de données si votre politique de sécurité l'exige
  • Faites pivoter les mots de passe des comptes de service selon un calendrier régulier et mettez à jour la configuration de la source de données de la passerelle

Gestion des clés de récupération

La clé de récupération chiffre toutes les informations d'identification stockées localement. Traitez-la avec le même soin qu'une clé principale de base de données :

  • Stocker dans Azure Key Vault ou dans un gestionnaire de mots de passe d'entreprise
  • Document qui a accès à la clé de récupération
  • Incluez la rotation des clés de récupération dans votre politique de gestion des clés
  • Testez la récupération en restaurant une passerelle à partir d'une sauvegarde avec la clé de récupération

Segmentation du réseau

Placez la passerelle dans un segment de réseau pouvant atteindre :

  • Serveurs de sources de données (SQL Server, PostgreSQL, Oracle, etc.)
  • Azure Service Bus (HTTPS sortant)
  • Azure AD (HTTPS sortant)

Bloquez tout autre trafic entrant et sortant. La passerelle n'a pas besoin de connexions entrantes provenant d'aucune source.

Piste d'audit

Activez l'audit de sécurité Windows sur la machine passerelle pour suivre :

  • Événements de connexion au compte de service
  • Modifications de la configuration de la passerelle
  • Modèles d'accès aux sources de données

Transférez ces événements à votre SIEM (Splunk, Sentinel, Datadog) pour une surveillance centralisée.


Scénarios de migration et de mise à niveau

Migration vers une nouvelle machine passerelle

  1. Installez la passerelle sur la nouvelle machine
  2. Lors de l'inscription, sélectionnez « Migrer, restaurer ou reprendre une passerelle existante »
  3. Entrez la clé de récupération de la passerelle d'origine
  4. La nouvelle machine hérite de toutes les configurations et informations d'identification de la source de données
  5. Vérifiez que toutes les sources de données s'affichent comme connectées dans le portail d'administration Power BI.
  6. Mettez à jour toutes les règles de pare-feu basées sur IP pour inclure l'adresse IP de la nouvelle machine.
  7. Mettez hors service l'ancienne machine de passerelle

Mise à niveau des versions de passerelle

Microsoft publie des mises à jour de passerelle mensuellement. Bonnes pratiques :

  • Abonnez-vous aux notes de version de la passerelle pour être informé à l'avance des modifications
  • Testez d'abord les nouvelles versions dans un cluster de passerelle hors production
  • Pour les clusters de production, mettez à niveau un nœud à la fois avec un intervalle de 24 heures
  • Vérifier les taux de réussite de l'actualisation après chaque mise à niveau de nœud
  • Conserver au moins un nœud sur la version précédente jusqu'à ce que la nouvelle version soit validée

La passerelle prend en charge la compatibilité des versions N-1 dans les clusters : les nœuds n'ont pas besoin d'exécuter exactement la même version.


##FAQ

Puis-je installer la passerelle sur une machine virtuelle ?

Oui. La passerelle s'exécute sur des machines physiques et virtuelles, notamment des machines virtuelles Azure, AWS EC2 et Hyper-V ou VMware sur site. Pour les machines virtuelles Azure, envisagez d’utiliser la passerelle de données VNet (en préversion pour les capacités Premium) qui élimine entièrement le besoin d’une passerelle autogérée. Pour les machines virtuelles sur site, assurez-vous que la machine virtuelle dispose de ressources CPU et RAM dédiées (non partagées), et que l'hyperviseur ne surexploite pas de manière agressive les ressources.

Combien de sources de données une seule passerelle peut-elle prendre en charge ?

Il n'y a pas de limite stricte quant au nombre de sources de données par passerelle. En pratique, les passerelles prennent généralement en charge 50 à 100 sources de données sans problème. Le facteur limitant est la charge de requêtes simultanées pendant les fenêtres d'actualisation, et non le nombre de sources de données configurées. Si les temps d'actualisation se dégradent, ajoutez des nœuds de cluster plutôt que de créer des installations de passerelle supplémentaires.

La passerelle prend-elle en charge Linux ?

Non. La passerelle de données sur site nécessite Windows (Server 2016 ou version ultérieure). Si vos sources de données s'exécutent sous Linux, installez la passerelle sur une machine Windows disposant d'un accès réseau aux serveurs de sources de données Linux. La passerelle se connecte à la source de données via le réseau : elle n'a pas besoin de s'exécuter sur le même système d'exploitation que la source de données.

Que se passe-t-il si les deux nœuds de passerelle d'un cluster se déconnectent simultanément ?

Toutes les actualisations planifiées échouent et toutes les connexions DirectQuery renvoient des erreurs. Le service Power BI détecte l'état hors ligne et envoie des notifications aux administrateurs de passerelle (si configurés). Les rapports utilisant des données mises en cache (mode Importation) continuent d'afficher les dernières données actualisées avec succès. Lorsqu'au moins un nœud revient en ligne, les demandes d'actualisation en attente sont traitées automatiquement. Pour éviter ce scénario, échelonnez les fenêtres de maintenance et placez les nœuds de cluster sur une infrastructure physique distincte.

La passerelle peut-elle gérer les données en streaming en temps réel ?

La passerelle est conçue pour les modèles requête-réponse, et non pour le streaming. Pour les données en temps réel, envisagez les ensembles de données de streaming Power BI (qui contournent entièrement la passerelle), Azure Stream Analytics ou Azure Event Hubs avec les tableaux de bord en temps réel Power BI. La passerelle prend en charge DirectQuery pour un accès en temps quasi réel aux bases de données sur site, mais chaque interaction de rapport déclenche une nouvelle requête plutôt que de recevoir un flux de données continu.

E

Rédigé par

ECOSIRE Research and Development Team

Création de produits numériques de niveau entreprise chez ECOSIRE. Partage d'analyses sur les intégrations Odoo, l'automatisation e-commerce et les solutions d'entreprise propulsées par l'IA.

Discutez sur WhatsApp