On-Premises Data Gateway: Setup and Configuration Guide

Install and configure the Power BI on-premises data gateway. Personal vs enterprise mode, clustering, firewall settings, monitoring, and troubleshooting.

E
ECOSIRE Research and Development Team
|17 मार्च 202620 मिनट पढ़ें4.5k शब्द|

ऑन-प्रिमाइसेस डेटा गेटवे: सेटअप और कॉन्फ़िगरेशन गाइड

ऑन-प्रिमाइसेस डेटा गेटवे पावर बीआई सेवा (क्लाउड) और आपके ऑन-प्रिमाइसेस डेटा स्रोतों के बीच सेतु है। इसके बिना, कोई भी डेटा जो आपके कॉर्पोरेट फ़ायरवॉल के पीछे रहता है --- SQL सर्वर डेटाबेस, PostgreSQL इंस्टेंसेस, Oracle सिस्टम, फ़ाइल शेयर, ODBC स्रोत --- Power BI सेवा में ताज़ा नहीं किया जा सकता है। क्लाउड से ऑन-प्रिमाइसेस डेटाबेस तक लाइव/डायरेक्टक्वेरी कनेक्शन के लिए भी गेटवे आवश्यक है।

अपनी महत्वपूर्ण भूमिका के बावजूद, गेटवे को अक्सर एक बाद के विचार के रूप में माना जाता है। संगठन इसे डेवलपर के लैपटॉप पर इंस्टॉल करते हैं, उच्च-उपलब्धता कॉन्फ़िगरेशन को छोड़ देते हैं, और आश्चर्य करते हैं कि प्रत्येक सप्ताहांत में शेड्यूल किए गए रिफ्रेश विफल क्यों होते हैं। यह मार्गदर्शिका संपूर्ण जीवनचक्र को कवर करती है: आर्किटेक्चर निर्णय, इंस्टॉलेशन, क्लस्टरिंग, डेटा स्रोत कॉन्फ़िगरेशन, मॉनिटरिंग, प्रदर्शन ट्यूनिंग और सबसे आम त्रुटियों का निवारण।


मुख्य बातें

  • ऑन-प्रिमाइसेस डेटा गेटवे दो मोड में आता है: व्यक्तिगत (एकल उपयोगकर्ता, कोई साझाकरण नहीं) और मानक/उद्यम (पूरे संगठन में साझा, क्लस्टरिंग का समर्थन करता है)
  • एंटरप्राइज गेटवे को हमेशा विश्वसनीय पावर, नेटवर्क और अपटाइम के साथ एक समर्पित सर्वर (डेवलपर वर्कस्टेशन नहीं) पर स्थापित किया जाना चाहिए
  • दो या दो से अधिक नोड्स के साथ गेटवे क्लस्टरिंग उच्च उपलब्धता प्रदान करती है --- यदि एक नोड नीचे चला जाता है, तो दूसरा ताज़ा अनुरोधों को संभालना जारी रखता है
  • सभी संचार एज़्योर सर्विस बस के गेटवे से आउटबाउंड हैं --- किसी इनबाउंड फ़ायरवॉल पोर्ट को खोलने की आवश्यकता नहीं है
  • डेटा स्रोत क्रेडेंशियल को पुनर्प्राप्ति कुंजी का उपयोग करके गेटवे मशीन पर स्थानीय रूप से एन्क्रिप्ट किया जाता है --- इस कुंजी को खोने का मतलब सभी डेटा स्रोतों को पुन: कॉन्फ़िगर करना है
  • गेटवे लॉग सबसे उपयोगी समस्या निवारण संसाधन हैं, जो उपयोगकर्ता के स्थानीय ऐप डेटा के अंतर्गत गेटवेकंपोनेंट्स फ़ोल्डर में स्थित हैं।
  • रिलेशनल स्रोतों के लिए कनेक्शन पूलिंग को सक्षम करके, उचित टाइमआउट मान सेट करके और गेटवे मशीन में पर्याप्त रैम और सीपीयू सुनिश्चित करके प्रदर्शन में सुधार किया जा सकता है।

गेटवे आर्किटेक्चर

गेटवे कैसे काम करता है

गेटवे टीसीपी पोर्ट 443 (एचटीटीपीएस) का उपयोग करके एज़्योर सर्विस बस के लिए एक आउटबाउंड कनेक्शन स्थापित करता है। आपके फ़ायरवॉल में किसी भी इनबाउंड पोर्ट को खोलने की आवश्यकता नहीं है। संचार प्रवाह है:

  1. एक उपयोगकर्ता सेवा में एक पावर बीआई रिपोर्ट, या एक निर्धारित रिफ्रेश ट्रिगर खोलता है
  2. Power BI सेवा Azure सर्विस बस को एक क्वेरी अनुरोध भेजती है
  3. गेटवे (पोलिंग एज़्योर सर्विस बस) अनुरोध उठाता है
  4. गेटवे ऑन-प्रिमाइसेस डेटा स्रोत के विरुद्ध क्वेरी निष्पादित करता है
  5. गेटवे परिणामों को एन्क्रिप्ट करता है और उन्हें Azure सर्विस बस के माध्यम से वापस भेजता है
  6. पावर बीआई सेवा परिणाम प्राप्त करती है और रिपोर्ट प्रस्तुत करती है या रिफ्रेश पूरा करती है

इस आर्किटेक्चर का मतलब है कि गेटवे कभी भी इंटरनेट से इनबाउंड कनेक्शन प्राप्त नहीं करता है। यह सभी संचार आउटबाउंड आरंभ करता है, जो फ़ायरवॉल कॉन्फ़िगरेशन को काफी सरल बनाता है।

व्यक्तिगत गेटवे बनाम मानक (उद्यम) गेटवे

फ़ीचरव्यक्तिगत गेटवेमानक गेटवे
उपयोगकर्ताकेवल एकल उपयोगकर्तापूरे संगठन में साझा किया गया
डेटा स्रोतउपयोगकर्ता के अपने स्रोतकेंद्रीय रूप से प्रबंधित स्रोत
क्लस्टरिंगसमर्थित नहीं10 नोड्स तक
प्रशासनउपयोगकर्ता स्व-सेवागेटवे व्यवस्थापक भूमिका
के रूप में चलता है विंडोज़ एप्लीकेशनविंडोज़ सेवा
डायरेक्टक्वेरीसमर्थित नहींसमर्थित
डेटा प्रवाहसमर्थित नहींसमर्थित
लाइव कनेक्शनसमर्थित नहींसमर्थित
वर्चुअल नेटवर्कसमर्थित नहींसमर्थित (प्रीमियम)
सिफारिशकेवल व्यक्तिगत प्रोटोटाइपउत्पादन उपयोग

किसी भी उत्पादन परिनियोजन के लिए, मानक (उद्यम) गेटवे का उपयोग करें। व्यक्तिगत गेटवे केवल अपने स्वयं के डेटा स्रोतों के साथ प्रोटोटाइप करने वाले व्यक्तिगत उपयोगकर्ताओं के लिए उपयुक्त है।


स्थापना

पूर्वावश्यकताएँ

गेटवे स्थापित करने से पहले, सुनिश्चित करें कि लक्ष्य मशीन इन आवश्यकताओं को पूरा करती है:

आवश्यकतान्यूनतमअनुशंसित
ओएसविंडोज़ सर्वर 2016विंडोज सर्वर 2022
सीपीयू4 कोर8 कोर
रैम8 जीबी16 जीबी
डिस्क50 जीबी मुफ़्त100 जीबी एसएसडी
.NET फ्रेमवर्क4.84.8 (नवीनतम संचयी अद्यतन)
नेटवर्क1 जीबीपीएसडेटा स्रोतों के लिए कम विलंबता के साथ 1 जीबीपीएस
टीएलएस1.2 आवश्यक1.2 (1.0/1.1 अक्षम)

महत्वपूर्ण: अपने डेटाबेस के समान सर्वर पर गेटवे स्थापित न करें। रिफ्रेश ऑपरेशन के दौरान गेटवे सीपीयू और रैम के लिए प्रतिस्पर्धा करता है, और इसे डेटाबेस के साथ सह-स्थानित करने से गेटवे और डेटाबेस दोनों का प्रदर्शन ख़राब हो सकता है।

स्थापना चरण

  1. आधिकारिक माइक्रोसॉफ्ट डाउनलोड पेज से नवीनतम गेटवे इंस्टॉलर डाउनलोड करें
  2. इंस्टॉलर चलाएँ और एंटरप्राइज़ मोड के लिए "ऑन-प्रिमाइसेस डेटा गेटवे (अनुशंसित)" चुनें
  3. लाइसेंस शर्तों को स्वीकार करें और इंस्टॉलेशन निर्देशिका चुनें
  4. अपने संगठनात्मक खाते से साइन इन करें (खाता आपकी Power BI सेवा के समान Azure AD टैनेंट में होना चाहिए)
  5. "इस कंप्यूटर पर एक नया गेटवे पंजीकृत करें" चुनें
  6. गेटवे को नाम दें (एक वर्णनात्मक नाम का उपयोग करें: उदाहरण के लिए, प्रोडक्शन गेटवे, न्यूयॉर्क, नोड 1 के लिए "PROD-GW-NY-01")
  7. पुनर्प्राप्ति कुंजी सेट करें --- इसे पासवर्ड मैनेजर या कुंजी वॉल्ट में सुरक्षित रूप से संग्रहीत करें। क्लस्टर नोड्स जोड़ने या गेटवे पुनर्प्राप्त करने के लिए आपको इसकी आवश्यकता होगी
  8. स्थापना पूर्ण करें

गेटवे सेवा स्वचालित रूप से प्रारंभ होती है और डिफ़ॉल्ट रूप से "NT SERVICE\PBIEgwService" खाते के अंतर्गत चलती है।

सेवा खाता बदलना

डिफ़ॉल्ट रूप से, गेटवे स्थानीय सेवा खाते के रूप में चलता है। नेटवर्क संसाधनों (फ़ाइल शेयर, विंडोज़ प्रमाणीकरण के साथ डोमेन से जुड़े डेटाबेस) तक पहुँचने के लिए, आपको सेवा खाते को डोमेन खाते में बदलने की आवश्यकता हो सकती है:

  1. विंडोज़ सेवाएँ खोलें (services.msc)
  2. "ऑन-प्रिमाइसेस डेटा गेटवे सेवा" ढूंढें
  3. राइट-क्लिक करें, गुण चुनें, फिर लॉग ऑन टैब चुनें
  4. "यह खाता" चुनें और डोमेन क्रेडेंशियल दर्ज करें
  5. सेवा पुनः प्रारंभ करें

सेवा खाते को निम्नलिखित अनुदान दें:

  • "एक सेवा के रूप में लॉग ऑन करें" स्थानीय नीति
  • क्वेरी के लिए आवश्यक डेटा स्रोतों तक पहुंच पढ़ें
  • डेटा स्रोत सर्वर तक नेटवर्क पहुंच

उच्च उपलब्धता के लिए गेटवे क्लस्टरिंग

एक एकल प्रवेश द्वार विफलता का एक एकल बिंदु है। यदि मशीन बंद हो जाती है, तो सभी शेड्यूल किए गए रिफ्रेश और DirectQuery कनेक्शन विफल हो जाते हैं। गेटवे क्लस्टरिंग कई नोड्स में अनुरोध वितरित करके इसे हल करता है।

एक क्लस्टर बनाना

  1. समान इंस्टॉलेशन चरणों का पालन करते हुए दूसरी मशीन पर गेटवे स्थापित करें
  2. "नया गेटवे पंजीकृत करें" चरण के दौरान, "मौजूदा गेटवे क्लस्टर में जोड़ें" चुनें
  3. ड्रॉपडाउन से मौजूदा गेटवे नाम चुनें
  4. पुनर्प्राप्ति कुंजी दर्ज करें (पहले नोड के लिए उपयोग की जाने वाली वही कुंजी)
  5. स्थापना पूर्ण करें

क्लस्टर में अब दो नोड हैं। अनुरोध स्वस्थ नोड्स में वितरित किए जाते हैं।

लोड संतुलन विन्यास

डिफ़ॉल्ट रूप से, गेटवे क्लस्टर अनुरोधों को यादृच्छिक रूप से वितरित करते हैं। आप लोड संतुलन कॉन्फ़िगर कर सकते हैं:

राउंड-रॉबिन: अनुरोधों को सभी नोड्स में समान रूप से वितरित करता है। समान हार्डवेयर वाले क्लस्टर के लिए सर्वोत्तम।

भारित रूटिंग: अधिक अनुरोधों को अधिक शक्तिशाली नोड्स तक निर्देशित करता है। गेटवे सेटिंग्स के अंतर्गत Power BI एडमिन पोर्टल में कॉन्फ़िगर करें।

केवल विफलता: सभी अनुरोध प्राथमिक नोड पर जाते हैं। द्वितीयक नोड केवल तभी सक्रिय होते हैं जब प्राथमिक अनुपलब्ध हो। स्टैंडबाय सर्वर के साथ लागत-सचेत तैनाती के लिए सर्वोत्तम।

अनुशंसित क्लस्टर टोपोलॉजी

उत्पादन परिनियोजन के लिए, ECOSIRE अनुशंसा करता है न्यूनतम दो गेटवे नोड:

घटकनोड 1नोड 2
भूमिकाप्राथमिकमाध्यमिक
स्थानप्राथमिक डेटा सेंटरडीआर साइट या वही डीसी
हार्डवेयर8 कोर, 16 जीबी रैम8 कोर, 16 जीबी रैम
नेटवर्क1 जीबीपीएस, कम विलंबता1 जीबीपीएस, कम विलंबता
रखरखाव विंडोरविवार 2-4 पूर्वाह्नशनिवार 2-4 पूर्वाह्न

रखरखाव खिड़कियाँ डगमगाती हैं ताकि दोनों नोड एक साथ कभी भी बंद न हों। विंडोज़ अपडेट, .NET पैच और गेटवे संस्करण अपग्रेड को एक समय में एक नोड पर लागू किया जाना चाहिए।


डेटा स्रोत कॉन्फ़िगरेशन

डेटा स्रोत जोड़ना

गेटवे स्थापित करने के बाद, Power BI सेवा में डेटा स्रोतों को कॉन्फ़िगर करें:

  1. सेटिंग्स (गियर आइकन) पर जाएं, फिर गेटवे प्रबंधित करें
  2. अपना गेटवे क्लस्टर चुनें
  3. "डेटा स्रोत जोड़ें" पर क्लिक करें
  4. डेटा स्रोत प्रकार चुनें (SQL सर्वर, PostgreSQL, Oracle, ODBC, आदि)
  5. कनेक्शन विवरण दर्ज करें (सर्वर नाम, डेटाबेस नाम)
  6. प्रमाणीकरण विधि का चयन करें (Windows, Basic, OAuth2)
  7. क्रेडेंशियल दर्ज करें
  8. कनेक्शन का परीक्षण करें

समर्थित डेटा स्रोत प्रकार

मानक गेटवे 80 से अधिक डेटा स्रोत प्रकारों का समर्थन करता है। पावर बीआई के लिए सबसे आम:

डेटा स्रोतप्रामाणिक तरीकेडायरेक्टक्वेरीनोट्स
एसक्यूएल सर्वरविंडोज़, बेसिक, OAuthहाँसबसे आम उद्यम स्रोत
पोस्टग्रेएसक्यूएलबुनियादीहाँOdoo द्वारा उपयोग किए जाने वाले कई ओपन-सोर्स ऐप्स
ओरेकलविंडोज़, बेसिकहाँगेटवे पर Oracle क्लाइंट की आवश्यकता है
MySQLबुनियादीहाँसामुदायिक संबंधक
सैप हानाबेसिक, एसएएमएलहाँSAP हाना क्लाइंट की आवश्यकता है
फ़ाइल (सीएसवी/एक्सेल)एन/एनहींफ़ाइलें नेटवर्क शेयर पर होनी चाहिए
ओडीबीसीबेसिक, विंडोज़हाँकिसी भी ODBC स्रोत के लिए सामान्य कनेक्टर
वेब एपीआईअनाम, मूल, OAuthनहींREST/OData समापनबिंदु के लिए

क्रेडेंशियल एन्क्रिप्शन

डेटा स्रोत क्रेडेंशियल पुनर्प्राप्ति कुंजी का उपयोग करके एन्क्रिप्ट किए जाते हैं और गेटवे मशीन पर स्थानीय रूप से संग्रहीत किए जाते हैं। उन्हें कभी भी सादे टेक्स्ट में क्लाउड पर नहीं भेजा जाता है। जब आप क्लस्टर नोड जोड़ते हैं, तो साझा पुनर्प्राप्ति कुंजी का उपयोग करके क्रेडेंशियल सिंक किए जाते हैं।

महत्वपूर्ण: यदि आप पुनर्प्राप्ति कुंजी खो देते हैं और सभी गेटवे नोड विफल हो जाते हैं, तो आपको यह करना होगा:

  1. नई पुनर्प्राप्ति कुंजी के साथ एक नया गेटवे स्थापित करें
  2. सभी डेटा स्रोतों और क्रेडेंशियल्स को पुन: कॉन्फ़िगर करें
  3. Power BI सेवा में सभी डेटासेट को नए गेटवे पर पुनः मैप करें

पुनर्प्राप्ति कुंजी को Azure कुंजी वॉल्ट या अपने संगठन के पासवर्ड मैनेजर में संग्रहीत करें।

कनेक्शन पूलिंग

रिलेशनल डेटाबेस (एसक्यूएल सर्वर, पोस्टग्रेएसक्यूएल, ओरेकल) के लिए, रीफ्रेश ऑपरेशंस में डेटाबेस कनेक्शन का पुन: उपयोग करने के लिए कनेक्शन पूलिंग सक्षम करें:

गेटवे कॉन्फ़िगरेशन फ़ाइल (Microsoft.PowerBI.EnterpriseGateway.exe.config) में:

<setting name="PoolConnections" serializeAs="String">
    <value>True</value>
</setting>
<setting name="MinPoolSize" serializeAs="String">
    <value>2</value>
</setting>
<setting name="MaxPoolSize" serializeAs="String">
    <value>20</value>
</setting>

कनेक्शन पूलिंग प्रत्येक क्वेरी के लिए नए डेटाबेस कनेक्शन स्थापित करने के ओवरहेड को कम कर देता है, विशेष रूप से कई समवर्ती उपयोगकर्ताओं के साथ DirectQuery वर्कलोड के दौरान।


शेड्यूल किया गया ताज़ा कॉन्फ़िगरेशन

शेड्यूल्ड रिफ्रेश सेट करना

Power BI सेवा पर डेटासेट प्रकाशित करने के बाद:

  1. डेटासेट सेटिंग्स पर जाएं
  2. "गेटवे कनेक्शन" के अंतर्गत, अपना गेटवे और कॉन्फ़िगर किया गया डेटा स्रोत चुनें
  3. "शेड्यूल रिफ्रेश" के अंतर्गत टॉगल सक्षम करें
  4. ताज़ा आवृत्ति सेट करें (दैनिक, साप्ताहिक, या विशिष्ट समय)
  5. समय क्षेत्र कॉन्फ़िगर करें
  6. वैकल्पिक रूप से विफलता सूचनाएं सेट करें

आवृत्ति सीमाएँ ताज़ा करें

लाइसेंसप्रति दिन अधिकतम ताज़ान्यूनतम अंतराल
पावर बीआई प्रो83 घंटे
पावर बीआई प्रीमियम (प्रति क्षमता)4830 मिनट
प्रति उपयोगकर्ता पावर बीआई प्रीमियम4830 मिनट

विंडोज़ और चौंका देने वाला ताज़ा करें

सभी डेटासेट रिफ्रेश को एक ही समय पर शेड्यूल न करें। गेटवे में सीमित सीपीयू और मेमोरी है, और समवर्ती रिफ्रेश संसाधनों के लिए प्रतिस्पर्धा करते हैं।

सर्वोत्तम अभ्यास: एक ताज़ा शेड्यूल बनाएं जो उपलब्ध विंडो में डेटासेट को क्रमबद्ध करता है:

समयडेटासेटप्राथमिकता
1:00 पूर्वाह्नवित्त - जीएल सारांशगंभीर
1:30 पूर्वाह्नबिक्री - पाइपलाइनगंभीर
2:00 पूर्वाह्नएचआर - हेडकाउंटउच्च
2:30 पूर्वाह्नइन्वेंटरी - स्टॉक स्तरउच्च
प्रातः 3:00 बजेविनिर्माण - OEEमध्यम
3:30 पूर्वाह्नमार्केटिंग - अभियान मेट्रिक्समध्यम

महत्वपूर्ण डेटासेट पहले रीफ्रेश होते हैं, यह सुनिश्चित करते हुए कि वे पूर्ण हो जाएं, भले ही बाद में रीफ्रेश में समस्याएं आती हों।

इंक्रीमेंटल रिफ्रेश और गेटवे

वृद्धिशील रिफ्रेश गेटवे के माध्यम से संसाधित डेटा की मात्रा को काफी कम कर देता है। संपूर्ण डेटासेट को ताज़ा करने के बजाय, केवल नई और परिवर्तित पंक्तियाँ ही लाई जाती हैं। यह बड़े डेटासेट के लिए विशेष रूप से महत्वपूर्ण है जहां पूर्ण रीफ्रेश में घंटों लगेंगे और अत्यधिक गेटवे संसाधनों का उपभोग होगा।

Power BI डेस्कटॉप में वृद्धिशील रिफ्रेश कॉन्फ़िगर करें (रेंजस्टार्ट/रेंजएंड पैरामीटर दृष्टिकोण देखें), फिर सेवा पर प्रकाशित करें। गेटवे पैरामीटरयुक्त प्रश्नों को स्वचालित रूप से संभालता है।


फ़ायरवॉल और प्रॉक्सी कॉन्फ़िगरेशन

आवश्यक आउटबाउंड कनेक्शन

गेटवे को आउटबाउंड HTTPS (TCP 443) एक्सेस की आवश्यकता है:

गंतव्यउद्देश्य
*.servicebus.windows.netएज़्योर सर्विस बस (क्वेरी रिले)
*.frontend.clouddatahub.netगेटवे पंजीकरण और अद्यतन
*.core.windows.netएज़्योर ब्लॉब स्टोरेज (डेटा ट्रांसफर)
लॉगिन.माइक्रोसॉफ्टऑनलाइन.कॉमAzure AD प्रमाणीकरण
*.msftncsi.comनेटवर्क कनेक्टिविटी जांच
डाउनलोड.माइक्रोसॉफ्ट.कॉमगेटवे अपडेट

यदि आपके फ़ायरवॉल को वाइल्डकार्ड डोमेन के बजाय स्पष्ट आईपी अनुमति सूची की आवश्यकता है, तो अपने क्षेत्र में Azure सर्विस बस के लिए IP रेंज खोजने के लिए Microsoft से Azure IP रेंज JSON फ़ाइल (साप्ताहिक अद्यतन) का उपयोग करें।

प्रॉक्सी सर्वर कॉन्फ़िगरेशन

यदि गेटवे को कॉर्पोरेट प्रॉक्सी के माध्यम से रूट करना होगा:

  1. संपादित करें Microsoft.PowerBI.EnterpriseGateway.exe.config
  2. <system.net> अनुभाग में प्रॉक्सी कॉन्फ़िगरेशन जोड़ें:
<system.net>
  <defaultProxy useDefaultCredentials="true">
    <proxy proxyaddress="http://proxy.company.com:8080"
           bypassonlocal="true" />
  </defaultProxy>
</system.net>
  1. गेटवे सेवा पुनः प्रारंभ करें

यदि प्रॉक्सी को विशिष्ट क्रेडेंशियल्स (पास-थ्रू विंडोज प्रमाणीकरण नहीं) की आवश्यकता होती है, तो आपको अतिरिक्त प्रमाणीकरण के बिना गेटवे के सेवा खाते को अनुमति देने के लिए प्रॉक्सी पीएसी फ़ाइल का उपयोग करने या प्रॉक्सी को कॉन्फ़िगर करने की आवश्यकता हो सकती है।

टीएलएस कॉन्फ़िगरेशन

गेटवे के लिए टीएलएस 1.2 की आवश्यकता है। यदि आपके परिवेश में अभी भी टीएलएस 1.0 या 1.1 सक्षम है, तो गेटवे डिफ़ॉल्ट रूप से टीएलएस 1.2 का उपयोग करेगा। हालाँकि, यदि डेटा स्रोत सर्वर केवल टीएलएस 1.0 का समर्थन करता है, तो कनेक्शन विफल हो जाएगा।

सत्यापित करें कि TLS 1.2 Windows रजिस्ट्री में सक्षम है:

HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SecurityProviders\SCHANNEL\Protocols\TLS 1.2\Client
  Enabled = 1 (DWORD)
  DisabledByDefault = 0 (DWORD)

निगरानी और लॉगिंग

गेटवे लॉग

गेटवे विस्तृत लॉग लिखता है:

C:\Users\<ServiceAccount>\AppData\Local\Microsoft\On-premises data gateway\

कुंजी लॉग फ़ाइलें:

फ़ाइलसामग्री
गेटवेइन्फो*.लॉगसामान्य गेटवे संचालन, स्टार्टअप, शटडाउन
गेटवे एरर*.लॉगत्रुटियाँ और अपवाद
मैशअप*.लॉगपावर क्वेरी (एम) इंजन संचालन
रिपोर्ट*.लॉगक्वेरी निष्पादन विवरण, प्रदर्शन काउंटर

अतिरिक्त लॉगिंग सक्षम करना

समस्या निवारण के लिए, वर्बोज़ लॉगिंग सक्षम करें:

  1. गेटवे कॉन्फ़िगरेशन एप्लिकेशन खोलें
  2. डायग्नोस्टिक्स पर जाएं
  3. "अतिरिक्त लॉगिंग" सक्षम करें
  4. मुद्दे को पुन: प्रस्तुत करें
  5. "निर्यात लॉग" बटन का उपयोग करके लॉग निर्यात करें (सभी लॉग फ़ाइलों का एक ज़िप बनाता है)
  6. समस्या निवारण के बाद अतिरिक्त लॉगिंग अक्षम करें (यह बड़ी लॉग वॉल्यूम उत्पन्न करता है)

प्रदर्शन काउंटर

गेटवे "ऑन-प्रिमाइसेस डेटा गेटवे" श्रेणी के अंतर्गत विंडोज़ प्रदर्शन काउंटरों को उजागर करता है:

काउंटरविवरणचेतावनी सीमा
सक्रिय कनेक्शनडेटा स्रोतों के लिए वर्तमान खुले कनेक्शन> 50
प्रश्न निष्पादित/सेकंडक्वेरी थ्रूपुटबेसलाइन + 50%
औसत क्वेरी अवधिप्रश्नों को निष्पादित करने का समय>30 सेकंड
कतार की लंबाईलंबित प्रश्न निष्पादन की प्रतीक्षा में>10
मेमोरी उपयोगगेटवे प्रक्रिया मेमोरी खपत> 80% उपलब्ध
सीपीयू उपयोगगेटवे प्रक्रिया सीपीयू खपत> 70% कायम

इन काउंटरों को ट्रैक करने और थ्रेशोल्ड पर अलर्ट करने के लिए विंडोज परफॉर्मेंस मॉनिटर या एक मॉनिटरिंग टूल (प्रोमेथियस, डेटाडॉग, एज़्योर मॉनिटर) सेट करें।

पावर बीआई एडमिन पोर्टल मॉनिटरिंग

Power BI व्यवस्थापक पोर्टल में:

  1. एडमिन पोर्टल पर जाएं, फिर गेटवे मैनेजमेंट पर जाएं
  2. सभी गेटवे, उनकी स्थिति (ऑनलाइन/ऑफ़लाइन), और संस्करण देखें
  3. डेटा स्रोत उपयोग के आँकड़े देखें
  4. ताज़ा सफलता/असफलता दर की निगरानी करें

गेटवे ऑफ़लाइन ईवेंट और ताज़ा विफलताओं के लिए ईमेल सूचनाएं कॉन्फ़िगर करें।


प्रदर्शन ट्यूनिंग

हार्डवेयर का सही आकार

गेटवे का प्रदर्शन मुख्य रूप से इससे बंधा हुआ है:

  1. सीपीयू - क्वेरी पार्सिंग, डेटा संपीड़न और एन्क्रिप्शन के लिए
  2. RAM - मध्यवर्ती क्वेरी परिणाम रखने के लिए
  3. नेटवर्क - Azure सर्विस बस में डेटा स्थानांतरित करने के लिए

आकार संबंधी दिशानिर्देश:

परिदृश्यसीपीयूरैमनेटवर्क
5 डेटासेट, दैनिक ताज़ा4 कोर8 जीबी100 एमबीपीएस
20 डेटासेट, प्रतिदिन दो बार8 कोर16 जीबी1 जीबीपीएस
50+ डेटासेट, DirectQuery16 कोर32 जीबी1 जीबीपीएस
भारी DirectQuery, कई समवर्ती उपयोगकर्ता16+ कोर64 जीबी10 जीबीपीएस

मैशअप इंजन सेटिंग्स

गेटवे डेटा परिवर्तन के लिए पावर क्वेरी (मैशअप) इंजन का उपयोग करता है। गेटवे ऐप में कॉन्फ़िगर करें:

अधिकतम समवर्ती क्वेरीज़: डिफ़ॉल्ट सीपीयू कोर की संख्या 2 गुना है। I/O-बाउंड वर्कलोड के लिए वृद्धि (धीमे डेटा स्रोतों की प्रतीक्षा)। सीपीयू-बाउंड वर्कलोड (भारी परिवर्तन) के लिए कमी।

प्रति क्वेरी मेमोरी सीमा: डिफ़ॉल्ट कोई सीमा नहीं है। एक रनवे क्वेरी को सभी उपलब्ध रैम का उपभोग करने से रोकने के लिए एक सीमा निर्धारित करें (उदाहरण के लिए, 2 जीबी)।

नेटवर्क अनुकूलन

डेटा स्रोत के करीब गेटवे का पता लगाएं। गेटवे और डेटा स्रोत के बीच नेटवर्क विलंबता को प्रति रीफ्रेश प्रश्नों की संख्या से गुणा किया जाता है। डेटाबेस के समान डेटा सेंटर में एक गेटवे विलंबता को कम करता है।

एज़्योर से निकटता के आधार पर गेटवे का पता न लगाएं। एज़्योर सर्विस बस कनेक्शन एक एकल निरंतर टीसीपी कनेक्शन है। Azure की विलंबता प्रारंभिक कनेक्शन सेटअप को प्रभावित करती है लेकिन क्वेरी थ्रूपुट को नहीं।

वायर्ड कनेक्शन का उपयोग करें। कभी भी वाई-फाई पर प्रोडक्शन गेटवे न चलाएं। रुक-रुक कर होने वाली कनेक्टिविटी ताज़ा विफलता का कारण बनती है।

स्रोत पर क्वेरी अनुकूलन

गेटवे प्रदर्शन को बेहतर बनाने का सबसे तेज़ तरीका इसके द्वारा निष्पादित क्वेरी को अनुकूलित करना है:

  • संपूर्ण तालिकाओं को आयात करने के बजाय कस्टम SQL क्वेरी का उपयोग करें (डेटा की मात्रा कम करें)
  • WHERE क्लॉज और JOIN में प्रयुक्त कॉलम पर डेटाबेस इंडेक्स बनाएं
  • जटिल डेटा मॉडल के लिए प्री-जॉइन्स और प्री-एग्रीगेशन वाले दृश्यों का उपयोग करें
  • डेटाबेस में परिवर्तनों को आगे बढ़ाने के लिए पावर क्वेरी में क्वेरी फोल्डिंग सक्षम करें
  • प्रति रिफ्रेश चक्र में डेटा की मात्रा कम करने के लिए वृद्धिशील रिफ्रेश लागू करें

सामान्य त्रुटियों का निवारण

"प्रवेश द्वार पहुंच योग्य नहीं है"

कारण: गेटवे सेवा बंद है, मशीन बंद है, या Azure से नेटवर्क कनेक्टिविटी अवरुद्ध है।

संकल्प:

  1. जांचें कि क्या गेटवे विंडोज सेवा चल रही है (services.msc)
  2. सत्यापित करें कि *.servicebus.windows.net पर आउटबाउंड HTTPS की अनुमति है
  3. यदि कॉर्पोरेट प्रॉक्सी के पीछे प्रॉक्सी सेटिंग्स जांचें
  4. सत्यापित करें कि गेटवे मशीन में इंटरनेट कनेक्टिविटी है
  5. जांचें कि क्या गेटवे संस्करण पुराना है (ऑटो-अपडेट चुपचाप विफल हो सकते हैं)

"डेटा स्रोत से कनेक्ट करने में असमर्थ"

कारण: ग़लत क्रेडेंशियल, डेटा स्रोत से नेटवर्क कनेक्टिविटी, या ड्राइवर समस्याएँ।

संकल्प:

  1. गेटवे कॉन्फ़िगरेशन ऐप में कनेक्शन का परीक्षण करें (डायग्नोस्टिक्स, फिर टेस्ट कनेक्शन)
  2. सत्यापित करें कि डेटा स्रोत सर्वर गेटवे मशीन (पिंग, टेलनेट से पोर्ट) तक पहुंच योग्य है
  3. सत्यापित करें कि क्रेडेंशियल सही हैं और खाता लॉक/समाप्त नहीं हुआ है
  4. Oracle और SAP के लिए, सत्यापित करें कि गेटवे मशीन पर आवश्यक क्लाइंट लाइब्रेरी स्थापित हैं
  5. जांचें कि डेटा स्रोत का फ़ायरवॉल गेटवे के आईपी से कनेक्शन की अनुमति देता है

"ऑन-प्रिमाइसेस डेटा गेटवे के रिफ्रेश होने में बहुत अधिक समय लग रहा है"

कारण: बड़े डेटासेट, धीमी क्वेरी, अपर्याप्त गेटवे संसाधन, या नेटवर्क बाधा।

संकल्प:

  1. डेटा वॉल्यूम कम करने के लिए वृद्धिशील रिफ्रेश सक्षम करें
  2. SQL क्वेरीज़ को अनुकूलित करें (इंडेक्स जोड़ें, कॉलम कम करें, पंक्तियाँ फ़िल्टर करें)
  3. रिफ्रेश के दौरान गेटवे मशीन सीपीयू और रैम के उपयोग की जांच करें
  4. समवर्ती भार को कम करने के लिए शेड्यूल को ताज़ा करें
  5. लोड वितरण के लिए दूसरा गेटवे नोड जोड़ने पर विचार करें

"डेटा स्रोत क्रेडेंशियल अमान्य हैं"

कारण: पासवर्ड बदल गया, खाता लॉक हो गया, या केर्बरोस डेलिगेशन गलत कॉन्फ़िगर हो गया।

संकल्प:

  1. पावर बीआई सेवा में क्रेडेंशियल पुनः दर्ज करें (डेटासेट सेटिंग्स, फिर गेटवे कनेक्शन)
  2. यदि कर्बेरोस के साथ Windows प्रमाणीकरण का उपयोग किया जा रहा है, तो सत्यापित करें:
  • गेटवे सेवा खाते में सक्रिय निर्देशिका में प्रतिनिधिमंडल विशेषाधिकार हैं
  • डेटा स्रोत के लिए SPN सही ढंग से कॉन्फ़िगर किए गए हैं
  • केडीसी (डोमेन नियंत्रक) गेटवे से पहुंचा जा सकता है

"गेटवे संस्करण पुराना हो गया है"

कारण: स्वतः-अपडेट विफल हो गया या अक्षम कर दिया गया।

संकल्प:

  1. माइक्रोसॉफ्ट से नवीनतम गेटवे इंस्टॉलर डाउनलोड करें
  2. इंस्टॉलर को मौजूदा गेटवे मशीन पर चलाएं (यह जगह पर अपग्रेड होता है)
  3. क्लस्टर के लिए, अपग्रेड के बीच अंतराल के साथ एक समय में एक नोड को अपग्रेड करें
  4. अपग्रेड के बाद Power BI एडमिन पोर्टल में गेटवे संस्करण को सत्यापित करें

सुरक्षा सर्वोत्तम प्रथाएँ

न्यूनतम विशेषाधिकार का सिद्धांत

  • गेटवे सेवा खाते में डेटा स्रोतों तक केवल पढ़ने के लिए पहुंच होनी चाहिए
  • डोमेन एडमिन या डेटाबेस एडमिन खातों का उपयोग न करें
  • यदि आपकी सुरक्षा नीति के लिए आवश्यक हो तो प्रति डेटा स्रोत प्रकार के लिए समर्पित सेवा खाते बनाएं
  • सेवा खाता पासवर्ड को नियमित समय पर घुमाएं और गेटवे डेटा स्रोत कॉन्फ़िगरेशन को अपडेट करें

पुनर्प्राप्ति कुंजी प्रबंधन

पुनर्प्राप्ति कुंजी सभी स्थानीय रूप से संग्रहीत क्रेडेंशियल्स को एन्क्रिप्ट करती है। इसे डेटाबेस मास्टर कुंजी की तरह ही सावधानी से संभालें:

  • एज़्योर की वॉल्ट या एंटरप्राइज पासवर्ड मैनेजर में स्टोर करें
  • दस्तावेज़ जिसके पास पुनर्प्राप्ति कुंजी तक पहुंच है
  • अपनी कुंजी प्रबंधन नीति में पुनर्प्राप्ति कुंजी रोटेशन शामिल करें
  • पुनर्प्राप्ति कुंजी के साथ बैकअप से गेटवे को पुनर्स्थापित करके पुनर्प्राप्ति का परीक्षण करें

नेटवर्क विभाजन

गेटवे को ऐसे नेटवर्क सेगमेंट में रखें जो पहुंच सके:

  • डेटा स्रोत सर्वर (एसक्यूएल सर्वर, पोस्टग्रेएसक्यूएल, ओरेकल, आदि)
  • एज़्योर सर्विस बस (आउटबाउंड HTTPS)
  • Azure AD (आउटबाउंड HTTPS)

अन्य सभी आवक और जावक यातायात को अवरुद्ध करें। गेटवे को किसी भी स्रोत से इनबाउंड कनेक्शन की आवश्यकता नहीं है।

ऑडिट ट्रेल

ट्रैक करने के लिए गेटवे मशीन पर Windows सुरक्षा ऑडिटिंग सक्षम करें:

  • सेवा खाता लॉगऑन इवेंट
  • गेटवे कॉन्फ़िगरेशन बदलता है
  • डेटा स्रोत पहुंच पैटर्न

केंद्रीकृत निगरानी के लिए इन घटनाओं को अपने एसआईईएम (स्प्लंक, सेंटिनल, डेटाडॉग) को अग्रेषित करें।


प्रवासन और उन्नयन परिदृश्य

एक नई गेटवे मशीन पर माइग्रेट करना

  1. नई मशीन पर गेटवे स्थापित करें
  2. पंजीकरण के दौरान, "मौजूदा गेटवे को स्थानांतरित करें, पुनर्स्थापित करें या अधिग्रहण करें" चुनें
  3. मूल गेटवे से पुनर्प्राप्ति कुंजी दर्ज करें
  4. नई मशीन को सभी डेटा स्रोत कॉन्फ़िगरेशन और क्रेडेंशियल विरासत में मिले हैं
  5. Power BI एडमिन पोर्टल में कनेक्टेड दिखाए गए सभी डेटा स्रोतों को सत्यापित करें
  6. नई मशीन के आईपी को शामिल करने के लिए किसी भी आईपी-आधारित फ़ायरवॉल नियम को अपडेट करें
  7. पुरानी गेटवे मशीन को बंद करें

गेटवे संस्करणों का उन्नयन

माइक्रोसॉफ्ट मासिक रूप से गेटवे अपडेट जारी करता है। सर्वोत्तम प्रथाएँ:

  • परिवर्तनों की अग्रिम सूचना के लिए गेटवे रिलीज़ नोट्स की सदस्यता लें
  • पहले गैर-उत्पादन गेटवे क्लस्टर में नए संस्करणों का परीक्षण करें
  • उत्पादन समूहों के लिए, 24 घंटे के अंतराल के साथ एक समय में एक नोड को अपग्रेड करें
  • प्रत्येक नोड अपग्रेड के बाद ताज़ा सफलता दर सत्यापित करें
  • नए संस्करण के मान्य होने तक पिछले संस्करण पर कम से कम एक नोड रखें

गेटवे क्लस्टर में एन-1 संस्करण संगतता का समर्थन करता है --- नोड्स को ठीक उसी संस्करण को चलाने की आवश्यकता नहीं है।


अक्सर पूछे जाने वाले प्रश्न

क्या मैं वर्चुअल मशीन पर गेटवे स्थापित कर सकता हूं?

हाँ। गेटवे भौतिक और आभासी मशीनों पर चलता है, जिसमें Azure VMs, AWS EC2 और ऑन-प्रिमाइसेस हाइपर-V या VMware शामिल हैं। Azure VMs के लिए, VNet डेटा गेटवे (प्रीमियम क्षमताओं के लिए पूर्वावलोकन में) का उपयोग करने पर विचार करें जो स्व-प्रबंधित गेटवे की आवश्यकता को पूरी तरह से समाप्त कर देता है। ऑन-प्रिमाइसेस वीएम के लिए, सुनिश्चित करें कि वीएम में समर्पित (साझा नहीं) सीपीयू और रैम संसाधन हैं, और हाइपरवाइजर आक्रामक रूप से संसाधनों को ओवरकमिट नहीं करता है।

एक गेटवे कितने डेटा स्रोतों का समर्थन कर सकता है?

प्रति गेटवे डेटा स्रोतों की संख्या पर कोई कठोर सीमा नहीं है। व्यवहार में, गेटवे आमतौर पर बिना किसी समस्या के 50 से 100 डेटा स्रोतों का समर्थन करते हैं। सीमित कारक ताज़ा विंडोज़ के दौरान समवर्ती क्वेरी लोड है, न कि कॉन्फ़िगर किए गए डेटा स्रोतों की संख्या। यदि ताज़ा समय ख़राब हो रहा है, तो अतिरिक्त गेटवे इंस्टॉलेशन बनाने के बजाय क्लस्टर नोड्स जोड़ें।

क्या गेटवे लिनक्स का समर्थन करता है?

नहीं, ऑन-प्रिमाइसेस डेटा गेटवे के लिए विंडोज़ (सर्वर 2016 या बाद का संस्करण) की आवश्यकता है। यदि आपके डेटा स्रोत लिनक्स पर चलते हैं, तो विंडोज़ मशीन पर गेटवे स्थापित करें जिसमें लिनक्स डेटा स्रोत सर्वर तक नेटवर्क पहुंच हो। गेटवे नेटवर्क पर डेटा स्रोत से जुड़ता है --- इसे डेटा स्रोत के समान ऑपरेटिंग सिस्टम पर चलने की आवश्यकता नहीं है।

क्या होता है यदि क्लस्टर में दोनों गेटवे नोड एक साथ ऑफ़लाइन हो जाते हैं?

सभी शेड्यूल किए गए रिफ्रेश विफल हो जाते हैं, और सभी DirectQuery कनेक्शन त्रुटियाँ लौटाते हैं। पावर बीआई सेवा ऑफ़लाइन स्थिति का पता लगाती है और गेटवे व्यवस्थापकों को सूचनाएं भेजती है (यदि कॉन्फ़िगर किया गया है)। कैश्ड डेटा (आयात मोड) का उपयोग करने वाली रिपोर्टें अंतिम सफलतापूर्वक ताज़ा किए गए डेटा को प्रदर्शित करना जारी रखती हैं। जब कम से कम एक नोड ऑनलाइन वापस आता है, तो लंबित ताज़ा अनुरोध स्वचालित रूप से संसाधित हो जाते हैं। इस परिदृश्य को रोकने के लिए, रखरखाव विंडो को व्यवस्थित करें और क्लस्टर नोड्स को अलग-अलग भौतिक बुनियादी ढांचे पर रखें।

क्या गेटवे वास्तविक समय स्ट्रीमिंग डेटा को संभाल सकता है?

गेटवे को क्वेरी-प्रतिक्रिया पैटर्न के लिए डिज़ाइन किया गया है, स्ट्रीमिंग के लिए नहीं। वास्तविक समय डेटा के लिए, Power BI स्ट्रीमिंग डेटासेट (जो गेटवे को पूरी तरह से बायपास करता है), Azure स्ट्रीम एनालिटिक्स, या Power BI वास्तविक समय डैशबोर्ड के साथ Azure इवेंट हब पर विचार करें। गेटवे ऑन-प्रिमाइसेस डेटाबेस तक लगभग वास्तविक समय पहुंच के लिए DirectQuery का समर्थन करता है, लेकिन प्रत्येक रिपोर्ट इंटरैक्शन निरंतर डेटा स्ट्रीम प्राप्त करने के बजाय एक नई क्वेरी ट्रिगर करता है।

शेयर करें:
E

लेखक

ECOSIRE Research and Development Team

ECOSIRE में एंटरप्राइज़-ग्रेड डिजिटल उत्पाद बना रहे हैं। Odoo एकीकरण, ई-कॉमर्स ऑटोमेशन, और AI-संचालित व्यावसायिक समाधानों पर अंतर्दृष्टि साझा कर रहे हैं।

WhatsApp पर चैट करें