ऑन-प्रिमाइसेस डेटा गेटवे: सेटअप और कॉन्फ़िगरेशन गाइड
ऑन-प्रिमाइसेस डेटा गेटवे पावर बीआई सेवा (क्लाउड) और आपके ऑन-प्रिमाइसेस डेटा स्रोतों के बीच सेतु है। इसके बिना, कोई भी डेटा जो आपके कॉर्पोरेट फ़ायरवॉल के पीछे रहता है --- SQL सर्वर डेटाबेस, PostgreSQL इंस्टेंसेस, Oracle सिस्टम, फ़ाइल शेयर, ODBC स्रोत --- Power BI सेवा में ताज़ा नहीं किया जा सकता है। क्लाउड से ऑन-प्रिमाइसेस डेटाबेस तक लाइव/डायरेक्टक्वेरी कनेक्शन के लिए भी गेटवे आवश्यक है।
अपनी महत्वपूर्ण भूमिका के बावजूद, गेटवे को अक्सर एक बाद के विचार के रूप में माना जाता है। संगठन इसे डेवलपर के लैपटॉप पर इंस्टॉल करते हैं, उच्च-उपलब्धता कॉन्फ़िगरेशन को छोड़ देते हैं, और आश्चर्य करते हैं कि प्रत्येक सप्ताहांत में शेड्यूल किए गए रिफ्रेश विफल क्यों होते हैं। यह मार्गदर्शिका संपूर्ण जीवनचक्र को कवर करती है: आर्किटेक्चर निर्णय, इंस्टॉलेशन, क्लस्टरिंग, डेटा स्रोत कॉन्फ़िगरेशन, मॉनिटरिंग, प्रदर्शन ट्यूनिंग और सबसे आम त्रुटियों का निवारण।
मुख्य बातें
- ऑन-प्रिमाइसेस डेटा गेटवे दो मोड में आता है: व्यक्तिगत (एकल उपयोगकर्ता, कोई साझाकरण नहीं) और मानक/उद्यम (पूरे संगठन में साझा, क्लस्टरिंग का समर्थन करता है)
- एंटरप्राइज गेटवे को हमेशा विश्वसनीय पावर, नेटवर्क और अपटाइम के साथ एक समर्पित सर्वर (डेवलपर वर्कस्टेशन नहीं) पर स्थापित किया जाना चाहिए
- दो या दो से अधिक नोड्स के साथ गेटवे क्लस्टरिंग उच्च उपलब्धता प्रदान करती है --- यदि एक नोड नीचे चला जाता है, तो दूसरा ताज़ा अनुरोधों को संभालना जारी रखता है
- सभी संचार एज़्योर सर्विस बस के गेटवे से आउटबाउंड हैं --- किसी इनबाउंड फ़ायरवॉल पोर्ट को खोलने की आवश्यकता नहीं है
- डेटा स्रोत क्रेडेंशियल को पुनर्प्राप्ति कुंजी का उपयोग करके गेटवे मशीन पर स्थानीय रूप से एन्क्रिप्ट किया जाता है --- इस कुंजी को खोने का मतलब सभी डेटा स्रोतों को पुन: कॉन्फ़िगर करना है
- गेटवे लॉग सबसे उपयोगी समस्या निवारण संसाधन हैं, जो उपयोगकर्ता के स्थानीय ऐप डेटा के अंतर्गत गेटवेकंपोनेंट्स फ़ोल्डर में स्थित हैं।
- रिलेशनल स्रोतों के लिए कनेक्शन पूलिंग को सक्षम करके, उचित टाइमआउट मान सेट करके और गेटवे मशीन में पर्याप्त रैम और सीपीयू सुनिश्चित करके प्रदर्शन में सुधार किया जा सकता है।
गेटवे आर्किटेक्चर
गेटवे कैसे काम करता है
गेटवे टीसीपी पोर्ट 443 (एचटीटीपीएस) का उपयोग करके एज़्योर सर्विस बस के लिए एक आउटबाउंड कनेक्शन स्थापित करता है। आपके फ़ायरवॉल में किसी भी इनबाउंड पोर्ट को खोलने की आवश्यकता नहीं है। संचार प्रवाह है:
- एक उपयोगकर्ता सेवा में एक पावर बीआई रिपोर्ट, या एक निर्धारित रिफ्रेश ट्रिगर खोलता है
- Power BI सेवा Azure सर्विस बस को एक क्वेरी अनुरोध भेजती है
- गेटवे (पोलिंग एज़्योर सर्विस बस) अनुरोध उठाता है
- गेटवे ऑन-प्रिमाइसेस डेटा स्रोत के विरुद्ध क्वेरी निष्पादित करता है
- गेटवे परिणामों को एन्क्रिप्ट करता है और उन्हें Azure सर्विस बस के माध्यम से वापस भेजता है
- पावर बीआई सेवा परिणाम प्राप्त करती है और रिपोर्ट प्रस्तुत करती है या रिफ्रेश पूरा करती है
इस आर्किटेक्चर का मतलब है कि गेटवे कभी भी इंटरनेट से इनबाउंड कनेक्शन प्राप्त नहीं करता है। यह सभी संचार आउटबाउंड आरंभ करता है, जो फ़ायरवॉल कॉन्फ़िगरेशन को काफी सरल बनाता है।
व्यक्तिगत गेटवे बनाम मानक (उद्यम) गेटवे
| फ़ीचर | व्यक्तिगत गेटवे | मानक गेटवे |
|---|---|---|
| उपयोगकर्ता | केवल एकल उपयोगकर्ता | पूरे संगठन में साझा किया गया |
| डेटा स्रोत | उपयोगकर्ता के अपने स्रोत | केंद्रीय रूप से प्रबंधित स्रोत |
| क्लस्टरिंग | समर्थित नहीं | 10 नोड्स तक |
| प्रशासन | उपयोगकर्ता स्व-सेवा | गेटवे व्यवस्थापक भूमिका |
| के रूप में चलता है विंडोज़ एप्लीकेशन | विंडोज़ सेवा | |
| डायरेक्टक्वेरी | समर्थित नहीं | समर्थित |
| डेटा प्रवाह | समर्थित नहीं | समर्थित |
| लाइव कनेक्शन | समर्थित नहीं | समर्थित |
| वर्चुअल नेटवर्क | समर्थित नहीं | समर्थित (प्रीमियम) |
| सिफारिश | केवल व्यक्तिगत प्रोटोटाइप | उत्पादन उपयोग |
किसी भी उत्पादन परिनियोजन के लिए, मानक (उद्यम) गेटवे का उपयोग करें। व्यक्तिगत गेटवे केवल अपने स्वयं के डेटा स्रोतों के साथ प्रोटोटाइप करने वाले व्यक्तिगत उपयोगकर्ताओं के लिए उपयुक्त है।
स्थापना
पूर्वावश्यकताएँ
गेटवे स्थापित करने से पहले, सुनिश्चित करें कि लक्ष्य मशीन इन आवश्यकताओं को पूरा करती है:
| आवश्यकता | न्यूनतम | अनुशंसित |
|---|---|---|
| ओएस | विंडोज़ सर्वर 2016 | विंडोज सर्वर 2022 |
| सीपीयू | 4 कोर | 8 कोर |
| रैम | 8 जीबी | 16 जीबी |
| डिस्क | 50 जीबी मुफ़्त | 100 जीबी एसएसडी |
| .NET फ्रेमवर्क | 4.8 | 4.8 (नवीनतम संचयी अद्यतन) |
| नेटवर्क | 1 जीबीपीएस | डेटा स्रोतों के लिए कम विलंबता के साथ 1 जीबीपीएस |
| टीएलएस | 1.2 आवश्यक | 1.2 (1.0/1.1 अक्षम) |
महत्वपूर्ण: अपने डेटाबेस के समान सर्वर पर गेटवे स्थापित न करें। रिफ्रेश ऑपरेशन के दौरान गेटवे सीपीयू और रैम के लिए प्रतिस्पर्धा करता है, और इसे डेटाबेस के साथ सह-स्थानित करने से गेटवे और डेटाबेस दोनों का प्रदर्शन ख़राब हो सकता है।
स्थापना चरण
- आधिकारिक माइक्रोसॉफ्ट डाउनलोड पेज से नवीनतम गेटवे इंस्टॉलर डाउनलोड करें
- इंस्टॉलर चलाएँ और एंटरप्राइज़ मोड के लिए "ऑन-प्रिमाइसेस डेटा गेटवे (अनुशंसित)" चुनें
- लाइसेंस शर्तों को स्वीकार करें और इंस्टॉलेशन निर्देशिका चुनें
- अपने संगठनात्मक खाते से साइन इन करें (खाता आपकी Power BI सेवा के समान Azure AD टैनेंट में होना चाहिए)
- "इस कंप्यूटर पर एक नया गेटवे पंजीकृत करें" चुनें
- गेटवे को नाम दें (एक वर्णनात्मक नाम का उपयोग करें: उदाहरण के लिए, प्रोडक्शन गेटवे, न्यूयॉर्क, नोड 1 के लिए "PROD-GW-NY-01")
- पुनर्प्राप्ति कुंजी सेट करें --- इसे पासवर्ड मैनेजर या कुंजी वॉल्ट में सुरक्षित रूप से संग्रहीत करें। क्लस्टर नोड्स जोड़ने या गेटवे पुनर्प्राप्त करने के लिए आपको इसकी आवश्यकता होगी
- स्थापना पूर्ण करें
गेटवे सेवा स्वचालित रूप से प्रारंभ होती है और डिफ़ॉल्ट रूप से "NT SERVICE\PBIEgwService" खाते के अंतर्गत चलती है।
सेवा खाता बदलना
डिफ़ॉल्ट रूप से, गेटवे स्थानीय सेवा खाते के रूप में चलता है। नेटवर्क संसाधनों (फ़ाइल शेयर, विंडोज़ प्रमाणीकरण के साथ डोमेन से जुड़े डेटाबेस) तक पहुँचने के लिए, आपको सेवा खाते को डोमेन खाते में बदलने की आवश्यकता हो सकती है:
- विंडोज़ सेवाएँ खोलें (services.msc)
- "ऑन-प्रिमाइसेस डेटा गेटवे सेवा" ढूंढें
- राइट-क्लिक करें, गुण चुनें, फिर लॉग ऑन टैब चुनें
- "यह खाता" चुनें और डोमेन क्रेडेंशियल दर्ज करें
- सेवा पुनः प्रारंभ करें
सेवा खाते को निम्नलिखित अनुदान दें:
- "एक सेवा के रूप में लॉग ऑन करें" स्थानीय नीति
- क्वेरी के लिए आवश्यक डेटा स्रोतों तक पहुंच पढ़ें
- डेटा स्रोत सर्वर तक नेटवर्क पहुंच
उच्च उपलब्धता के लिए गेटवे क्लस्टरिंग
एक एकल प्रवेश द्वार विफलता का एक एकल बिंदु है। यदि मशीन बंद हो जाती है, तो सभी शेड्यूल किए गए रिफ्रेश और DirectQuery कनेक्शन विफल हो जाते हैं। गेटवे क्लस्टरिंग कई नोड्स में अनुरोध वितरित करके इसे हल करता है।
एक क्लस्टर बनाना
- समान इंस्टॉलेशन चरणों का पालन करते हुए दूसरी मशीन पर गेटवे स्थापित करें
- "नया गेटवे पंजीकृत करें" चरण के दौरान, "मौजूदा गेटवे क्लस्टर में जोड़ें" चुनें
- ड्रॉपडाउन से मौजूदा गेटवे नाम चुनें
- पुनर्प्राप्ति कुंजी दर्ज करें (पहले नोड के लिए उपयोग की जाने वाली वही कुंजी)
- स्थापना पूर्ण करें
क्लस्टर में अब दो नोड हैं। अनुरोध स्वस्थ नोड्स में वितरित किए जाते हैं।
लोड संतुलन विन्यास
डिफ़ॉल्ट रूप से, गेटवे क्लस्टर अनुरोधों को यादृच्छिक रूप से वितरित करते हैं। आप लोड संतुलन कॉन्फ़िगर कर सकते हैं:
राउंड-रॉबिन: अनुरोधों को सभी नोड्स में समान रूप से वितरित करता है। समान हार्डवेयर वाले क्लस्टर के लिए सर्वोत्तम।
भारित रूटिंग: अधिक अनुरोधों को अधिक शक्तिशाली नोड्स तक निर्देशित करता है। गेटवे सेटिंग्स के अंतर्गत Power BI एडमिन पोर्टल में कॉन्फ़िगर करें।
केवल विफलता: सभी अनुरोध प्राथमिक नोड पर जाते हैं। द्वितीयक नोड केवल तभी सक्रिय होते हैं जब प्राथमिक अनुपलब्ध हो। स्टैंडबाय सर्वर के साथ लागत-सचेत तैनाती के लिए सर्वोत्तम।
अनुशंसित क्लस्टर टोपोलॉजी
उत्पादन परिनियोजन के लिए, ECOSIRE अनुशंसा करता है न्यूनतम दो गेटवे नोड:
| घटक | नोड 1 | नोड 2 |
|---|---|---|
| भूमिका | प्राथमिक | माध्यमिक |
| स्थान | प्राथमिक डेटा सेंटर | डीआर साइट या वही डीसी |
| हार्डवेयर | 8 कोर, 16 जीबी रैम | 8 कोर, 16 जीबी रैम |
| नेटवर्क | 1 जीबीपीएस, कम विलंबता | 1 जीबीपीएस, कम विलंबता |
| रखरखाव विंडो | रविवार 2-4 पूर्वाह्न | शनिवार 2-4 पूर्वाह्न |
रखरखाव खिड़कियाँ डगमगाती हैं ताकि दोनों नोड एक साथ कभी भी बंद न हों। विंडोज़ अपडेट, .NET पैच और गेटवे संस्करण अपग्रेड को एक समय में एक नोड पर लागू किया जाना चाहिए।
डेटा स्रोत कॉन्फ़िगरेशन
डेटा स्रोत जोड़ना
गेटवे स्थापित करने के बाद, Power BI सेवा में डेटा स्रोतों को कॉन्फ़िगर करें:
- सेटिंग्स (गियर आइकन) पर जाएं, फिर गेटवे प्रबंधित करें
- अपना गेटवे क्लस्टर चुनें
- "डेटा स्रोत जोड़ें" पर क्लिक करें
- डेटा स्रोत प्रकार चुनें (SQL सर्वर, PostgreSQL, Oracle, ODBC, आदि)
- कनेक्शन विवरण दर्ज करें (सर्वर नाम, डेटाबेस नाम)
- प्रमाणीकरण विधि का चयन करें (Windows, Basic, OAuth2)
- क्रेडेंशियल दर्ज करें
- कनेक्शन का परीक्षण करें
समर्थित डेटा स्रोत प्रकार
मानक गेटवे 80 से अधिक डेटा स्रोत प्रकारों का समर्थन करता है। पावर बीआई के लिए सबसे आम:
| डेटा स्रोत | प्रामाणिक तरीके | डायरेक्टक्वेरी | नोट्स |
|---|---|---|---|
| एसक्यूएल सर्वर | विंडोज़, बेसिक, OAuth | हाँ | सबसे आम उद्यम स्रोत |
| पोस्टग्रेएसक्यूएल | बुनियादी | हाँ | Odoo द्वारा उपयोग किए जाने वाले कई ओपन-सोर्स ऐप्स |
| ओरेकल | विंडोज़, बेसिक | हाँ | गेटवे पर Oracle क्लाइंट की आवश्यकता है |
| MySQL | बुनियादी | हाँ | सामुदायिक संबंधक |
| सैप हाना | बेसिक, एसएएमएल | हाँ | SAP हाना क्लाइंट की आवश्यकता है |
| फ़ाइल (सीएसवी/एक्सेल) | एन/ए | नहीं | फ़ाइलें नेटवर्क शेयर पर होनी चाहिए |
| ओडीबीसी | बेसिक, विंडोज़ | हाँ | किसी भी ODBC स्रोत के लिए सामान्य कनेक्टर |
| वेब एपीआई | अनाम, मूल, OAuth | नहीं | REST/OData समापनबिंदु के लिए |
क्रेडेंशियल एन्क्रिप्शन
डेटा स्रोत क्रेडेंशियल पुनर्प्राप्ति कुंजी का उपयोग करके एन्क्रिप्ट किए जाते हैं और गेटवे मशीन पर स्थानीय रूप से संग्रहीत किए जाते हैं। उन्हें कभी भी सादे टेक्स्ट में क्लाउड पर नहीं भेजा जाता है। जब आप क्लस्टर नोड जोड़ते हैं, तो साझा पुनर्प्राप्ति कुंजी का उपयोग करके क्रेडेंशियल सिंक किए जाते हैं।
महत्वपूर्ण: यदि आप पुनर्प्राप्ति कुंजी खो देते हैं और सभी गेटवे नोड विफल हो जाते हैं, तो आपको यह करना होगा:
- नई पुनर्प्राप्ति कुंजी के साथ एक नया गेटवे स्थापित करें
- सभी डेटा स्रोतों और क्रेडेंशियल्स को पुन: कॉन्फ़िगर करें
- Power BI सेवा में सभी डेटासेट को नए गेटवे पर पुनः मैप करें
पुनर्प्राप्ति कुंजी को Azure कुंजी वॉल्ट या अपने संगठन के पासवर्ड मैनेजर में संग्रहीत करें।
कनेक्शन पूलिंग
रिलेशनल डेटाबेस (एसक्यूएल सर्वर, पोस्टग्रेएसक्यूएल, ओरेकल) के लिए, रीफ्रेश ऑपरेशंस में डेटाबेस कनेक्शन का पुन: उपयोग करने के लिए कनेक्शन पूलिंग सक्षम करें:
गेटवे कॉन्फ़िगरेशन फ़ाइल (Microsoft.PowerBI.EnterpriseGateway.exe.config) में:
<setting name="PoolConnections" serializeAs="String">
<value>True</value>
</setting>
<setting name="MinPoolSize" serializeAs="String">
<value>2</value>
</setting>
<setting name="MaxPoolSize" serializeAs="String">
<value>20</value>
</setting>
कनेक्शन पूलिंग प्रत्येक क्वेरी के लिए नए डेटाबेस कनेक्शन स्थापित करने के ओवरहेड को कम कर देता है, विशेष रूप से कई समवर्ती उपयोगकर्ताओं के साथ DirectQuery वर्कलोड के दौरान।
शेड्यूल किया गया ताज़ा कॉन्फ़िगरेशन
शेड्यूल्ड रिफ्रेश सेट करना
Power BI सेवा पर डेटासेट प्रकाशित करने के बाद:
- डेटासेट सेटिंग्स पर जाएं
- "गेटवे कनेक्शन" के अंतर्गत, अपना गेटवे और कॉन्फ़िगर किया गया डेटा स्रोत चुनें
- "शेड्यूल रिफ्रेश" के अंतर्गत टॉगल सक्षम करें
- ताज़ा आवृत्ति सेट करें (दैनिक, साप्ताहिक, या विशिष्ट समय)
- समय क्षेत्र कॉन्फ़िगर करें
- वैकल्पिक रूप से विफलता सूचनाएं सेट करें
आवृत्ति सीमाएँ ताज़ा करें
| लाइसेंस | प्रति दिन अधिकतम ताज़ा | न्यूनतम अंतराल |
|---|---|---|
| पावर बीआई प्रो | 8 | 3 घंटे |
| पावर बीआई प्रीमियम (प्रति क्षमता) | 48 | 30 मिनट |
| प्रति उपयोगकर्ता पावर बीआई प्रीमियम | 48 | 30 मिनट |
विंडोज़ और चौंका देने वाला ताज़ा करें
सभी डेटासेट रिफ्रेश को एक ही समय पर शेड्यूल न करें। गेटवे में सीमित सीपीयू और मेमोरी है, और समवर्ती रिफ्रेश संसाधनों के लिए प्रतिस्पर्धा करते हैं।
सर्वोत्तम अभ्यास: एक ताज़ा शेड्यूल बनाएं जो उपलब्ध विंडो में डेटासेट को क्रमबद्ध करता है:
| समय | डेटासेट | प्राथमिकता |
|---|---|---|
| 1:00 पूर्वाह्न | वित्त - जीएल सारांश | गंभीर |
| 1:30 पूर्वाह्न | बिक्री - पाइपलाइन | गंभीर |
| 2:00 पूर्वाह्न | एचआर - हेडकाउंट | उच्च |
| 2:30 पूर्वाह्न | इन्वेंटरी - स्टॉक स्तर | उच्च |
| प्रातः 3:00 बजे | विनिर्माण - OEE | मध्यम |
| 3:30 पूर्वाह्न | मार्केटिंग - अभियान मेट्रिक्स | मध्यम |
महत्वपूर्ण डेटासेट पहले रीफ्रेश होते हैं, यह सुनिश्चित करते हुए कि वे पूर्ण हो जाएं, भले ही बाद में रीफ्रेश में समस्याएं आती हों।
इंक्रीमेंटल रिफ्रेश और गेटवे
वृद्धिशील रिफ्रेश गेटवे के माध्यम से संसाधित डेटा की मात्रा को काफी कम कर देता है। संपूर्ण डेटासेट को ताज़ा करने के बजाय, केवल नई और परिवर्तित पंक्तियाँ ही लाई जाती हैं। यह बड़े डेटासेट के लिए विशेष रूप से महत्वपूर्ण है जहां पूर्ण रीफ्रेश में घंटों लगेंगे और अत्यधिक गेटवे संसाधनों का उपभोग होगा।
Power BI डेस्कटॉप में वृद्धिशील रिफ्रेश कॉन्फ़िगर करें (रेंजस्टार्ट/रेंजएंड पैरामीटर दृष्टिकोण देखें), फिर सेवा पर प्रकाशित करें। गेटवे पैरामीटरयुक्त प्रश्नों को स्वचालित रूप से संभालता है।
फ़ायरवॉल और प्रॉक्सी कॉन्फ़िगरेशन
आवश्यक आउटबाउंड कनेक्शन
गेटवे को आउटबाउंड HTTPS (TCP 443) एक्सेस की आवश्यकता है:
| गंतव्य | उद्देश्य |
|---|---|
| *.servicebus.windows.net | एज़्योर सर्विस बस (क्वेरी रिले) |
| *.frontend.clouddatahub.net | गेटवे पंजीकरण और अद्यतन |
| *.core.windows.net | एज़्योर ब्लॉब स्टोरेज (डेटा ट्रांसफर) |
| लॉगिन.माइक्रोसॉफ्टऑनलाइन.कॉम | Azure AD प्रमाणीकरण |
| *.msftncsi.com | नेटवर्क कनेक्टिविटी जांच |
| डाउनलोड.माइक्रोसॉफ्ट.कॉम | गेटवे अपडेट |
यदि आपके फ़ायरवॉल को वाइल्डकार्ड डोमेन के बजाय स्पष्ट आईपी अनुमति सूची की आवश्यकता है, तो अपने क्षेत्र में Azure सर्विस बस के लिए IP रेंज खोजने के लिए Microsoft से Azure IP रेंज JSON फ़ाइल (साप्ताहिक अद्यतन) का उपयोग करें।
प्रॉक्सी सर्वर कॉन्फ़िगरेशन
यदि गेटवे को कॉर्पोरेट प्रॉक्सी के माध्यम से रूट करना होगा:
- संपादित करें
Microsoft.PowerBI.EnterpriseGateway.exe.config <system.net>अनुभाग में प्रॉक्सी कॉन्फ़िगरेशन जोड़ें:
<system.net>
<defaultProxy useDefaultCredentials="true">
<proxy proxyaddress="http://proxy.company.com:8080"
bypassonlocal="true" />
</defaultProxy>
</system.net>
- गेटवे सेवा पुनः प्रारंभ करें
यदि प्रॉक्सी को विशिष्ट क्रेडेंशियल्स (पास-थ्रू विंडोज प्रमाणीकरण नहीं) की आवश्यकता होती है, तो आपको अतिरिक्त प्रमाणीकरण के बिना गेटवे के सेवा खाते को अनुमति देने के लिए प्रॉक्सी पीएसी फ़ाइल का उपयोग करने या प्रॉक्सी को कॉन्फ़िगर करने की आवश्यकता हो सकती है।
टीएलएस कॉन्फ़िगरेशन
गेटवे के लिए टीएलएस 1.2 की आवश्यकता है। यदि आपके परिवेश में अभी भी टीएलएस 1.0 या 1.1 सक्षम है, तो गेटवे डिफ़ॉल्ट रूप से टीएलएस 1.2 का उपयोग करेगा। हालाँकि, यदि डेटा स्रोत सर्वर केवल टीएलएस 1.0 का समर्थन करता है, तो कनेक्शन विफल हो जाएगा।
सत्यापित करें कि TLS 1.2 Windows रजिस्ट्री में सक्षम है:
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\SecurityProviders\SCHANNEL\Protocols\TLS 1.2\Client
Enabled = 1 (DWORD)
DisabledByDefault = 0 (DWORD)
निगरानी और लॉगिंग
गेटवे लॉग
गेटवे विस्तृत लॉग लिखता है:
C:\Users\<ServiceAccount>\AppData\Local\Microsoft\On-premises data gateway\
कुंजी लॉग फ़ाइलें:
| फ़ाइल | सामग्री |
|---|---|
| गेटवेइन्फो*.लॉग | सामान्य गेटवे संचालन, स्टार्टअप, शटडाउन |
| गेटवे एरर*.लॉग | त्रुटियाँ और अपवाद |
| मैशअप*.लॉग | पावर क्वेरी (एम) इंजन संचालन |
| रिपोर्ट*.लॉग | क्वेरी निष्पादन विवरण, प्रदर्शन काउंटर |
अतिरिक्त लॉगिंग सक्षम करना
समस्या निवारण के लिए, वर्बोज़ लॉगिंग सक्षम करें:
- गेटवे कॉन्फ़िगरेशन एप्लिकेशन खोलें
- डायग्नोस्टिक्स पर जाएं
- "अतिरिक्त लॉगिंग" सक्षम करें
- मुद्दे को पुन: प्रस्तुत करें
- "निर्यात लॉग" बटन का उपयोग करके लॉग निर्यात करें (सभी लॉग फ़ाइलों का एक ज़िप बनाता है)
- समस्या निवारण के बाद अतिरिक्त लॉगिंग अक्षम करें (यह बड़ी लॉग वॉल्यूम उत्पन्न करता है)
प्रदर्शन काउंटर
गेटवे "ऑन-प्रिमाइसेस डेटा गेटवे" श्रेणी के अंतर्गत विंडोज़ प्रदर्शन काउंटरों को उजागर करता है:
| काउंटर | विवरण | चेतावनी सीमा |
|---|---|---|
| सक्रिय कनेक्शन | डेटा स्रोतों के लिए वर्तमान खुले कनेक्शन | > 50 |
| प्रश्न निष्पादित/सेकंड | क्वेरी थ्रूपुट | बेसलाइन + 50% |
| औसत क्वेरी अवधि | प्रश्नों को निष्पादित करने का समय | >30 सेकंड |
| कतार की लंबाई | लंबित प्रश्न निष्पादन की प्रतीक्षा में | >10 |
| मेमोरी उपयोग | गेटवे प्रक्रिया मेमोरी खपत | > 80% उपलब्ध |
| सीपीयू उपयोग | गेटवे प्रक्रिया सीपीयू खपत | > 70% कायम |
इन काउंटरों को ट्रैक करने और थ्रेशोल्ड पर अलर्ट करने के लिए विंडोज परफॉर्मेंस मॉनिटर या एक मॉनिटरिंग टूल (प्रोमेथियस, डेटाडॉग, एज़्योर मॉनिटर) सेट करें।
पावर बीआई एडमिन पोर्टल मॉनिटरिंग
Power BI व्यवस्थापक पोर्टल में:
- एडमिन पोर्टल पर जाएं, फिर गेटवे मैनेजमेंट पर जाएं
- सभी गेटवे, उनकी स्थिति (ऑनलाइन/ऑफ़लाइन), और संस्करण देखें
- डेटा स्रोत उपयोग के आँकड़े देखें
- ताज़ा सफलता/असफलता दर की निगरानी करें
गेटवे ऑफ़लाइन ईवेंट और ताज़ा विफलताओं के लिए ईमेल सूचनाएं कॉन्फ़िगर करें।
प्रदर्शन ट्यूनिंग
हार्डवेयर का सही आकार
गेटवे का प्रदर्शन मुख्य रूप से इससे बंधा हुआ है:
- सीपीयू - क्वेरी पार्सिंग, डेटा संपीड़न और एन्क्रिप्शन के लिए
- RAM - मध्यवर्ती क्वेरी परिणाम रखने के लिए
- नेटवर्क - Azure सर्विस बस में डेटा स्थानांतरित करने के लिए
आकार संबंधी दिशानिर्देश:
| परिदृश्य | सीपीयू | रैम | नेटवर्क |
|---|---|---|---|
| 5 डेटासेट, दैनिक ताज़ा | 4 कोर | 8 जीबी | 100 एमबीपीएस |
| 20 डेटासेट, प्रतिदिन दो बार | 8 कोर | 16 जीबी | 1 जीबीपीएस |
| 50+ डेटासेट, DirectQuery | 16 कोर | 32 जीबी | 1 जीबीपीएस |
| भारी DirectQuery, कई समवर्ती उपयोगकर्ता | 16+ कोर | 64 जीबी | 10 जीबीपीएस |
मैशअप इंजन सेटिंग्स
गेटवे डेटा परिवर्तन के लिए पावर क्वेरी (मैशअप) इंजन का उपयोग करता है। गेटवे ऐप में कॉन्फ़िगर करें:
अधिकतम समवर्ती क्वेरीज़: डिफ़ॉल्ट सीपीयू कोर की संख्या 2 गुना है। I/O-बाउंड वर्कलोड के लिए वृद्धि (धीमे डेटा स्रोतों की प्रतीक्षा)। सीपीयू-बाउंड वर्कलोड (भारी परिवर्तन) के लिए कमी।
प्रति क्वेरी मेमोरी सीमा: डिफ़ॉल्ट कोई सीमा नहीं है। एक रनवे क्वेरी को सभी उपलब्ध रैम का उपभोग करने से रोकने के लिए एक सीमा निर्धारित करें (उदाहरण के लिए, 2 जीबी)।
नेटवर्क अनुकूलन
डेटा स्रोत के करीब गेटवे का पता लगाएं। गेटवे और डेटा स्रोत के बीच नेटवर्क विलंबता को प्रति रीफ्रेश प्रश्नों की संख्या से गुणा किया जाता है। डेटाबेस के समान डेटा सेंटर में एक गेटवे विलंबता को कम करता है।
एज़्योर से निकटता के आधार पर गेटवे का पता न लगाएं। एज़्योर सर्विस बस कनेक्शन एक एकल निरंतर टीसीपी कनेक्शन है। Azure की विलंबता प्रारंभिक कनेक्शन सेटअप को प्रभावित करती है लेकिन क्वेरी थ्रूपुट को नहीं।
वायर्ड कनेक्शन का उपयोग करें। कभी भी वाई-फाई पर प्रोडक्शन गेटवे न चलाएं। रुक-रुक कर होने वाली कनेक्टिविटी ताज़ा विफलता का कारण बनती है।
स्रोत पर क्वेरी अनुकूलन
गेटवे प्रदर्शन को बेहतर बनाने का सबसे तेज़ तरीका इसके द्वारा निष्पादित क्वेरी को अनुकूलित करना है:
- संपूर्ण तालिकाओं को आयात करने के बजाय कस्टम SQL क्वेरी का उपयोग करें (डेटा की मात्रा कम करें)
- WHERE क्लॉज और JOIN में प्रयुक्त कॉलम पर डेटाबेस इंडेक्स बनाएं
- जटिल डेटा मॉडल के लिए प्री-जॉइन्स और प्री-एग्रीगेशन वाले दृश्यों का उपयोग करें
- डेटाबेस में परिवर्तनों को आगे बढ़ाने के लिए पावर क्वेरी में क्वेरी फोल्डिंग सक्षम करें
- प्रति रिफ्रेश चक्र में डेटा की मात्रा कम करने के लिए वृद्धिशील रिफ्रेश लागू करें
सामान्य त्रुटियों का निवारण
"प्रवेश द्वार पहुंच योग्य नहीं है"
कारण: गेटवे सेवा बंद है, मशीन बंद है, या Azure से नेटवर्क कनेक्टिविटी अवरुद्ध है।
संकल्प:
- जांचें कि क्या गेटवे विंडोज सेवा चल रही है (services.msc)
- सत्यापित करें कि *.servicebus.windows.net पर आउटबाउंड HTTPS की अनुमति है
- यदि कॉर्पोरेट प्रॉक्सी के पीछे प्रॉक्सी सेटिंग्स जांचें
- सत्यापित करें कि गेटवे मशीन में इंटरनेट कनेक्टिविटी है
- जांचें कि क्या गेटवे संस्करण पुराना है (ऑटो-अपडेट चुपचाप विफल हो सकते हैं)
"डेटा स्रोत से कनेक्ट करने में असमर्थ"
कारण: ग़लत क्रेडेंशियल, डेटा स्रोत से नेटवर्क कनेक्टिविटी, या ड्राइवर समस्याएँ।
संकल्प:
- गेटवे कॉन्फ़िगरेशन ऐप में कनेक्शन का परीक्षण करें (डायग्नोस्टिक्स, फिर टेस्ट कनेक्शन)
- सत्यापित करें कि डेटा स्रोत सर्वर गेटवे मशीन (पिंग, टेलनेट से पोर्ट) तक पहुंच योग्य है
- सत्यापित करें कि क्रेडेंशियल सही हैं और खाता लॉक/समाप्त नहीं हुआ है
- Oracle और SAP के लिए, सत्यापित करें कि गेटवे मशीन पर आवश्यक क्लाइंट लाइब्रेरी स्थापित हैं
- जांचें कि डेटा स्रोत का फ़ायरवॉल गेटवे के आईपी से कनेक्शन की अनुमति देता है
"ऑन-प्रिमाइसेस डेटा गेटवे के रिफ्रेश होने में बहुत अधिक समय लग रहा है"
कारण: बड़े डेटासेट, धीमी क्वेरी, अपर्याप्त गेटवे संसाधन, या नेटवर्क बाधा।
संकल्प:
- डेटा वॉल्यूम कम करने के लिए वृद्धिशील रिफ्रेश सक्षम करें
- SQL क्वेरीज़ को अनुकूलित करें (इंडेक्स जोड़ें, कॉलम कम करें, पंक्तियाँ फ़िल्टर करें)
- रिफ्रेश के दौरान गेटवे मशीन सीपीयू और रैम के उपयोग की जांच करें
- समवर्ती भार को कम करने के लिए शेड्यूल को ताज़ा करें
- लोड वितरण के लिए दूसरा गेटवे नोड जोड़ने पर विचार करें
"डेटा स्रोत क्रेडेंशियल अमान्य हैं"
कारण: पासवर्ड बदल गया, खाता लॉक हो गया, या केर्बरोस डेलिगेशन गलत कॉन्फ़िगर हो गया।
संकल्प:
- पावर बीआई सेवा में क्रेडेंशियल पुनः दर्ज करें (डेटासेट सेटिंग्स, फिर गेटवे कनेक्शन)
- यदि कर्बेरोस के साथ Windows प्रमाणीकरण का उपयोग किया जा रहा है, तो सत्यापित करें:
- गेटवे सेवा खाते में सक्रिय निर्देशिका में प्रतिनिधिमंडल विशेषाधिकार हैं
- डेटा स्रोत के लिए SPN सही ढंग से कॉन्फ़िगर किए गए हैं
- केडीसी (डोमेन नियंत्रक) गेटवे से पहुंचा जा सकता है
"गेटवे संस्करण पुराना हो गया है"
कारण: स्वतः-अपडेट विफल हो गया या अक्षम कर दिया गया।
संकल्प:
- माइक्रोसॉफ्ट से नवीनतम गेटवे इंस्टॉलर डाउनलोड करें
- इंस्टॉलर को मौजूदा गेटवे मशीन पर चलाएं (यह जगह पर अपग्रेड होता है)
- क्लस्टर के लिए, अपग्रेड के बीच अंतराल के साथ एक समय में एक नोड को अपग्रेड करें
- अपग्रेड के बाद Power BI एडमिन पोर्टल में गेटवे संस्करण को सत्यापित करें
सुरक्षा सर्वोत्तम प्रथाएँ
न्यूनतम विशेषाधिकार का सिद्धांत
- गेटवे सेवा खाते में डेटा स्रोतों तक केवल पढ़ने के लिए पहुंच होनी चाहिए
- डोमेन एडमिन या डेटाबेस एडमिन खातों का उपयोग न करें
- यदि आपकी सुरक्षा नीति के लिए आवश्यक हो तो प्रति डेटा स्रोत प्रकार के लिए समर्पित सेवा खाते बनाएं
- सेवा खाता पासवर्ड को नियमित समय पर घुमाएं और गेटवे डेटा स्रोत कॉन्फ़िगरेशन को अपडेट करें
पुनर्प्राप्ति कुंजी प्रबंधन
पुनर्प्राप्ति कुंजी सभी स्थानीय रूप से संग्रहीत क्रेडेंशियल्स को एन्क्रिप्ट करती है। इसे डेटाबेस मास्टर कुंजी की तरह ही सावधानी से संभालें:
- एज़्योर की वॉल्ट या एंटरप्राइज पासवर्ड मैनेजर में स्टोर करें
- दस्तावेज़ जिसके पास पुनर्प्राप्ति कुंजी तक पहुंच है
- अपनी कुंजी प्रबंधन नीति में पुनर्प्राप्ति कुंजी रोटेशन शामिल करें
- पुनर्प्राप्ति कुंजी के साथ बैकअप से गेटवे को पुनर्स्थापित करके पुनर्प्राप्ति का परीक्षण करें
नेटवर्क विभाजन
गेटवे को ऐसे नेटवर्क सेगमेंट में रखें जो पहुंच सके:
- डेटा स्रोत सर्वर (एसक्यूएल सर्वर, पोस्टग्रेएसक्यूएल, ओरेकल, आदि)
- एज़्योर सर्विस बस (आउटबाउंड HTTPS)
- Azure AD (आउटबाउंड HTTPS)
अन्य सभी आवक और जावक यातायात को अवरुद्ध करें। गेटवे को किसी भी स्रोत से इनबाउंड कनेक्शन की आवश्यकता नहीं है।
ऑडिट ट्रेल
ट्रैक करने के लिए गेटवे मशीन पर Windows सुरक्षा ऑडिटिंग सक्षम करें:
- सेवा खाता लॉगऑन इवेंट
- गेटवे कॉन्फ़िगरेशन बदलता है
- डेटा स्रोत पहुंच पैटर्न
केंद्रीकृत निगरानी के लिए इन घटनाओं को अपने एसआईईएम (स्प्लंक, सेंटिनल, डेटाडॉग) को अग्रेषित करें।
प्रवासन और उन्नयन परिदृश्य
एक नई गेटवे मशीन पर माइग्रेट करना
- नई मशीन पर गेटवे स्थापित करें
- पंजीकरण के दौरान, "मौजूदा गेटवे को स्थानांतरित करें, पुनर्स्थापित करें या अधिग्रहण करें" चुनें
- मूल गेटवे से पुनर्प्राप्ति कुंजी दर्ज करें
- नई मशीन को सभी डेटा स्रोत कॉन्फ़िगरेशन और क्रेडेंशियल विरासत में मिले हैं
- Power BI एडमिन पोर्टल में कनेक्टेड दिखाए गए सभी डेटा स्रोतों को सत्यापित करें
- नई मशीन के आईपी को शामिल करने के लिए किसी भी आईपी-आधारित फ़ायरवॉल नियम को अपडेट करें
- पुरानी गेटवे मशीन को बंद करें
गेटवे संस्करणों का उन्नयन
माइक्रोसॉफ्ट मासिक रूप से गेटवे अपडेट जारी करता है। सर्वोत्तम प्रथाएँ:
- परिवर्तनों की अग्रिम सूचना के लिए गेटवे रिलीज़ नोट्स की सदस्यता लें
- पहले गैर-उत्पादन गेटवे क्लस्टर में नए संस्करणों का परीक्षण करें
- उत्पादन समूहों के लिए, 24 घंटे के अंतराल के साथ एक समय में एक नोड को अपग्रेड करें
- प्रत्येक नोड अपग्रेड के बाद ताज़ा सफलता दर सत्यापित करें
- नए संस्करण के मान्य होने तक पिछले संस्करण पर कम से कम एक नोड रखें
गेटवे क्लस्टर में एन-1 संस्करण संगतता का समर्थन करता है --- नोड्स को ठीक उसी संस्करण को चलाने की आवश्यकता नहीं है।
अक्सर पूछे जाने वाले प्रश्न
क्या मैं वर्चुअल मशीन पर गेटवे स्थापित कर सकता हूं?
हाँ। गेटवे भौतिक और आभासी मशीनों पर चलता है, जिसमें Azure VMs, AWS EC2 और ऑन-प्रिमाइसेस हाइपर-V या VMware शामिल हैं। Azure VMs के लिए, VNet डेटा गेटवे (प्रीमियम क्षमताओं के लिए पूर्वावलोकन में) का उपयोग करने पर विचार करें जो स्व-प्रबंधित गेटवे की आवश्यकता को पूरी तरह से समाप्त कर देता है। ऑन-प्रिमाइसेस वीएम के लिए, सुनिश्चित करें कि वीएम में समर्पित (साझा नहीं) सीपीयू और रैम संसाधन हैं, और हाइपरवाइजर आक्रामक रूप से संसाधनों को ओवरकमिट नहीं करता है।
एक गेटवे कितने डेटा स्रोतों का समर्थन कर सकता है?
प्रति गेटवे डेटा स्रोतों की संख्या पर कोई कठोर सीमा नहीं है। व्यवहार में, गेटवे आमतौर पर बिना किसी समस्या के 50 से 100 डेटा स्रोतों का समर्थन करते हैं। सीमित कारक ताज़ा विंडोज़ के दौरान समवर्ती क्वेरी लोड है, न कि कॉन्फ़िगर किए गए डेटा स्रोतों की संख्या। यदि ताज़ा समय ख़राब हो रहा है, तो अतिरिक्त गेटवे इंस्टॉलेशन बनाने के बजाय क्लस्टर नोड्स जोड़ें।
क्या गेटवे लिनक्स का समर्थन करता है?
नहीं, ऑन-प्रिमाइसेस डेटा गेटवे के लिए विंडोज़ (सर्वर 2016 या बाद का संस्करण) की आवश्यकता है। यदि आपके डेटा स्रोत लिनक्स पर चलते हैं, तो विंडोज़ मशीन पर गेटवे स्थापित करें जिसमें लिनक्स डेटा स्रोत सर्वर तक नेटवर्क पहुंच हो। गेटवे नेटवर्क पर डेटा स्रोत से जुड़ता है --- इसे डेटा स्रोत के समान ऑपरेटिंग सिस्टम पर चलने की आवश्यकता नहीं है।
क्या होता है यदि क्लस्टर में दोनों गेटवे नोड एक साथ ऑफ़लाइन हो जाते हैं?
सभी शेड्यूल किए गए रिफ्रेश विफल हो जाते हैं, और सभी DirectQuery कनेक्शन त्रुटियाँ लौटाते हैं। पावर बीआई सेवा ऑफ़लाइन स्थिति का पता लगाती है और गेटवे व्यवस्थापकों को सूचनाएं भेजती है (यदि कॉन्फ़िगर किया गया है)। कैश्ड डेटा (आयात मोड) का उपयोग करने वाली रिपोर्टें अंतिम सफलतापूर्वक ताज़ा किए गए डेटा को प्रदर्शित करना जारी रखती हैं। जब कम से कम एक नोड ऑनलाइन वापस आता है, तो लंबित ताज़ा अनुरोध स्वचालित रूप से संसाधित हो जाते हैं। इस परिदृश्य को रोकने के लिए, रखरखाव विंडो को व्यवस्थित करें और क्लस्टर नोड्स को अलग-अलग भौतिक बुनियादी ढांचे पर रखें।
क्या गेटवे वास्तविक समय स्ट्रीमिंग डेटा को संभाल सकता है?
गेटवे को क्वेरी-प्रतिक्रिया पैटर्न के लिए डिज़ाइन किया गया है, स्ट्रीमिंग के लिए नहीं। वास्तविक समय डेटा के लिए, Power BI स्ट्रीमिंग डेटासेट (जो गेटवे को पूरी तरह से बायपास करता है), Azure स्ट्रीम एनालिटिक्स, या Power BI वास्तविक समय डैशबोर्ड के साथ Azure इवेंट हब पर विचार करें। गेटवे ऑन-प्रिमाइसेस डेटाबेस तक लगभग वास्तविक समय पहुंच के लिए DirectQuery का समर्थन करता है, लेकिन प्रत्येक रिपोर्ट इंटरैक्शन निरंतर डेटा स्ट्रीम प्राप्त करने के बजाय एक नई क्वेरी ट्रिगर करता है।
लेखक
ECOSIRE Research and Development Team
ECOSIRE में एंटरप्राइज़-ग्रेड डिजिटल उत्पाद बना रहे हैं। Odoo एकीकरण, ई-कॉमर्स ऑटोमेशन, और AI-संचालित व्यावसायिक समाधानों पर अंतर्दृष्टि साझा कर रहे हैं।
संबंधित लेख
Power BI AI Features: Copilot, AutoML, and Predictive Analytics
Master Power BI AI features including Copilot for natural language reports, AutoML for predictions, anomaly detection, and smart narratives. Licensing guide.
Complete Guide to Power BI Dashboard Development
Learn how to build effective Power BI dashboards with KPI design, visual best practices, drill-through pages, bookmarks, mobile layouts, and RLS security.
Power BI Data Modeling: Star Schema Design for Business Intelligence
Master Power BI data modeling with star schema design, fact and dimension tables, DAX measures, calculation groups, time intelligence, and composite models.