Incremental Refresh in Power BI: Handling Large Datasets Efficiently

प्रत्येक पावर बीआई कार्यान्वयन अंततः एक ही दीवार से टकराता है: डेटासेट इतना बड़ा हो जाता है कि पूर्ण रीफ्रेश में बहुत अधिक समय लगता है, बहुत सारे संसाधनों का उपभोग होता है, और उपयोगकर्ताओं को डेटा की आवश्यकता होने से पहले उपलब्ध समय विंडो से अधिक हो जाता है।

50 मिलियन पंक्तियों वाली एक लेन-देन तालिका, जिसे हर 4 घंटे में पूरी तरह से ताज़ा किया जाता है, इसमें बहुत अधिक समय नहीं लगता है - यह उस डेटा को फिर से लोड करने में संसाधनों को बर्बाद करता है जो नहीं बदला है। इंक्रीमेंटल रिफ्रेश केवल नए और बदले हुए रिकॉर्ड को लोड करके इसे हल करता है, जबकि ऐतिहासिक डेटा को बनाए रखता है जो नहीं बदलता है। सही ढंग से किया गया, जिस डेटासेट को ताज़ा करने में पहले 3 घंटे लगते थे उसे 10 मिनट से कम समय में चालू किया जा सकता है।

यह मार्गदर्शिका पावर बीआई में पहले सिद्धांतों से लेकर उन्नत कॉन्फ़िगरेशन तक वृद्धिशील ताज़ा को कवर करती है - जिसमें कार्यान्वयन को तोड़ने वाली सामान्य गलतियाँ और सर्वोत्तम प्रथाएँ शामिल हैं जो उन्हें उत्पादन-विश्वसनीय बनाती हैं।

मुख्य बातें

तिथि के अनुसार वृद्धिशील ताज़ा विभाजन डेटासेट, प्रत्येक ताज़ा चक्र पर केवल हाल का डेटा लोड करना

तथ्य तालिका पर एक डेटाटाइम कॉलम और दो पावर क्वेरी पैरामीटर (रेंजस्टार्ट, रेंजएंड) की आवश्यकता है

ऐतिहासिक डेटा को पुराने विभाजनों में बनाए रखा जाता है जिन्हें प्रारंभिक लोड के बाद कभी भी दोबारा नहीं पूछा जाता है

10 से अधिक विभाजनों के साथ वृद्धिशील रिफ्रेश के लिए पावर बीआई प्रीमियम (या फैब्रिक) आवश्यक है

डेटा परिवर्तन का पता लगाएं विकल्प केवल उन विभाजनों को ताज़ा करके प्रसंस्करण को कम करता है जहां डेटा बदल गया है

हाइब्रिड तालिकाएँ (आयात और DirectQuery का संयोजन) ऐतिहासिक आयात विभाजन के साथ-साथ वास्तविक समय डेटा को सक्षम करती हैं

उचित कॉन्फ़िगरेशन के लिए पावर क्वेरी फ़ोल्डिंग को समझने की आवश्यकता होती है - नॉन-फ़ोल्डेबल क्वेरीज़ वृद्धिशील ताज़ा को तोड़ देती हैं

XMLA एंडपॉइंट और तृतीय-पक्ष टूल के माध्यम से विभाजन स्वास्थ्य की निगरानी करना मौन विफलताओं को रोकता है

इंक्रीमेंटल रिफ्रेश कैसे काम करता है

वृद्धिशील रिफ्रेश को समझना यह समझने से शुरू होता है कि Power BI डेटा को कैसे विभाजित करता है।

एक मानक आयात मॉडल में, संपूर्ण डेटासेट एक ही विभाजन में रहता है। प्रत्येक रिफ्रेश इस विभाजन को पूरी तरह से बदल देता है। छोटे डेटासेट के लिए, यह ठीक है। बड़ी तालिकाओं के लिए, यह ऊपर वर्णित समस्याएँ पैदा करता है।

वृद्धिशील ताज़ा तथ्य तालिका को कई विभाजनों में विभाजित करता है, प्रत्येक एक विशिष्ट दिनांक सीमा को कवर करता है:

विभाजन 1: 2020-01-01 से 2020-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 2: 2021-01-01 से 2021-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 3: 2022-01-01 से 2022-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 4: 2023-01-01 से 2023-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 5: 2024-01-01 से 2024-12-31 (मासिक रूप से ताज़ा)
विभाजन 6: 2025-01-01 से 2025-03-31 (प्रतिदिन ताज़ा)
विभाजन 7: 2025-04-01 से वर्तमान (हर घंटे या मांग पर ताज़ा)

प्रत्येक शेड्यूल किए गए रिफ्रेश पर, केवल सबसे हालिया विभाजन (इस उदाहरण में 5, 6, और 7) संसाधित किए जाते हैं। ऐतिहासिक विभाजन तब से बरकरार हैं जब उन्हें पहली बार लोड किया गया था। इसका मतलब है कि ताज़ा चक्र कुल डेटा का केवल एक अंश संसाधित करता है - समय, मेमोरी और स्रोत सिस्टम लोड को नाटकीय रूप से कम करता है।

पूर्वापेक्षाएँ और आवश्यकताएँ

वृद्धिशील रिफ्रेश को कॉन्फ़िगर करने से पहले, सत्यापित करें कि ये शर्तें पूरी हो गई हैं:

लाइसेंसिंग: पावर बीआई प्रो (सीमाओं के साथ) और पावर बीआई प्रीमियम/फैब्रिक (पूर्ण क्षमता) में वृद्धिशील रिफ्रेश उपलब्ध है। प्रो के साथ, आप 10 ताज़ा अवधि तक कॉन्फ़िगर कर सकते हैं। प्रीमियम इस सीमा को हटा देता है और "डेटा परिवर्तन का पता लगाएं" सुविधा जोड़ता है।

डेटाटाइम कॉलम: तथ्य तालिका में एक डेटाटाइम कॉलम होना चाहिए (दिनांक कुंजी पूर्णांक नहीं - एक वास्तविक डेटाटाइम प्रकार होना चाहिए) जिसका उपयोग पावर बीआई डेटा को विभाजित करने के लिए करेगा। यह आम तौर पर लेन-देन की तारीख, ईवेंट टाइमस्टैम्प, या निर्मित कॉलम होता है।

क्वेरी फोल्डिंग: तथ्य तालिका को लोड करने वाली पावर क्वेरी क्वेरी को क्वेरी फोल्डिंग का समर्थन करना चाहिए - पावर क्वेरी परिवर्तन चरणों को स्रोत क्वेरी (एसक्यूएल, आदि) में अनुवाद करने की क्षमता जिसे स्रोत सिस्टम निष्पादित करता है। यदि क्वेरी फोल्डिंग टूट जाती है, तो वृद्धिशील रिफ्रेश चुपचाप विफल हो जाता है - यह उद्देश्य को विफल करते हुए, प्रत्येक रिफ्रेश पर सभी डेटा लोड करता है।

स्रोत सिस्टम समर्थन: स्रोत को दिनांक-सीमा फ़िल्टरिंग का कुशलतापूर्वक समर्थन करना चाहिए। डेटाटाइम कॉलम पर इंडेक्स के बिना एक स्रोत तालिका वृद्धिशील रीफ्रेश कॉन्फ़िगर के साथ भी धीमी रीफ्रेश उत्पन्न करेगी, क्योंकि प्रत्येक विभाजन रीफ्रेश दिनांक सीमा में रिकॉर्ड ढूंढने के लिए एक पूर्ण तालिका स्कैन करेगा।

चरण-दर-चरण कॉन्फ़िगरेशन

चरण 1: आवश्यक पावर क्वेरी पैरामीटर बनाएं

Power BI डेस्कटॉप में, Power Query संपादक खोलें। पैरामीटर प्रबंधित करें → नया पैरामीटर पर जाएँ।

बिल्कुल इस प्रकार दो पैरामीटर बनाएं (नाम केस-संवेदी हैं और बिल्कुल मेल खाने चाहिए):

पैरामीटर	नाम	प्रकार	मूल्य
रेंज प्रारंभ	रेंजस्टार्ट	दिनांक/समय	कोई ऐतिहासिक तारीख
रेंज अंत	रेंजएंड	दिनांक/समय	वर्तमान तिथि

ये पैरामीटर दिनांक/समय प्रकार के होने चाहिए, दिनांक नहीं। उन्हें रनटाइम पर पावर बीआई के रिफ्रेश इंजन द्वारा ओवरराइड किया जाएगा, लेकिन उन्हें विकास और परीक्षण के लिए वैध डिफ़ॉल्ट मानों की आवश्यकता होगी।

चरण 2: इन मापदंडों का उपयोग करके तथ्य तालिका को फ़िल्टर करें

पावर क्वेरी एडिटर में, अपनी तथ्य तालिका चुनें। पैरामीटर का उपयोग करके डेटाटाइम कॉलम पर फ़िल्टर लागू करें:

= Table.SelectRows(Source, each [TransactionDate] >= RangeStart and [TransactionDate] < RangeEnd)

यह फ़िल्टरिंग चरण महत्वपूर्ण है: इसे डेटा स्रोत के अनुरूप होना चाहिए। फोल्डिंग को सत्यापित करने के लिए, अंतिम क्वेरी चरण पर राइट-क्लिक करें और जांचें कि क्या "मूल क्वेरी देखें" उपलब्ध है। यदि यह धूसर हो गया है, तो फोल्डिंग टूट गई है - जांच करें कि इसके ऊपर कौन से परिवर्तन चरण फोल्ड श्रृंखला को तोड़ रहे हैं।

चरण 3: क्वेरी फोल्डिंग सत्यापित करें

क्वेरी फ़ोल्डिंग सबसे अधिक निम्न कारणों से टूटती है:

कस्टम फ़ंक्शंस जिनका SQL में अनुवाद नहीं किया जा सकता
दो प्रश्नों को मर्ज करना (जोड़ना) जहां एक या दोनों मुड़ते नहीं हैं
कुछ पाठ परिवर्तन कार्य (Text.Upper, Text.PadStart)
सूची संचालन का उपयोग करना (सूची शामिल है)
एक इंडेक्स कॉलम जोड़ना
निश्चित प्रकार के रूपांतरण संचालन

यदि फोल्डिंग टूट जाती है, तो दिनांक फ़िल्टर के बाद समस्याग्रस्त संचालन को बाद के चरण में धकेलने के लिए क्वेरी को दोबारा सक्रिय करें - या पावर क्वेरी के बजाय स्रोत डेटाबेस में एक दृश्य में परिवर्तन करें।

चरण 4: वृद्धिशील ताज़ा नीति कॉन्फ़िगर करें

Power BI डेस्कटॉप में, फ़ील्ड्स फलक → इंक्रीमेंटल रिफ्रेश में तथ्य तालिका पर राइट-क्लिक करें।

कॉन्फ़िगरेशन विकल्प:

पिछले एन कैलेंडर वर्ष/महीने/दिनों में स्टोर पंक्तियाँ: यह मॉडल में रखी गई कुल ऐतिहासिक विंडो को परिभाषित करता है। इससे पुराना डेटा स्वचालित रूप से मॉडल से हटा दिया जाता है (विभाजन हटा दिया जाता है)।
केवल पिछले एन कैलेंडर वर्ष/माह/दिनों में पंक्तियों को ताज़ा करें: यह रोलिंग विंडो को परिभाषित करता है जो प्रत्येक चक्र पर फिर से ताज़ा होती है। इस विंडो से पुराने डेटा को ऐतिहासिक (अपरिवर्तनीय) माना जाता है और फिर कभी ताज़ा नहीं किया जाता है।
डेटा परिवर्तनों का पता लगाएं: (केवल प्रीमियम) यह पता लगाने के लिए एक अलग डेटाटाइम कॉलम (आमतौर पर "अंतिम संशोधित" कॉलम) का उपयोग करता है कि कौन से ऐतिहासिक विभाजन ने डेटा बदल दिया है और केवल उन विभाजनों को फिर से संसाधित करता है।

5 साल के इतिहास के साथ लेनदेन संबंधी डेटाबेस के लिए उदाहरण कॉन्फ़िगरेशन:

पिछले 5 वर्षों में स्टोर पंक्तियाँ
केवल पिछले 3 दिनों में पंक्तियाँ ताज़ा करें

यह 5 वर्षों के डेटा को कवर करने वाले विभाजन बनाता है, लेकिन प्रत्येक चक्र पर केवल पिछले 3 दिनों के विभाजन ताज़ा होते हैं।

चरण 5: प्रकाशित करें और सत्यापित करें

रिपोर्ट को Power BI सेवा पर प्रकाशित करें. प्रकाशन के बाद पहले रिफ्रेश में बाद के रिफ्रेश की तुलना में अधिक समय लगेगा - यह सभी ऐतिहासिक डेटा को लोड करता है और पहली बार सभी विभाजन बनाता है। यह अपेक्षित है.

उन्नत कॉन्फ़िगरेशन: डेटा परिवर्तनों का पता लगाएं

प्रीमियम में "डेटा परिवर्तन का पता लगाएं" विकल्प दक्षता की एक और परत जोड़ता है। यह एक निर्दिष्ट कॉलम (आमतौर पर एक last_modified_date कॉलम) को क्वेरी करके यह निर्धारित करने के लिए काम करता है कि ऐतिहासिक विभाजन में कोई रिकॉर्ड अपडेट किया गया है या नहीं। केवल वही विभाजन ताज़ा किये जाते हैं जहाँ डेटा वास्तव में बदल गया है।

डेटा परिवर्तनों का पता लगाए बिना: 3-दिवसीय रोलिंग विंडो हमेशा ताज़ा रहती है, भले ही पिछले 3 दिनों में कोई डेटा नहीं बदला गया हो।

डेटा परिवर्तनों का पता लगाने के साथ: रीफ्रेश इंजन यह जांचता है कि प्रत्येक विभाजन को संसाधित करने का निर्णय लेने से पहले रोलिंग विंडो में कोई रिकॉर्ड संशोधित किया गया था या नहीं। यदि सोमवार का डेटा सोमवार रात को ताज़ा किया गया था और तब से कोई रिकॉर्ड संशोधित नहीं किया गया है, तो मंगलवार रात का ताज़ा सोमवार विभाजन को छोड़ देता है।

यह उन परिदृश्यों के लिए विशेष रूप से मूल्यवान है जहां:

स्रोत डेटा एक बार लिखा जाता है और शायद ही कभी अद्यतन किया जाता है (अपरिवर्तनीय केवल परिशिष्ट घटनाएँ)
रोलिंग विंडो बड़ी है (उदाहरण के लिए, 30 दिन) लेकिन अधिकांश दिनों में कोई बदलाव नहीं होता है
स्रोत सिस्टम क्वेरी क्षमता सीमित है

पता लगाए गए डेटा परिवर्तन कॉलम को स्रोत डेटाबेस में अनुक्रमित किया जाना चाहिए - रिफ्रेश इंजन प्रत्येक रिफ्रेश चक्र पर प्रत्येक विभाजन के लिए इस कॉलम पर सवाल उठाता है।

हाइब्रिड तालिकाएँ: वास्तविक समय + ऐतिहासिक डेटा

पावर बीआई फैब्रिक/प्रीमियम हाइब्रिड टेबल पेश करता है - आयात मोड (ऐतिहासिक विभाजन) और डायरेक्टक्वेरी मोड (वर्तमान डेटा) का एक शक्तिशाली संयोजन। यह डैशबोर्ड को सक्षम बनाता है जो ऐतिहासिक आयात डेटा के साथ-साथ वर्तमान मिनट में अपडेट किया गया डेटा दिखाता है।

हाइब्रिड तालिका कॉन्फ़िगरेशन में:

ऐतिहासिक विभाजन (कल और पुराने) आयात मोड में हैं - तेज़, कैश्ड, पूरी तरह से एकत्रीकरण योग्य
वर्तमान विभाजन DirectQuery मोड में है - क्वेरीज़ स्रोत डेटाबेस के विरुद्ध लाइव चलती हैं

उपयोगकर्ता अनुभव निर्बाध है - प्रश्न दोनों मोड में पारदर्शी रूप से फैले हुए हैं। "इस सप्ताह बनाम पिछले सप्ताह बिक्री" के लिए एक क्वेरी आयात विभाजन से कल के डेटा और DirectQuery के माध्यम से आज के डेटा को खींचती है, और उन्हें एक परिणाम में जोड़ती है।

हाइब्रिड तालिकाओं के लिए विचार:

DirectQuery का प्रदर्शन पूरी तरह से स्रोत डेटाबेस के प्रदर्शन पर निर्भर करता है - धीमे डेटाबेस का अर्थ है धीमी वर्तमान-दिन की क्वेरीज़
DirectQuery विभाजन को आयात मोड अनुकूलन से लाभ नहीं होता है (कोई VertiPaq संपीड़न नहीं, कोई पूर्व-एकत्रीकरण नहीं)
एक प्रीमियम या फैब्रिक कार्यक्षेत्र की आवश्यकता है

वृद्धिशील ताज़ा स्वास्थ्य की निगरानी करना

वृद्धिशील ताज़ा विफलताएँ अक्सर मौन रहती हैं - मॉडल "सफलतापूर्वक ताज़ा" के रूप में दिखाता है, भले ही कुछ विभाजन विफल हो गए हों या पूर्ण ताज़ा पर वापस आ गए हों। उत्पादन की विश्वसनीयता के लिए निगरानी आवश्यक है।

एक्सएमएलए एंडपॉइंट निरीक्षण: पावर बीआई प्रीमियम एक एक्सएमएलए एंडपॉइंट को उजागर करता है जिससे एसक्यूएल सर्वर मैनेजमेंट स्टूडियो (एसएसएमएस), टेबुलर एडिटर, या एज़्योर एनालिसिस सर्विसेज जैसे टूल कनेक्ट हो सकते हैं। वहां से, आप प्रत्येक विभाजन के लिए अंतिम ताज़ा समय देखने के लिए विभाजन मेटाडेटा को क्वेरी कर सकते हैं और क्या कोई विभाजन त्रुटि स्थिति में है।

सारणीबद्ध संपादक 2 (निःशुल्क): XMLA के माध्यम से प्रीमियम कार्यक्षेत्र से कनेक्ट करें और मॉडल में विभाजन तालिका का निरीक्षण करें। प्रत्येक विभाजन अपना नाम, दिनांक सीमा, अंतिम ताज़ा टाइमस्टैम्प और स्थिति दिखाता है। वृद्धिशील ताज़ा समस्याओं के निदान के लिए यह सबसे व्यावहारिक उपकरण है।

पावर बीआई गतिविधि लॉग: व्यवस्थापक गतिविधि लॉग ताज़ा संचालन को रिकॉर्ड करता है, जिसमें कौन से विभाजन संसाधित किए गए और कोई त्रुटि शामिल है। Power BI REST API के माध्यम से उपलब्ध है।

सामान्य विफलता पैटर्न:

| समस्या | लक्षण | संकल्प | |-------|----| | क्वेरी फोल्डिंग टूट गई | प्रत्येक चक्र पर पूर्ण ताज़ा, धीमा ताज़ा समय | फोल्डिंग को पुनर्स्थापित करने के लिए रिफैक्टर पावर क्वेरी | | डेटाटाइम कॉलम पर अनुपलब्ध अनुक्रमणिका | धीमा विभाजन ताज़ा होता है | स्रोत डेटाबेस में अनुक्रमणिका जोड़ें | | स्रोत डेटा परिवर्तन कैप्चर नहीं किए गए | ऐतिहासिक विभाजनों में पुराना डेटा है | डेटा परिवर्तनों का पता लगाने, या रोलिंग विंडो को चौड़ा करने में सक्षम करें | | विभाजन संख्या सीमा से अधिक है | 10 विभाजनों के बाद रिफ्रेश विफल हो जाता है (प्रो) | प्रीमियम या फैब्रिक में अपग्रेड करें | | समय क्षेत्र बेमेल | प्रत्येक विभाजन में गलत रिकॉर्ड | सुनिश्चित करें कि रेंजस्टार्ट/रेंजएंड यूटीसी | का उपयोग करें

अभ्यास में क्वेरी फ़ोल्डिंग सत्यापन

क्वेरी फ़ोल्डिंग सबसे आम कारण है जिसके कारण वृद्धिशील रिफ्रेश अपना वादा किया गया प्रदर्शन लाभ प्रदान करने में विफल रहता है। सामान्य फोल्डिंग ब्रेक का निदान और मरम्मत कैसे करें, यहां बताया गया है।

टेस्ट 1: मूल क्वेरी देखें। पावर क्वेरी में रेंजस्टार्ट/रेंजएंड फ़िल्टर चरण जोड़ने के बाद, चरण पर राइट-क्लिक करें। यदि "मूल क्वेरी देखें" उपलब्ध है और दिनांक सीमा को फ़िल्टर करने वाले WHERE क्लॉज के साथ एक SQL क्वेरी दिखाता है, तो फोल्डिंग काम कर रही है।

टेस्ट 2: जेनरेटेड एसक्यूएल की जांच करें। मूल क्वेरी में कुछ ऐसा होना चाहिए:

WHERE [TransactionDate] >= @RangeStart AND [TransactionDate] < @RangeEnd

यदि WHERE क्लॉज गायब है, तो फोल्डिंग टूट गई है और स्रोत से सभी डेटा लोड करने के बाद पावर क्वेरी के इंजन में फ़िल्टर लागू किया जा रहा है।

फ़ोल्डिंग को पुनर्स्थापित करना: यदि किसी कस्टम ट्रांसफ़ॉर्मेशन ने फ़ोल्डिंग को तोड़ दिया है, तो उसे दिनांक फ़िल्टर चरण के बाद स्थानांतरित करें, या स्रोत डेटाबेस में SQL व्यू में ट्रांसफ़ॉर्मेशन करें और तालिका के बजाय पावर बीआई को व्यू से कनेक्ट करें।

अक्सर पूछे जाने वाले प्रश्न

क्या वृद्धिशील रिफ्रेश सभी डेटा स्रोतों के साथ काम करता है?

इंक्रीमेंटल रिफ्रेश किसी भी डेटा स्रोत के साथ काम करता है जो क्वेरी फोल्डिंग और डेट-रेंज फ़िल्टरिंग का समर्थन करता है, जिसमें SQL सर्वर, Azure SQL, PostgreSQL, स्नोफ्लेक, BigQuery, Azure Synapse और Databricks शामिल हैं। यह उन स्रोतों के साथ अच्छी तरह से काम नहीं करता है जो क्वेरी फोल्डिंग (एक्सेल फ़ाइलें, फ्लैट सीएसवी, कुछ आरईएसटी एपीआई) का समर्थन नहीं करते हैं - उन मामलों में, पूर्ण रीफ्रेश अभी भी आवश्यक है। गैर-फ़ोल्डेबल स्रोतों के लिए, Power BI कनेक्ट होने से पहले SQL डेटाबेस में डेटा को स्टेज करना अनुशंसित समाधान है।

वृद्धिशील रिफ्रेश के लिए किस पावर बीआई लाइसेंस की आवश्यकता है?

वृद्धिशील रिफ्रेश पावर बीआई प्रो (10 रिफ्रेश अवधि तक सीमित), पावर बीआई प्रीमियम प्रति क्षमता, पावर बीआई प्रीमियम प्रति उपयोगकर्ता (पीपीयू), और माइक्रोसॉफ्ट फैब्रिक क्षमताओं में उपलब्ध है। "डेटा परिवर्तनों का पता लगाएं" सुविधा और हाइब्रिड तालिकाओं के लिए प्रीमियम या फैब्रिक की आवश्यकता होती है। 10 से अधिक ऐतिहासिक विभाजन वाले अधिकांश उद्यम कार्यान्वयन के लिए, प्रीमियम या फैब्रिक की आवश्यकता होती है।

वृद्धिशील रिफ्रेश देर से आने वाले डेटा को कैसे संभालता है?

देर से आने वाला डेटा - रिकॉर्ड जो उनके लेनदेन की तारीख के बाद आते हैं (उदाहरण के लिए, दिसंबर लेनदेन जो जनवरी के डेटा निकालने में आता है) - देर से आने वाले डेटा को पकड़ने के लिए रोलिंग रीफ्रेश विंडो को पर्याप्त चौड़ा सेट करके नियंत्रित किया जाता है। यदि डेटा 7 दिनों तक देरी से आ सकता है, तो रोलिंग विंडो को 14 दिनों पर सेट करने से यह सुनिश्चित होता है कि संबंधित विभाजन के दोबारा ताज़ा होने पर देर से आने वाले डेटा को कैप्चर किया जाएगा। वैकल्पिक रूप से, अंतिम-संशोधित कॉलम के साथ डेटा परिवर्तन विकल्प का पता लगाएं, रोलिंग विंडो सेटिंग की परवाह किए बिना देर से आगमन को कैप्चर करता है।

क्या वृद्धिशील रिफ्रेश केवल तथ्यों पर ही नहीं, बल्कि आयाम तालिकाओं पर भी काम कर सकता है?

इंक्रीमेंटल रिफ्रेश को बड़ी तथ्य तालिकाओं के लिए डिज़ाइन किया गया है और इसके लिए डेटाटाइम फ़िल्टर कॉलम की आवश्यकता होती है। अधिकांश आयाम तालिकाओं (उत्पाद, ग्राहक, स्थान) में उपयुक्त डेटाटाइम विभाजन कॉलम नहीं होता है और वे इतने छोटे होते हैं कि पूर्ण ताज़ा करना उपयुक्त होता है। धीरे-धीरे बदलती आयाम तालिकाओं के लिए जो बड़ी हो गई हैं (50M+ पंक्तियों वाली ग्राहक तालिकाएं), एक वैकल्पिक दृष्टिकोण हाल ही में बदले गए रिकॉर्ड को फ़िल्टर करने और Power BI के बजाय डेटाबेस परत में इतिहास प्रतिधारण को संभालने के लिए स्रोत डेटाबेस में SQL दृश्यों का उपयोग करना है।

मैं कैसे देखूं कि मेरे वृद्धिशील ताज़ा मॉडल में कौन से विभाजन मौजूद हैं?

सबसे आसान तरीका XMLA एंडपॉइंट के माध्यम से टेबुलर एडिटर (मुफ़्त संस्करण 2) को अपने पावर बीआई प्रीमियम कार्यक्षेत्र से कनेक्ट करना है। तालिकाओं → [आपकी तालिका] → विभाजन के अंतर्गत, आप सभी बनाए गए विभाजन उनकी दिनांक सीमाओं और अंतिम संसाधित टाइमस्टैम्प के साथ देखेंगे। SQL सर्वर प्रबंधन स्टूडियो (SSMS) XMLA के माध्यम से भी जुड़ता है और ऑब्जेक्ट एक्सप्लोरर में विभाजन विवरण दिखाता है।

यदि वृद्धिशील रिफ्रेश आंशिक रूप से विफल हो जाता है तो क्या होगा?

यदि रिफ्रेश बीच में विफल हो जाता है, तो Power BI विफल विभाजनों को पुनः प्रयास करता है। विफलता से पहले सफलतापूर्वक पूर्ण किए गए विभाजनों को दोबारा संसाधित नहीं किया जाता है - केवल विफल विभाजनों को पुनः प्रयास किया जाता है। इस पुनः प्रयास व्यवहार का मतलब है कि पूर्ण रीफ्रेश की तुलना में वृद्धिशील रीफ्रेश क्षणिक स्रोत सिस्टम आउटेज के प्रति अधिक लचीला है। यदि कोई विभाजन लगातार विफल रहता है, तो विभाजन अपनी अंतिम सफलतापूर्वक लोड की गई स्थिति में रहता है जबकि नए विभाजन सामान्य रूप से ताज़ा होते रहते हैं।

अगले चरण

वृद्धिशील रिफ्रेश किसी भी पावर बीआई कार्यान्वयन के लिए मूलभूत है जो बड़े लेनदेन संबंधी डेटासेट को संभालता है। इसे शुरू से ही सही करना - उचित क्वेरी फोल्डिंग, उपयुक्त रोलिंग विंडो और मॉनिटरिंग के साथ - प्रदर्शन समस्याओं को रोकता है जो बाद में महंगी रीआर्किटेक्टिंग को मजबूर करती हैं।

ECOSIRE की पावर बीआई प्रदर्शन अनुकूलन सेवाएं में बड़े पैमाने पर एंटरप्राइज़ डेटासेट के लिए वृद्धिशील ताज़ा डिज़ाइन और कार्यान्वयन शामिल है। अपने वर्तमान रिफ्रेश आर्किटेक्चर का आकलन करने और अनुकूलन अवसरों की पहचान करने के लिए हमसे संपर्क करें।

मुख्य बातें

तिथि के अनुसार वृद्धिशील ताज़ा विभाजन डेटासेट, प्रत्येक ताज़ा चक्र पर केवल हाल का डेटा लोड करना

तथ्य तालिका पर एक डेटाटाइम कॉलम और दो पावर क्वेरी पैरामीटर (रेंजस्टार्ट, रेंजएंड) की आवश्यकता है

ऐतिहासिक डेटा को पुराने विभाजनों में बनाए रखा जाता है जिन्हें प्रारंभिक लोड के बाद कभी भी दोबारा नहीं पूछा जाता है

10 से अधिक विभाजनों के साथ वृद्धिशील रिफ्रेश के लिए पावर बीआई प्रीमियम (या फैब्रिक) आवश्यक है

डेटा परिवर्तन का पता लगाएं विकल्प केवल उन विभाजनों को ताज़ा करके प्रसंस्करण को कम करता है जहां डेटा बदल गया है

हाइब्रिड तालिकाएँ (आयात और DirectQuery का संयोजन) ऐतिहासिक आयात विभाजन के साथ-साथ वास्तविक समय डेटा को सक्षम करती हैं

उचित कॉन्फ़िगरेशन के लिए पावर क्वेरी फ़ोल्डिंग को समझने की आवश्यकता होती है - नॉन-फ़ोल्डेबल क्वेरीज़ वृद्धिशील ताज़ा को तोड़ देती हैं

XMLA एंडपॉइंट और तृतीय-पक्ष टूल के माध्यम से विभाजन स्वास्थ्य की निगरानी करना मौन विफलताओं को रोकता है

इंक्रीमेंटल रिफ्रेश कैसे काम करता है

विभाजन 1: 2020-01-01 से 2020-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 2: 2021-01-01 से 2021-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 3: 2022-01-01 से 2022-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 4: 2023-01-01 से 2023-12-31 (ऐतिहासिक, कभी ताज़ा नहीं)
विभाजन 5: 2024-01-01 से 2024-12-31 (मासिक रूप से ताज़ा)
विभाजन 6: 2025-01-01 से 2025-03-31 (प्रतिदिन ताज़ा)
विभाजन 7: 2025-04-01 से वर्तमान (हर घंटे या मांग पर ताज़ा)

पूर्वापेक्षाएँ और आवश्यकताएँ

चरण-दर-चरण कॉन्फ़िगरेशन

चरण 1: आवश्यक पावर क्वेरी पैरामीटर बनाएं

पैरामीटर	नाम	प्रकार	मूल्य
रेंज प्रारंभ	रेंजस्टार्ट	दिनांक/समय	कोई ऐतिहासिक तारीख
रेंज अंत	रेंजएंड	दिनांक/समय	वर्तमान तिथि

चरण 2: इन मापदंडों का उपयोग करके तथ्य तालिका को फ़िल्टर करें

= Table.SelectRows(Source, each [TransactionDate] >= RangeStart and [TransactionDate] < RangeEnd)

चरण 3: क्वेरी फोल्डिंग सत्यापित करें

क्वेरी फ़ोल्डिंग सबसे अधिक निम्न कारणों से टूटती है:

कस्टम फ़ंक्शंस जिनका SQL में अनुवाद नहीं किया जा सकता
दो प्रश्नों को मर्ज करना (जोड़ना) जहां एक या दोनों मुड़ते नहीं हैं
कुछ पाठ परिवर्तन कार्य (Text.Upper, Text.PadStart)
सूची संचालन का उपयोग करना (सूची शामिल है)
एक इंडेक्स कॉलम जोड़ना
निश्चित प्रकार के रूपांतरण संचालन

चरण 4: वृद्धिशील ताज़ा नीति कॉन्फ़िगर करें

कॉन्फ़िगरेशन विकल्प:

पिछले एन कैलेंडर वर्ष/महीने/दिनों में स्टोर पंक्तियाँ: यह मॉडल में रखी गई कुल ऐतिहासिक विंडो को परिभाषित करता है। इससे पुराना डेटा स्वचालित रूप से मॉडल से हटा दिया जाता है (विभाजन हटा दिया जाता है)।
केवल पिछले एन कैलेंडर वर्ष/माह/दिनों में पंक्तियों को ताज़ा करें: यह रोलिंग विंडो को परिभाषित करता है जो प्रत्येक चक्र पर फिर से ताज़ा होती है। इस विंडो से पुराने डेटा को ऐतिहासिक (अपरिवर्तनीय) माना जाता है और फिर कभी ताज़ा नहीं किया जाता है।
डेटा परिवर्तनों का पता लगाएं: (केवल प्रीमियम) यह पता लगाने के लिए एक अलग डेटाटाइम कॉलम (आमतौर पर "अंतिम संशोधित" कॉलम) का उपयोग करता है कि कौन से ऐतिहासिक विभाजन ने डेटा बदल दिया है और केवल उन विभाजनों को फिर से संसाधित करता है।

5 साल के इतिहास के साथ लेनदेन संबंधी डेटाबेस के लिए उदाहरण कॉन्फ़िगरेशन:

पिछले 5 वर्षों में स्टोर पंक्तियाँ
केवल पिछले 3 दिनों में पंक्तियाँ ताज़ा करें

चरण 5: प्रकाशित करें और सत्यापित करें

उन्नत कॉन्फ़िगरेशन: डेटा परिवर्तनों का पता लगाएं

यह उन परिदृश्यों के लिए विशेष रूप से मूल्यवान है जहां:

स्रोत डेटा एक बार लिखा जाता है और शायद ही कभी अद्यतन किया जाता है (अपरिवर्तनीय केवल परिशिष्ट घटनाएँ)
रोलिंग विंडो बड़ी है (उदाहरण के लिए, 30 दिन) लेकिन अधिकांश दिनों में कोई बदलाव नहीं होता है
स्रोत सिस्टम क्वेरी क्षमता सीमित है

हाइब्रिड तालिकाएँ: वास्तविक समय + ऐतिहासिक डेटा

हाइब्रिड तालिका कॉन्फ़िगरेशन में:

ऐतिहासिक विभाजन (कल और पुराने) आयात मोड में हैं - तेज़, कैश्ड, पूरी तरह से एकत्रीकरण योग्य
वर्तमान विभाजन DirectQuery मोड में है - क्वेरीज़ स्रोत डेटाबेस के विरुद्ध लाइव चलती हैं

हाइब्रिड तालिकाओं के लिए विचार:

DirectQuery का प्रदर्शन पूरी तरह से स्रोत डेटाबेस के प्रदर्शन पर निर्भर करता है - धीमे डेटाबेस का अर्थ है धीमी वर्तमान-दिन की क्वेरीज़
DirectQuery विभाजन को आयात मोड अनुकूलन से लाभ नहीं होता है (कोई VertiPaq संपीड़न नहीं, कोई पूर्व-एकत्रीकरण नहीं)
एक प्रीमियम या फैब्रिक कार्यक्षेत्र की आवश्यकता है

वृद्धिशील ताज़ा स्वास्थ्य की निगरानी करना

सामान्य विफलता पैटर्न:

अभ्यास में क्वेरी फ़ोल्डिंग सत्यापन

टेस्ट 2: जेनरेटेड एसक्यूएल की जांच करें। मूल क्वेरी में कुछ ऐसा होना चाहिए:

WHERE [TransactionDate] >= @RangeStart AND [TransactionDate] < @RangeEnd

अक्सर पूछे जाने वाले प्रश्न

क्या वृद्धिशील रिफ्रेश सभी डेटा स्रोतों के साथ काम करता है?

वृद्धिशील रिफ्रेश के लिए किस पावर बीआई लाइसेंस की आवश्यकता है?

वृद्धिशील रिफ्रेश देर से आने वाले डेटा को कैसे संभालता है?

मैं कैसे देखूं कि मेरे वृद्धिशील ताज़ा मॉडल में कौन से विभाजन मौजूद हैं?

यदि वृद्धिशील रिफ्रेश आंशिक रूप से विफल हो जाता है तो क्या होगा?

Incremental Refresh in Power BI: Handling Large Datasets Efficiently

इंक्रीमेंटल रिफ्रेश कैसे काम करता है

पूर्वापेक्षाएँ और आवश्यकताएँ

चरण-दर-चरण कॉन्फ़िगरेशन

उन्नत कॉन्फ़िगरेशन: डेटा परिवर्तनों का पता लगाएं

हाइब्रिड तालिकाएँ: वास्तविक समय + ऐतिहासिक डेटा

वृद्धिशील ताज़ा स्वास्थ्य की निगरानी करना

अभ्यास में क्वेरी फ़ोल्डिंग सत्यापन

अक्सर पूछे जाने वाले प्रश्न

अगले चरण

डेटा-संचालित निर्णय अनलॉक करें

संबंधित लेख

Microsoft Fabric vs Power BI: What Is the Difference, and What Do You Actually Need in 2026?

Power BI Consultant vs In-House Team: Cost, Speed, and When to Hire Help (2026)

Power BI Embedded: Costs, Capacity Sizing, and When It Beats Building Your Own Dashboards

Performance & Scalability से और अधिक

Shopify Speed Optimization: A Technical Checklist That Actually Moves Core Web Vitals (2026)

Technical SEO Audit Checklist 2026: 47 Checks We Run on Every Client Site

Odoo 19 HR: Skills Matrix, Career Plans, Performance Cycles

Odoo 19 Performance Benchmarks: PostgreSQL 17 Tuning Numbers

OpenClaw Cost Optimization and Token Efficiency at Scale

Power BI Incremental Refresh for Tables Over 10 Million Rows

Incremental Refresh in Power BI: Handling Large Datasets Efficiently

इंक्रीमेंटल रिफ्रेश कैसे काम करता है

पूर्वापेक्षाएँ और आवश्यकताएँ

चरण-दर-चरण कॉन्फ़िगरेशन

उन्नत कॉन्फ़िगरेशन: डेटा परिवर्तनों का पता लगाएं

हाइब्रिड तालिकाएँ: वास्तविक समय + ऐतिहासिक डेटा

वृद्धिशील ताज़ा स्वास्थ्य की निगरानी करना

अभ्यास में क्वेरी फ़ोल्डिंग सत्यापन

अक्सर पूछे जाने वाले प्रश्न

अगले चरण

डेटा-संचालित निर्णय अनलॉक करें

संबंधित लेख

Microsoft Fabric vs Power BI: What Is the Difference, and What Do You Actually Need in 2026?

Power BI Consultant vs In-House Team: Cost, Speed, and When to Hire Help (2026)

Power BI Embedded: Costs, Capacity Sizing, and When It Beats Building Your Own Dashboards

Performance & Scalability से और अधिक

Shopify Speed Optimization: A Technical Checklist That Actually Moves Core Web Vitals (2026)

Technical SEO Audit Checklist 2026: 47 Checks We Run on Every Client Site

Odoo 19 HR: Skills Matrix, Career Plans, Performance Cycles

Odoo 19 Performance Benchmarks: PostgreSQL 17 Tuning Numbers

OpenClaw Cost Optimization and Token Efficiency at Scale

Power BI Incremental Refresh for Tables Over 10 Million Rows