Document Processing Automation with OpenClaw

हर व्यवसाय दस्तावेजों पर चलता है। चालान, अनुबंध, खरीद आदेश, वितरण रसीदें, अनुपालन रिपोर्ट, व्यय दावे - मात्रा कभी कम नहीं होती है, और उन्हें मैन्युअल रूप से संसाधित करने की लागत बहुत अधिक है। रूढ़िवादी अनुमानों के अनुसार मैन्युअल चालान प्रसंस्करण की औसत लागत $12-$16 प्रति दस्तावेज़ है, जिसमें त्रुटि दर 3% से 5% के बीच है। इसे प्रति माह हजारों दस्तावेज़ों से गुणा करें और स्वचालन का मामला स्वयं ही लिख जाता है।

OpenClaw के दस्तावेज़ प्रसंस्करण एजेंट OCR, संरचित डेटा निष्कर्षण, सत्यापन नियम और ERP एकीकरण को एक एकल स्वायत्त पाइपलाइन में जोड़ते हैं। परिणाम एक ऐसी प्रणाली है जो एक दस्तावेज़ प्राप्त करती है, उसके प्रकार और सामग्री को समझती है, आपके व्यावसायिक नियमों के विरुद्ध डेटा को मान्य करती है, और निकाली गई जानकारी को सही गंतव्य तक ले जाती है - अधिकांश दस्तावेज़ों के लिए मानवीय हस्तक्षेप के बिना।

मुख्य बातें

ओपनक्लॉ दस्तावेज़ एजेंट एक एकीकृत पाइपलाइन के माध्यम से पीडीएफ, स्कैन की गई छवियां, अनुलग्नकों के साथ ईमेल और संरचित फ़ाइल प्रारूप (सीएसवी, एक्सएमएल, ईडीआई) को संभालते हैं।

ओसीआर गुणवत्ता स्कोरिंग गेट्स एआई निष्कर्षण-निम्न-गुणवत्ता वाले स्कैन प्रसंस्करण जारी रखने से पहले पुनः स्कैन अनुरोध को ट्रिगर करते हैं।

निष्कर्षण परत दस्तावेज़ प्रारूपों में अधिकतम सटीकता के लिए लेआउट विश्लेषण, नामित इकाई पहचान और एलएलएम-आधारित पार्सिंग के संयोजन का उपयोग करती है।

सत्यापन कौशल किसी भी डेटा को आपके ईआरपी तक पहुंचने से पहले आपूर्तिकर्ता मास्टर रिकॉर्ड, पीओ नंबर, टैक्स कोड और व्यावसायिक नियमों के विरुद्ध निकाले गए डेटा की जांच करते हैं।

अपवाद प्रबंधन केवल वास्तव में अस्पष्ट दस्तावेजों को मनुष्यों तक पहुंचाता है - एजेंट अपने सर्वोत्तम अनुमान के साथ एक पूर्व-भरा हुआ फॉर्म प्रदान करता है ताकि मानव दोबारा प्रवेश करने के बजाय केवल पुष्टि कर सके।

पाइपलाइन बॉक्स से बाहर 300+ दस्तावेज़ प्रकारों को संभालती है; कस्टम टेम्प्लेट को लो-कोड स्कीमा संपादक के माध्यम से जोड़ा जा सकता है।

दस्तावेज़ प्राप्ति से ईआरपी प्रविष्टि तक शुरू से अंत तक विलंबता, साफ़ दस्तावेज़ों के लिए औसतन 90 सेकंड से कम है।

ECOSIRE Odoo, SAP, QuickBooks और कस्टम ERPs के साथ एकीकृत OpenClaw दस्तावेज़ प्रसंस्करण पाइपलाइनों का निर्माण और प्रबंधन करता है।

दस्तावेज़ प्रसंस्करण वास्तुकला अवलोकन

एक उत्पादन ओपनक्लॉ दस्तावेज़ प्रसंस्करण पाइपलाइन में छह चरण होते हैं, प्रत्येक को एक या अधिक कौशल के रूप में कार्यान्वित किया जाता है:

Document Ingestion
        ↓
[ Classifier Agent ]     — document type detection, routing
        ↓
[ Extraction Agent ]     — OCR + structured data extraction
        ↓
[ Validation Agent ]     — business rule validation, master data lookup
        ↓
[ Enrichment Agent ]     — GL coding, cost center assignment, approver lookup
        ↓
[ Integration Agent ]    — ERP/downstream system write
        ↓
[ Exception Agent ]      — handles ambiguous documents, requests human review

प्रत्येक एजेंट स्वतंत्र रूप से चलता है और टास्क बस के माध्यम से संचार करता है। किसी भी स्तर पर विफल दस्तावेज़ अपस्ट्रीम चरणों में पहले से ही पूरा किए गए कार्य को खोए बिना अपवाद एजेंट को भेज दिए जाते हैं।

दस्तावेज़ अंतर्ग्रहण: प्रत्येक प्रारूप को स्वीकार करना

दस्तावेज़ कई चैनलों के माध्यम से आते हैं: ईमेल अटैचमेंट, फ़ाइल सिस्टम ड्रॉप, एपीआई अपलोड, फैक्स-टू-ईमेल गेटवे और विक्रेता पोर्टल। अंतर्ग्रहण परत इन सभी को एक मानक दस्तावेज़ कार्य में सामान्यीकृत करती है।

export const DocumentIngester = defineSkill({
  name: "document-ingester",
  tools: ["email", "storage", "queue"],
  async run({ input, tools }) {
    let rawFile: Buffer;
    let mimeType: string;

    if (input.source === "email") {
      const attachment = await tools.email.getAttachment(input.emailId, input.attachmentIndex);
      rawFile = attachment.buffer;
      mimeType = attachment.mimeType;
    } else if (input.source === "storage") {
      rawFile = await tools.storage.get(input.storageKey);
      mimeType = detectMimeType(rawFile);
    }

    // Normalize to PDF for consistent downstream processing
    const normalizedPdf = mimeType === "application/pdf"
      ? rawFile
      : await convertToPdf(rawFile, mimeType);

    const storageKey = `incoming/${Date.now()}-${generateId()}.pdf`;
    await tools.storage.put(storageKey, normalizedPdf);

    return {
      storageKey,
      originalSource: input.source,
      originalMimeType: mimeType,
      pagCount: await getPdfPageCount(normalizedPdf),
    };
  },
});

सामान्यीकरण चरण वर्ड दस्तावेज़ों, एक्सेल फ़ाइलों, छवि फ़ाइलों (जेपीईजी, पीएनजी, टीआईएफएफ) और ईमेल HTML निकायों को डाउनस्ट्रीम में भेजने से पहले पीडीएफ में परिवर्तित करता है। डाउनस्ट्रीम एजेंट केवल पीडीएफ ही प्राप्त करते हैं - यह ओसीआर और लेआउट विश्लेषण को नाटकीय रूप से सरल बनाता है।

दस्तावेज़ वर्गीकरण: यह जानना कि आपके पास क्या है

निष्कर्षण शुरू होने से पहले, क्लासिफायर एजेंट दस्तावेज़ प्रकार की पहचान करता है। वर्गीकरण मायने रखता है क्योंकि विभिन्न दस्तावेज़ प्रकारों के लिए अलग-अलग निष्कर्षण टेम्पलेट्स की आवश्यकता होती है - एक चालान डिलीवरी रसीद जैसा कुछ भी नहीं दिखता है।

क्लासिफायरियर दो-चरणीय दृष्टिकोण का उपयोग करता है:

चरण 1 - लेआउट विश्लेषण: दस्तावेज़ की दृश्य संरचना (तालिका स्थिति, हेडर ब्लॉक, पादलेख पैटर्न, लोगो प्लेसमेंट) का विश्लेषण दस्तावेज़ श्रेणी को उम्मीदवारों के एक छोटे समूह तक सीमित करने के लिए किया जाता है।

चरण 2 - सामग्री वर्गीकरण: पाठ में मुख्य वाक्यांश और संरचनात्मक पैटर्न विशिष्ट दस्तावेज़ प्रकार की पुष्टि करते हैं। क्लासिफायरियर एक प्रकार का लेबल और एक आत्मविश्वास स्कोर तैयार करता है।

export const ClassifyDocument = defineSkill({
  name: "classify-document",
  tools: ["storage", "classification-model"],
  async run({ input, tools }) {
    const pdfBuffer = await tools.storage.get(input.storageKey);
    const layoutFeatures = await extractLayoutFeatures(pdfBuffer);
    const textContent = await performOcr(pdfBuffer, { mode: "fast" });

    const classification = await tools.classificationModel.classify({
      layoutFeatures,
      textContent: textContent.slice(0, 2000), // First 2000 chars for speed
    });

    if (classification.confidence < 0.70) {
      return {
        type: "unknown",
        confidence: classification.confidence,
        requiresManualClassification: true,
      };
    }

    return {
      type: classification.label,
      confidence: classification.confidence,
      requiresManualClassification: false,
      extractionTemplate: TEMPLATE_MAP[classification.label],
    };
  },
});

सामान्य दस्तावेज़ प्रकार और उनके निष्कर्षण टेम्पलेट पूर्व-निर्मित होते हैं: विक्रेता चालान, क्रेडिट मेमो, खरीद आदेश, डिलीवरी नोट, बैंक विवरण, अनुबंध, व्यय रिपोर्ट और सीमा शुल्क घोषणाएँ। कोड परिवर्तन के बिना टेम्पलेट संपादक के माध्यम से नए दस्तावेज़ प्रकार जोड़े जा सकते हैं।

ओसीआर और निष्कर्षण: सटीक रूप से डेटा प्राप्त करना

एक्सट्रैक्शन एजेंट वह जगह है जहां सबसे अधिक तकनीकी जटिलता रहती है। यह असंरचित दस्तावेजों से संरचित डेटा का उत्पादन करने के लिए लेआउट विश्लेषण और एलएलएम-आधारित पार्सिंग के साथ ओसीआर आउटपुट को जोड़ता है।

एआई निष्कर्षण शुरू होने से पहले ओसीआर गुणवत्ता का आकलन किया जाता है। यदि ओसीआर से औसत चरित्र आत्मविश्वास 0.80 से नीचे है (धुंधले स्कैन, कम रिज़ॉल्यूशन, या तिरछे पृष्ठ का संकेत), तो एजेंट अविश्वसनीय पाठ के साथ आगे बढ़ने के बजाय दस्तावेज़ को फिर से स्कैन करने के लिए चिह्नित करता है।

ओसीआर गुणवत्ता जांच पास करने वाले दस्तावेज़ों के लिए, निष्कर्षण तीन पासों में आगे बढ़ता है:

पास 1 - टेम्पलेट मिलान: ज्ञात विक्रेताओं और दस्तावेज़ प्रारूपों के लिए, निष्कर्षण टेम्पलेट फ़ील्ड स्थिति (निर्देशांक या रेगेक्स एंकर) प्रदान करता है। ज्ञात स्रोतों से संरचित दस्तावेज़ों के लिए टेम्पलेट मिलान तेज़ और सटीक है।

पास 2 - नामित इकाई पहचान: एनईआर उन राशियों, तिथियों, पते, पहचानकर्ताओं (चालान संख्या, पीओ संख्या, वैट संख्या) और लाइन-आइटम सीमाओं की पहचान करता है जो टेम्पलेट मिलान से चूक गए हैं।

पास 3 - एलएलएम रीजनिंग: अस्पष्ट क्षेत्रों के लिए या जब पहले दो पास कम-आत्मविश्वास वाले मान उत्पन्न करते हैं, तो एलएलएम सही मान का अनुमान लगाने के लिए आसपास के पाठ संदर्भ को पार्स करता है।

export const ExtractInvoiceData = defineSkill({
  name: "extract-invoice-data",
  tools: ["storage", "ocr-service", "llm"],
  async run({ input, tools, memory }) {
    const buffer = await tools.storage.get(input.storageKey);
    const ocrResult = await tools.ocrService.extract(buffer, { enhanceScannedPages: true });

    if (ocrResult.averageConfidence < 0.80) {
      return { success: false, reason: "LOW_OCR_QUALITY", ocrConfidence: ocrResult.averageConfidence };
    }

    // Pass 1: Template matching
    const templateFields = applyTemplate(ocrResult, input.extractionTemplate);

    // Pass 2: NER for missing fields
    const nerFields = await extractWithNer(ocrResult.text, { fieldTypes: ["amount", "date", "id"] });

    // Pass 3: LLM for remaining low-confidence fields
    const lowConfidenceFields = mergeAndFindGaps(templateFields, nerFields, { minConfidence: 0.85 });
    const llmFields = lowConfidenceFields.length > 0
      ? await tools.llm.extractFields(ocrResult.text, lowConfidenceFields)
      : {};

    const extracted = mergeExtractions(templateFields, nerFields, llmFields);
    await memory.working.set("extractedData", extracted);

    return { success: true, data: extracted, fieldConfidences: getFieldConfidences(extracted) };
  },
});

सत्यापन: आपके ईआरपी तक पहुंचने से पहले त्रुटियों को पकड़ना

कच्चा निकाला गया डेटा कभी भी सीधे आपके ईआरपी पर नहीं लिखा जाता है। कुछ भी पोस्ट करने से पहले वैलिडेशन एजेंट आपके व्यावसायिक नियमों और मास्टर डेटा के अनुसार हर फ़ील्ड की जाँच करता है।

विक्रेता चालान के लिए सत्यापन जांच में शामिल हैं:

विक्रेता मौजूद है: आपूर्तिकर्ता का नाम और वैट नंबर विक्रेता मास्टर में एक रिकॉर्ड से मेल खाता है।
पीओ मिलान: चालान पर पीओ नंबर एक खुले पीओ से मेल खाता है, और राशि सहनशीलता के भीतर है (आमतौर पर चालान लचीलेपन के लिए ±5%)।
डुप्लिकेट का पता लगाना: इस विक्रेता का चालान नंबर पिछले 180 दिनों में संसाधित नहीं किया गया है।
कर गणना: पंक्ति वस्तु का योग और कर, पूर्णांकन सहनशीलता के भीतर, चालान के कुल के बराबर होता है।
मुद्रा और विनिमय दर: विदेशी मुद्रा चालान को चालान तिथि के लिए विनिमय दर के विरुद्ध मान्य किया जाता है।
जीएल अवधि: चालान की तारीख खुली लेखा अवधि के अंतर्गत आती है।

export const ValidateInvoice = defineSkill({
  name: "validate-invoice",
  tools: ["erp", "vendor-master"],
  async run({ input, tools }) {
    const errors: ValidationError[] = [];

    // Vendor validation
    const vendor = await tools.vendorMaster.findByVatNumber(input.data.vendorVat);
    if (!vendor) errors.push({ field: "vendorVat", code: "VENDOR_NOT_FOUND" });

    // PO match
    if (input.data.poNumber) {
      const po = await tools.erp.getPurchaseOrder(input.data.poNumber);
      if (!po) errors.push({ field: "poNumber", code: "PO_NOT_FOUND" });
      else if (Math.abs(po.totalAmount - input.data.totalAmount) / po.totalAmount > 0.05) {
        errors.push({ field: "totalAmount", code: "PO_AMOUNT_MISMATCH" });
      }
    }

    // Duplicate check
    const isDuplicate = await tools.erp.invoiceExists({
      vendorId: vendor?.id,
      invoiceNumber: input.data.invoiceNumber,
    });
    if (isDuplicate) errors.push({ field: "invoiceNumber", code: "DUPLICATE_INVOICE" });

    return {
      valid: errors.length === 0,
      errors,
      validatedData: errors.length === 0 ? input.data : null,
    };
  },
});

सत्यापन विफलताएं दस्तावेज़ को चुपचाप छोड़ने के बजाय अपवाद एजेंट तक पहुंच जाती हैं। अपवाद एजेंट निकाले गए डेटा और विशिष्ट सत्यापन त्रुटियों के साथ पहले से भरा हुआ एक समीक्षा कार्य बनाता है, ताकि एक मानव केवल ध्वजांकित फ़ील्ड को सही कर सके।

संवर्धन: व्यावसायिक संदर्भ जोड़ना

ईआरपी पर पोस्ट किए जाने से पहले स्वच्छ, मान्य डेटा को अभी भी व्यावसायिक संदर्भ की आवश्यकता है। संवर्धन एजेंट वह जानकारी जोड़ता है जो दस्तावेज़ों में नहीं है: जीएल खाता कोड, लागत केंद्र असाइनमेंट, कर उपचार कोड, अनुमोदन वर्कफ़्लो असाइनमेंट और भुगतान शर्तें।

संवर्धन नियम एक पॉलिसी स्टोर में परिभाषित किए गए हैं और विक्रेता विशेषताओं, लाइन आइटम विवरण, विभाग, परियोजना कोड और राशि सीमा का संदर्भ दे सकते हैं। अधिकांश संवर्धन नियम नियतात्मक लुकअप हैं; अस्पष्ट मामलों के लिए (विवरण के साथ पंक्ति वस्तुएँ जो कई जीएल खातों में मैप हो सकती हैं), एलएलएम स्पष्टीकरण के साथ एक क्रमबद्ध सुझाव सूची प्रदान करता है।

ईआरपी एकीकरण: पहली बार सटीक रूप से डेटा लिखना

एकीकरण एजेंट आपके ईआरपी पर मान्य, समृद्ध डेटा पोस्ट करता है। यह मूल दस्तावेज़ के हैश से प्राप्त सहसंबंध आईडी के साथ इडेम्पोटेंट एपीआई कॉल का उपयोग करता है - यदि ईआरपी लिखने का पुनः प्रयास किया जाता है (नेटवर्क टाइमआउट के कारण), तो डुप्लिकेट रिकॉर्ड को रोका जाता है।

export const PostToErp = defineSkill({
  name: "post-to-erp",
  tools: ["erp"],
  async run({ input, tools }) {
    const correlationId = hashDocument(input.storageKey);

    const result = await tools.erp.createVendorBill({
      correlationId, // ERP uses this for idempotency
      vendorId: input.enrichedData.vendorId,
      invoiceNumber: input.enrichedData.invoiceNumber,
      invoiceDate: input.enrichedData.invoiceDate,
      lineItems: input.enrichedData.lineItems,
      taxLines: input.enrichedData.taxLines,
      paymentTerms: input.enrichedData.paymentTerms,
      glCodes: input.enrichedData.glCodes,
    });

    return {
      erpRecordId: result.id,
      erpRecordUrl: result.url,
      posted: true,
    };
  },
});

पोस्ट करने के बाद, मूल दस्तावेज़ को ईआरपी रिकॉर्ड से जोड़ा जाता है और आपके दस्तावेज़ प्रबंधन सिस्टम में पूर्ण मेटाडेटा के साथ संग्रहीत किया जाता है। ऑडिट ट्रेल पूरा हो गया है: ईमेल अटैचमेंट या फ़ाइल ड्रॉप से लेकर प्रत्येक प्रोसेसिंग चरण से लेकर अंतिम ईआरपी प्रविष्टि तक।

अपवाद प्रबंधन: जब यह मायने रखता है तो मानव-इन-द-लूप

प्रत्येक दस्तावेज़ साफ़-सुथरे ढंग से संसाधित नहीं होगा. अपवाद एजेंट अपवादों की चार श्रेणियों को संभालता है:

वर्गीकरण विफलताएँ: दस्तावेज़ का प्रकार पर्याप्त विश्वास के साथ निर्धारित नहीं किया जा सका।
निष्कर्षण विफलताएँ: महत्वपूर्ण फ़ील्ड (कुल राशि, विक्रेता आईडी, चालान संख्या) नहीं निकाली जा सकीं।
सत्यापन विफलता: निकाला गया डेटा व्यावसायिक नियम जांच में पास नहीं होता है।
एकीकरण विफलताएँ: ईआरपी ने पोस्टिंग को अस्वीकार कर दिया (उदाहरण के लिए, बंद लेखा अवधि, खाता लॉक)।

प्रत्येक अपवाद के लिए, एजेंट आपके हेल्पडेस्क या वर्कफ़्लो सिस्टम में पहले से भरे हुए फॉर्म के साथ एक समीक्षा कार्य बनाता है जिसमें एजेंट का सर्वोत्तम प्रयास और विशिष्ट त्रुटि दिखाई देती है। मानव केवल असफल फ़ील्ड को ठीक करता है और अनुमोदन देता है—एजेंट पुनः सबमिशन को संभालता है।

अक्सर पूछे जाने वाले प्रश्न

सटीक ओसीआर के लिए किस दस्तावेज़ समाधान की आवश्यकता है?

मुद्रित दस्तावेज़ों के लिए, स्वीकार्य ओसीआर परिणामों के लिए 150 डीपीआई न्यूनतम है; विश्वसनीय निष्कर्षण के लिए 300 DPI की अनुशंसा की जाती है। हस्तलिखित दस्तावेज़ों या बहुत छोटे फ़ॉन्ट आकार वाले दस्तावेज़ों के लिए, 400 DPI या उच्चतर को प्राथमिकता दी जाती है। ओसीआर गुणवत्ता मूल्यांकन कौशल निष्कर्षण शुरू होने से पहले दस्तावेजों को सीमा से नीचे चिह्नित करता है, जिससे स्वचालित रूप से पुन: स्कैन अनुरोध शुरू हो जाता है।

सिस्टम बहु-पृष्ठ दस्तावेज़ों को कैसे संभालता है?

बहु-पृष्ठ दस्तावेज़ों को पृष्ठ सीमा पहचान के साथ संसाधित किया जाता है। चालान के लिए, एजेंट हेडर पेज, लाइन-आइटम पेज और किसी भी निरंतरता वाले पेज की पहचान करता है। पेज ब्रेक में फैले लाइन आइटम को लेआउट विश्लेषण परत द्वारा सही ढंग से पुनर्निर्मित किया जाता है। अन्य दस्तावेज़ प्रकारों (अनुबंध, रिपोर्ट) के लिए, एजेंट सभी पृष्ठों को संसाधित करता है और प्रत्येक पृष्ठ से निकाले गए फ़ील्ड को एकत्रित करता है।

क्या सिस्टम इंसानों द्वारा किए गए सुधारों से सीख सकता है?

हाँ। जब कोई मानव किसी अपवाद दस्तावेज़ को सही करता है, तो सुधार वापस नॉलेज एजेंट को भेज दिया जाता है। यदि एक ही सुधार पैटर्न तीन से अधिक बार दिखाई देता है (उदाहरण के लिए, एक नया विक्रेता हमेशा अपने चालान को गैर-मानक तरीके से प्रारूपित करता है), तो सिस्टम स्वचालित रूप से उस विक्रेता के लिए एक नया निष्कर्षण टेम्पलेट प्रस्तावित करता है। एक प्रशासक प्रस्तावित टेम्पलेट की समीक्षा करता है और उसे मंजूरी देता है, और सिस्टम उस बिंदु से उस विक्रेता के लिए मानव समीक्षा के बिना इसे लागू करता है।

हस्तलिखित दस्तावेज़ों को कैसे संभाला जाता है?

हस्तलिखित दस्तावेज़ सबसे चुनौतीपूर्ण श्रेणी हैं। OCR परत इन दस्तावेज़ों के लिए एक विशेष लिखावट पहचान मॉडल का उपयोग करती है, और AI निष्कर्षण को पारित करने के लिए आत्मविश्वास सीमा अधिक है (मुद्रित दस्तावेज़ों के लिए 0.90 बनाम 0.80)। व्यवहार में, अधिकांश एंटरप्राइज़ दस्तावेज़ वर्कफ़्लो प्रक्रिया परिवर्तन (इलेक्ट्रॉनिक सबमिशन पोर्टल, डिजिटल हस्ताक्षर वर्कफ़्लो) के माध्यम से हस्तलिखित दस्तावेज़ों को समाप्त कर सकते हैं। जिन संगठनों को हस्तलिखित दस्तावेजों को संसाधित करना होता है, उनके लिए ECOSIRE हस्तलेखन-भारी दस्तावेजों के लिए मानव समीक्षा के साथ एक मिश्रित दृष्टिकोण की सिफारिश करता है।

निष्कर्षण के लिए कौन सी भाषाएँ समर्थित हैं?

OpenClaw का दस्तावेज़ प्रसंस्करण OCR के लिए 40+ भाषाओं का समर्थन करता है, जिसमें अंग्रेजी, जर्मन, फ्रेंच, स्पेनिश, अरबी, चीनी (सरलीकृत और पारंपरिक), जापानी और पुर्तगाली में प्रमुख व्यावसायिक दस्तावेज़ प्रारूपों के लिए मान्य निष्कर्षण टेम्पलेट हैं। अन्य भाषाओं के लिए, OCR काम करता है लेकिन निष्कर्षण टेम्पलेट गुणवत्ता आपके दस्तावेज़ नमूना सेट पर निर्भर करती है। एलएलएम तर्क परत कई भाषाओं को मूल रूप से संभालती है।

दस्तावेज़ की गोपनीयता कैसे बनाए रखी जाती है?

दस्तावेज़ पारगमन में (टीएलएस 1.3) और विश्राम के दौरान (एईएस-256) एन्क्रिप्ट किए जाते हैं। प्रत्येक दस्तावेज़ को एक अलग संदर्भ में संसाधित किया जाता है - कोई भी दस्तावेज़ सामग्री संगठनों के बीच साझा नहीं की जाती है। अत्यधिक संवेदनशील दस्तावेजों (कानूनी अनुबंध, वित्तीय विवरण) के लिए, आप दस्तावेज़ सामग्री को पूरी तरह से अपने नेटवर्क परिधि के भीतर रखते हुए, तर्क परत के लिए ऑन-प्रिमाइस एलएलएम का उपयोग करने के लिए पाइपलाइन को कॉन्फ़िगर कर सकते हैं।

चालान प्रसंस्करण के लिए विशिष्ट सटीकता दर क्या है?

टेम्प्लेट मिलान वाले ज्ञात विक्रेताओं से संरचित चालान के लिए, टेम्प्लेट अंशांकन के बाद फ़ील्ड-स्तरीय सटीकता आमतौर पर 99.5% से अधिक हो जाती है। नए विक्रेताओं के असंरचित चालानों के लिए, पहले प्रयास में सटीकता आम तौर पर 95-98% होती है, जैसे-जैसे सिस्टम विक्रेता के प्रारूप को सीखता है, इसमें सुधार होता जाता है। ट्रैक करने के लिए मुख्य मीट्रिक अपवाद दर है - अच्छी तरह से कॉन्फ़िगर की गई पाइपलाइनें कुल दस्तावेज़ मात्रा के 5% से कम अपवाद दर देखती हैं।

अगले चरण

मैन्युअल दस्तावेज़ प्रसंस्करण एक लागत केंद्र है जो कोई प्रतिस्पर्धी मूल्य नहीं जोड़ता है। OpenClaw दस्तावेज़ प्रसंस्करण स्वचालन इसे एक कर्मचारी-गहन ऑपरेशन से एक स्वचालित पाइपलाइन में परिवर्तित करता है जो मानव हस्तक्षेप के बिना आपके दस्तावेज़ मात्रा का 95%+ संभालता है।

ECOSIRE की OpenClaw कार्यान्वयन टीम Odoo, SAP, QuickBooks और कस्टम ERPs के साथ एकीकृत दस्तावेज़ प्रसंस्करण पाइपलाइन बनाने में माहिर है। हम दस्तावेज़ वर्गीकरण टेम्पलेट डिज़ाइन, ओसीआर अंशांकन, सत्यापन नियम कॉन्फ़िगरेशन, ईआरपी एकीकरण और अपवाद वर्कफ़्लो सेटअप को संभालते हैं - छह से आठ सप्ताह में उत्पादन-तैयार प्रणाली प्रदान करते हैं।

अपने वर्तमान ऑपरेशन के दस्तावेज़ प्रसंस्करण ऑडिट के साथ शुरुआत करने के लिए ECOSIRE से संपर्क करें।

मुख्य बातें

ओपनक्लॉ दस्तावेज़ एजेंट एक एकीकृत पाइपलाइन के माध्यम से पीडीएफ, स्कैन की गई छवियां, अनुलग्नकों के साथ ईमेल और संरचित फ़ाइल प्रारूप (सीएसवी, एक्सएमएल, ईडीआई) को संभालते हैं।

ओसीआर गुणवत्ता स्कोरिंग गेट्स एआई निष्कर्षण-निम्न-गुणवत्ता वाले स्कैन प्रसंस्करण जारी रखने से पहले पुनः स्कैन अनुरोध को ट्रिगर करते हैं।

निष्कर्षण परत दस्तावेज़ प्रारूपों में अधिकतम सटीकता के लिए लेआउट विश्लेषण, नामित इकाई पहचान और एलएलएम-आधारित पार्सिंग के संयोजन का उपयोग करती है।

सत्यापन कौशल किसी भी डेटा को आपके ईआरपी तक पहुंचने से पहले आपूर्तिकर्ता मास्टर रिकॉर्ड, पीओ नंबर, टैक्स कोड और व्यावसायिक नियमों के विरुद्ध निकाले गए डेटा की जांच करते हैं।

अपवाद प्रबंधन केवल वास्तव में अस्पष्ट दस्तावेजों को मनुष्यों तक पहुंचाता है - एजेंट अपने सर्वोत्तम अनुमान के साथ एक पूर्व-भरा हुआ फॉर्म प्रदान करता है ताकि मानव दोबारा प्रवेश करने के बजाय केवल पुष्टि कर सके।

पाइपलाइन बॉक्स से बाहर 300+ दस्तावेज़ प्रकारों को संभालती है; कस्टम टेम्प्लेट को लो-कोड स्कीमा संपादक के माध्यम से जोड़ा जा सकता है।

दस्तावेज़ प्राप्ति से ईआरपी प्रविष्टि तक शुरू से अंत तक विलंबता, साफ़ दस्तावेज़ों के लिए औसतन 90 सेकंड से कम है।

ECOSIRE Odoo, SAP, QuickBooks और कस्टम ERPs के साथ एकीकृत OpenClaw दस्तावेज़ प्रसंस्करण पाइपलाइनों का निर्माण और प्रबंधन करता है।

दस्तावेज़ प्रसंस्करण वास्तुकला अवलोकन

Document Ingestion
        ↓
[ Classifier Agent ]     — document type detection, routing
        ↓
[ Extraction Agent ]     — OCR + structured data extraction
        ↓
[ Validation Agent ]     — business rule validation, master data lookup
        ↓
[ Enrichment Agent ]     — GL coding, cost center assignment, approver lookup
        ↓
[ Integration Agent ]    — ERP/downstream system write
        ↓
[ Exception Agent ]      — handles ambiguous documents, requests human review

दस्तावेज़ अंतर्ग्रहण: प्रत्येक प्रारूप को स्वीकार करना

export const DocumentIngester = defineSkill({
  name: "document-ingester",
  tools: ["email", "storage", "queue"],
  async run({ input, tools }) {
    let rawFile: Buffer;
    let mimeType: string;

    if (input.source === "email") {
      const attachment = await tools.email.getAttachment(input.emailId, input.attachmentIndex);
      rawFile = attachment.buffer;
      mimeType = attachment.mimeType;
    } else if (input.source === "storage") {
      rawFile = await tools.storage.get(input.storageKey);
      mimeType = detectMimeType(rawFile);
    }

    // Normalize to PDF for consistent downstream processing
    const normalizedPdf = mimeType === "application/pdf"
      ? rawFile
      : await convertToPdf(rawFile, mimeType);

    const storageKey = `incoming/${Date.now()}-${generateId()}.pdf`;
    await tools.storage.put(storageKey, normalizedPdf);

    return {
      storageKey,
      originalSource: input.source,
      originalMimeType: mimeType,
      pagCount: await getPdfPageCount(normalizedPdf),
    };
  },
});

दस्तावेज़ वर्गीकरण: यह जानना कि आपके पास क्या है

क्लासिफायरियर दो-चरणीय दृष्टिकोण का उपयोग करता है:

export const ClassifyDocument = defineSkill({
  name: "classify-document",
  tools: ["storage", "classification-model"],
  async run({ input, tools }) {
    const pdfBuffer = await tools.storage.get(input.storageKey);
    const layoutFeatures = await extractLayoutFeatures(pdfBuffer);
    const textContent = await performOcr(pdfBuffer, { mode: "fast" });

    const classification = await tools.classificationModel.classify({
      layoutFeatures,
      textContent: textContent.slice(0, 2000), // First 2000 chars for speed
    });

    if (classification.confidence < 0.70) {
      return {
        type: "unknown",
        confidence: classification.confidence,
        requiresManualClassification: true,
      };
    }

    return {
      type: classification.label,
      confidence: classification.confidence,
      requiresManualClassification: false,
      extractionTemplate: TEMPLATE_MAP[classification.label],
    };
  },
});

ओसीआर और निष्कर्षण: सटीक रूप से डेटा प्राप्त करना

export const ExtractInvoiceData = defineSkill({
  name: "extract-invoice-data",
  tools: ["storage", "ocr-service", "llm"],
  async run({ input, tools, memory }) {
    const buffer = await tools.storage.get(input.storageKey);
    const ocrResult = await tools.ocrService.extract(buffer, { enhanceScannedPages: true });

    if (ocrResult.averageConfidence < 0.80) {
      return { success: false, reason: "LOW_OCR_QUALITY", ocrConfidence: ocrResult.averageConfidence };
    }

    // Pass 1: Template matching
    const templateFields = applyTemplate(ocrResult, input.extractionTemplate);

    // Pass 2: NER for missing fields
    const nerFields = await extractWithNer(ocrResult.text, { fieldTypes: ["amount", "date", "id"] });

    // Pass 3: LLM for remaining low-confidence fields
    const lowConfidenceFields = mergeAndFindGaps(templateFields, nerFields, { minConfidence: 0.85 });
    const llmFields = lowConfidenceFields.length > 0
      ? await tools.llm.extractFields(ocrResult.text, lowConfidenceFields)
      : {};

    const extracted = mergeExtractions(templateFields, nerFields, llmFields);
    await memory.working.set("extractedData", extracted);

    return { success: true, data: extracted, fieldConfidences: getFieldConfidences(extracted) };
  },
});

सत्यापन: आपके ईआरपी तक पहुंचने से पहले त्रुटियों को पकड़ना

विक्रेता चालान के लिए सत्यापन जांच में शामिल हैं:

विक्रेता मौजूद है: आपूर्तिकर्ता का नाम और वैट नंबर विक्रेता मास्टर में एक रिकॉर्ड से मेल खाता है।
पीओ मिलान: चालान पर पीओ नंबर एक खुले पीओ से मेल खाता है, और राशि सहनशीलता के भीतर है (आमतौर पर चालान लचीलेपन के लिए ±5%)।
डुप्लिकेट का पता लगाना: इस विक्रेता का चालान नंबर पिछले 180 दिनों में संसाधित नहीं किया गया है।
कर गणना: पंक्ति वस्तु का योग और कर, पूर्णांकन सहनशीलता के भीतर, चालान के कुल के बराबर होता है।
मुद्रा और विनिमय दर: विदेशी मुद्रा चालान को चालान तिथि के लिए विनिमय दर के विरुद्ध मान्य किया जाता है।
जीएल अवधि: चालान की तारीख खुली लेखा अवधि के अंतर्गत आती है।

export const ValidateInvoice = defineSkill({
  name: "validate-invoice",
  tools: ["erp", "vendor-master"],
  async run({ input, tools }) {
    const errors: ValidationError[] = [];

    // Vendor validation
    const vendor = await tools.vendorMaster.findByVatNumber(input.data.vendorVat);
    if (!vendor) errors.push({ field: "vendorVat", code: "VENDOR_NOT_FOUND" });

    // PO match
    if (input.data.poNumber) {
      const po = await tools.erp.getPurchaseOrder(input.data.poNumber);
      if (!po) errors.push({ field: "poNumber", code: "PO_NOT_FOUND" });
      else if (Math.abs(po.totalAmount - input.data.totalAmount) / po.totalAmount > 0.05) {
        errors.push({ field: "totalAmount", code: "PO_AMOUNT_MISMATCH" });
      }
    }

    // Duplicate check
    const isDuplicate = await tools.erp.invoiceExists({
      vendorId: vendor?.id,
      invoiceNumber: input.data.invoiceNumber,
    });
    if (isDuplicate) errors.push({ field: "invoiceNumber", code: "DUPLICATE_INVOICE" });

    return {
      valid: errors.length === 0,
      errors,
      validatedData: errors.length === 0 ? input.data : null,
    };
  },
});

संवर्धन: व्यावसायिक संदर्भ जोड़ना

ईआरपी एकीकरण: पहली बार सटीक रूप से डेटा लिखना

export const PostToErp = defineSkill({
  name: "post-to-erp",
  tools: ["erp"],
  async run({ input, tools }) {
    const correlationId = hashDocument(input.storageKey);

    const result = await tools.erp.createVendorBill({
      correlationId, // ERP uses this for idempotency
      vendorId: input.enrichedData.vendorId,
      invoiceNumber: input.enrichedData.invoiceNumber,
      invoiceDate: input.enrichedData.invoiceDate,
      lineItems: input.enrichedData.lineItems,
      taxLines: input.enrichedData.taxLines,
      paymentTerms: input.enrichedData.paymentTerms,
      glCodes: input.enrichedData.glCodes,
    });

    return {
      erpRecordId: result.id,
      erpRecordUrl: result.url,
      posted: true,
    };
  },
});

अपवाद प्रबंधन: जब यह मायने रखता है तो मानव-इन-द-लूप

वर्गीकरण विफलताएँ: दस्तावेज़ का प्रकार पर्याप्त विश्वास के साथ निर्धारित नहीं किया जा सका।
निष्कर्षण विफलताएँ: महत्वपूर्ण फ़ील्ड (कुल राशि, विक्रेता आईडी, चालान संख्या) नहीं निकाली जा सकीं।
सत्यापन विफलता: निकाला गया डेटा व्यावसायिक नियम जांच में पास नहीं होता है।
एकीकरण विफलताएँ: ईआरपी ने पोस्टिंग को अस्वीकार कर दिया (उदाहरण के लिए, बंद लेखा अवधि, खाता लॉक)।

अक्सर पूछे जाने वाले प्रश्न

सटीक ओसीआर के लिए किस दस्तावेज़ समाधान की आवश्यकता है?

सिस्टम बहु-पृष्ठ दस्तावेज़ों को कैसे संभालता है?

क्या सिस्टम इंसानों द्वारा किए गए सुधारों से सीख सकता है?

हस्तलिखित दस्तावेज़ों को कैसे संभाला जाता है?

निष्कर्षण के लिए कौन सी भाषाएँ समर्थित हैं?

दस्तावेज़ की गोपनीयता कैसे बनाए रखी जाती है?

चालान प्रसंस्करण के लिए विशिष्ट सटीकता दर क्या है?

Document Processing Automation with OpenClaw

दस्तावेज़ प्रसंस्करण वास्तुकला अवलोकन

दस्तावेज़ अंतर्ग्रहण: प्रत्येक प्रारूप को स्वीकार करना

दस्तावेज़ वर्गीकरण: यह जानना कि आपके पास क्या है

ओसीआर और निष्कर्षण: सटीक रूप से डेटा प्राप्त करना

सत्यापन: आपके ईआरपी तक पहुंचने से पहले त्रुटियों को पकड़ना

संवर्धन: व्यावसायिक संदर्भ जोड़ना

ईआरपी एकीकरण: पहली बार सटीक रूप से डेटा लिखना

अपवाद प्रबंधन: जब यह मायने रखता है तो मानव-इन-द-लूप

अक्सर पूछे जाने वाले प्रश्न

अगले चरण

इंटेलिजेंट एआई एजेंट बनाएं

संबंधित लेख

25 Business Process Automation Examples That Actually Work in 2026 (From a Team Running Them in Production)

Building an OpenClaw Skill That Runs Your Shopify Store: Step-by-Step Tutorial

OpenClaw vs Zapier vs n8n (2026): Agents vs Workflows — Which Automation Layer Do You Need?

Document Processing Automation with OpenClaw

दस्तावेज़ प्रसंस्करण वास्तुकला अवलोकन

दस्तावेज़ अंतर्ग्रहण: प्रत्येक प्रारूप को स्वीकार करना

दस्तावेज़ वर्गीकरण: यह जानना कि आपके पास क्या है

ओसीआर और निष्कर्षण: सटीक रूप से डेटा प्राप्त करना

सत्यापन: आपके ईआरपी तक पहुंचने से पहले त्रुटियों को पकड़ना

संवर्धन: व्यावसायिक संदर्भ जोड़ना

ईआरपी एकीकरण: पहली बार सटीक रूप से डेटा लिखना

अपवाद प्रबंधन: जब यह मायने रखता है तो मानव-इन-द-लूप

अक्सर पूछे जाने वाले प्रश्न

अगले चरण

इंटेलिजेंट एआई एजेंट बनाएं

संबंधित लेख

25 Business Process Automation Examples That Actually Work in 2026 (From a Team Running Them in Production)

Building an OpenClaw Skill That Runs Your Shopify Store: Step-by-Step Tutorial

OpenClaw vs Zapier vs n8n (2026): Agents vs Workflows — Which Automation Layer Do You Need?