AI Agent Security Best Practices: Protecting Autonomous Systems

AI ایجنٹس جو پروڈکشن سسٹمز کے ساتھ تعامل کرتے ہیں، حساس ڈیٹا تک رسائی حاصل کرتے ہیں، اور خود مختار فیصلے کرتے ہیں جو سیکیورٹی رسک کی ایک نئی قسم متعارف کرواتے ہیں۔ روایتی ایپلیکیشن سیکیورٹی کوڈ کی کمزوریوں اور نیٹ ورک کے خطرات کو دور کرتی ہے۔ AI ایجنٹ کی سیکیورٹی کو اضافی طور پر فوری انجیکشن، اجازت میں اضافہ، ماڈل آؤٹ پٹس کے ذریعے ڈیٹا کے اخراج، اور ممکنہ استدلال کی بنیاد پر فیصلے کرنے والے نظام کو کنٹرول کرنے کے چیلنج سے بھی نمٹنا چاہیے۔ یہ گائیڈ AI ایجنٹوں کو محفوظ طریقے سے تعینات کرنے کے لیے جامع حفاظتی فریم ورک کا احاطہ کرتا ہے۔

اہم نکات

AI ایجنٹ کی سیکیورٹی کے لیے پانچ پرتوں میں دفاع کی گہرائی کی ضرورت ہوتی ہے: ان پٹ کی توثیق، اجازت کی حدود، عملدرآمد سینڈ باکسنگ، آؤٹ پٹ فلٹرنگ، اور آڈٹ لاگنگ
فوری انجیکشن AI ایجنٹوں کے خلاف بنیادی حملہ کرنے والا ویکٹر ہے اور اس کے لیے صرف مواد کی فلٹرنگ نہیں بلکہ ساختی دفاع کی ضرورت ہوتی ہے۔
کم از کم استحقاق کا اصول انسانی صارفین کے مقابلے AI ایجنٹوں پر زیادہ سختی سے لاگو ہوتا ہے کیونکہ ایجنٹ مشین کی رفتار سے کام کرتے ہیں۔
پروڈکشن سسٹم پر ایجنٹ کی تمام کارروائیوں کو فرانزک تجزیہ کے لیے کافی تفصیل کے ساتھ لاگ ان ہونا چاہیے
ہیومن ان دی لوپ چیک پوائنٹس اس وقت تک بہت زیادہ اثر انداز ہونے والے آپریشنز کے لیے ضروری ہیں جب تک کہ ایجنٹ کی قابل اعتمادی ثابت نہ ہو جائے۔

اے آئی ایجنٹ کا خطرہ ماڈل

حملے کی سطح

AI ایجنٹ روایتی ایپلی کیشنز سے ہٹ کر حملے کی سطحوں کو بے نقاب کرتے ہیں:

حملہ ویکٹر	تفصیل	خطرے کی سطح
فوری انجکشن	بدنیتی پر مبنی ان پٹ جو ایجنٹ کے رویے کو تبدیل کرتا ہے	تنقیدی
اجازت میں اضافہ	ایجنٹ اپنے دائرہ کار سے باہر وسائل تک رسائی حاصل کر رہا ہے	ہائی
ڈیٹا اکٹھا کرنا	ایجنٹ آؤٹ پٹس کے ذریعے سامنے آنے والا حساس ڈیٹا	ہائی
سروس سے انکار	زبردست ایجنٹ کے وسائل یا لامحدود لوپس کو متحرک کرنے والے	میڈیم
سپلائی چین	سمجھوتہ شدہ مہارت، پلگ ان، یا ماڈل وزن	ہائی
سوشل انجینئرنگ	بات چیت کے فریب کے ذریعے ایجنٹ کو جوڑ توڑ	میڈیم
ڈیٹا پوائزننگ کی تربیت	ایجنٹ کے فیصلوں کو متاثر کرنے والا تربیتی ڈیٹا کرپٹ	میڈیم

خطرے کے زمرے

زمرہ	مثالیں
رازداری	ایجنٹ کسٹمر PII، مالیاتی ڈیٹا، یا تجارتی رازوں سے پردہ اٹھاتا ہے۔
سالمیت	ایجنٹ غلط طریقے سے ڈیٹا میں ترمیم کرتا ہے، جعلی ریکارڈ بناتا ہے۔
دستیابی	ایجنٹ ضرورت سے زیادہ وسائل استعمال کرتا ہے، جائز کاموں کو روکتا ہے
تعمیل	ایجنٹ کی کارروائیاں ضوابط کی خلاف ورزی کرتی ہیں (GDPR, HIPAA, SOX)

پرت 1: ان پٹ کی توثیق

فوری انجیکشن ڈیفنس

فوری انجیکشن اس وقت ہوتا ہے جب صارف کے ان پٹ میں ایسی ہدایات ہوتی ہیں جو ایجنٹ کے سسٹم پرامپٹ کو اوور رائیڈ کرتی ہیں۔ ساختی دفاع میں شامل ہیں:

ان پٹ/ہدایت کی علیحدگی: سسٹم کی ہدایات اور صارف کے ان پٹ کے درمیان سخت حدود کو برقرار رکھیں۔ کبھی بھی صارف کے ان پٹ کو براہ راست سسٹم پرامپٹ میں مت جوڑیں۔

ان پٹ سینیٹائزیشن: پروسیسنگ سے پہلے صارف کے ان پٹ سے کنٹرول کریکٹرز، خصوصی ٹوکنز، اور ہدایات جیسے پیٹرن کی پٹی یا فرار۔

سیاق و سباق کی فلٹرنگ: ان پٹس کا پتہ لگائیں اور جھنڈا لگائیں جن میں سسٹم کی ہدایات، کردار ادا کرنے کی درخواستیں ("پچھلی ہدایات کو نظر انداز کریں...")، یا انکوڈنگ ٹرکس (بیس 64، ROT13، یونیکوڈ) سے مشابہت رکھتے ہوں۔

ان پٹ کی توثیق کے قواعد

اصول	نفاذ	مقصد
لمبائی کی حد	فی فیلڈ ان پٹ کی زیادہ سے زیادہ لمبائی	سیاق و سباق کے بہاؤ کو روکیں
کریکٹر فلٹرنگ	بلاک کنٹرول حروف اور خصوصی ٹوکن	انکوڈنگ کے ذریعے انجیکشن کو روکیں
پیٹرن کا پتہ لگانا	جھنڈا معلوم انجیکشن پیٹرن	براہ راست حملوں کو پکڑو
شرح محدود	فی صارف زیادہ سے زیادہ درخواستیں فی ٹائم ونڈو	وحشیانہ طاقت کے حملوں کو روکیں
فارمیٹ کی توثیق	متوقع ان پٹ ڈھانچہ کو نافذ کریں	سٹرکچرڈ فیلڈز میں فریفارم انجیکشن کو روکیں

گہرائی میں دفاع

کوئی ایک دفاع تمام فوری انجیکشن کو نہیں روکتا ہے۔ پرت متعدد دفاع:

ان پٹ سینیٹائزیشن حملے کے معلوم نمونوں کو ہٹا دیتی ہے۔
سسٹم پرامپٹ سختی اوور رائڈ کوششوں کے خلاف مزاحمت کرتی ہے۔
آؤٹ پٹ کی توثیق ایجنٹ کے غیر ارادی رویے کو پکڑتی ہے۔
انجیکشن کامیاب ہونے پر اجازت کی حدود نقصان کو محدود کرتی ہیں۔
آڈٹ لاگنگ پتہ لگانے اور فرانزک تجزیہ کے قابل بناتی ہے۔

پرت 2: اجازت کی حدود

کم سے کم استحقاق کا اصول

ہر AI ایجنٹ کے پاس اس کے کام کے لیے ضروری کم از کم اجازتیں ہونی چاہئیں:

| ایجنٹ کی قسم | پڑھنے کی اجازتیں | اجازتیں لکھیں | مسدود | |------------|------|---------| | کسٹمر سروس | کسٹمر ریکارڈز، آرڈرز، اکثر پوچھے گئے سوالات | ٹکٹ کی تخلیق، نوٹ | مالیاتی ڈیٹا، منتظم کی ترتیبات | | انوینٹری مانیٹر | اسٹاک کی سطح، مصنوعات کا ڈیٹا | الرٹ تخلیق | قیمت میں تبدیلی، حذف | | رپورٹ جنریٹر | تمام کاروباری ڈیٹا (صرف پڑھنے کے لیے) | رپورٹ فائل تخلیق | کاروباری ریکارڈ پر کوئی تحریر | | سیلز اسسٹنٹ | CRM رابطے، پائپ لائن، مصنوعات | مواقع کی تازہ کاری، کام کی تخلیق | مالیاتی ریکارڈ، HR ڈیٹا |

اجازت کا نفاذ

بنیادی ڈھانچے کی سطح پر اجازتوں کو نافذ کریں، نہ کہ فوری سطح پر:

API کلیدی اسکوپنگ: مخصوص اختتامی رسائی کے ساتھ API کیز جاری کریں۔
ڈیٹا بیس کے نظارے: ایجنٹ کے ڈیٹا تک رسائی کے لیے صرف پڑھنے کے نظارے بنائیں
نیٹ ورک کی تقسیم: ایجنٹ کے نیٹ ورک کی رسائی کو صرف مطلوبہ خدمات تک محدود کریں۔
فائل سسٹم آئسولیشن: ایجنٹوں کو نامزد ڈائریکٹریوں سے آگے فائل سسٹم تک رسائی نہیں کرنی چاہیے

اضافہ کی روک تھام

ایجنٹوں کو ان کی اپنی اجازتیں بڑھانے سے روکیں:

ایجنٹوں کو کبھی بھی اجازت نہ دیں کہ وہ اپنی اجازت کی ترتیب میں ترمیم کریں۔
ایجنٹ کے اکاؤنٹس میں ایڈمن APIs یا اجازت کے انتظام کے اختتامی نکات کو ظاہر نہ کریں۔
غیر معمولی رسائی کے نمونوں کی نگرانی کریں (ایجنٹ اپنے عام دائرہ کار سے باہر وسائل تک رسائی حاصل کرتا ہے)
سخت حدود کو لاگو کریں جو ایجنٹ کے استدلال سے اوور رائڈ نہیں ہوسکتی ہیں۔

پرت 3: عملدرآمد سینڈ باکسنگ

سینڈ باکس والے ماحول

الگ تھلگ ماحول میں AI ایجنٹ کے کام کا بوجھ چلائیں:

تنہائی کی سطح	ٹیکنالوجی	کیس استعمال کریں
کنٹینر	Docker, Kubernetes pods	معیاری ایجنٹ ورک بوجھ
VM	ہلکا پھلکا VMs (فائر کریکر)	ناقابل اعتماد کوڈ پر عمل درآمد
ویب اسمبلی	Wasm سینڈ باکس	پلگ ان/ہنر پر عملدرآمد
نیٹ ورک نام کی جگہ	نیٹ ورک تنہائی فی ایجنٹ	پس منظر کی نقل و حرکت کی روک تھام

وسائل کی حدود

ایجنٹوں کو ضرورت سے زیادہ وسائل استعمال کرنے سے روکیں:

وسائل	حد	کیوں
CPU	فی ایجنٹ زیادہ سے زیادہ کور	کمپیوٹ کی اجارہ داری کو روکیں
یادداشت	زیادہ سے زیادہ RAM مختص	یادداشت سے باہر ہونے والے حالات کو روکیں
نیٹ ورک	شرح کی حد API کالز	سروس کے انکار کو روکیں
ذخیرہ	زیادہ سے زیادہ ڈسک کا استعمال	ڈسک کی تھکن کو روکیں
پھانسی کا وقت	فی کام زیادہ سے زیادہ رن ٹائم	لامحدود لوپس کو روکیں
API کالز	زیادہ سے زیادہ بیرونی کالز فی منٹ	غلط استعمال کو روکیں اور لاگت سے زیادہ

ٹائم آؤٹ اور سرکٹ بریکرز

ہر ایجنٹ کے کام کے لیے زیادہ سے زیادہ عملدرآمد کا وقت مقرر کریں۔
سرکٹ بریکرز کو لاگو کریں جو بار بار ناکامی کے بعد ایجنٹ کو غیر فعال کرتے ہیں۔
جب کوئی کام ناکام ہوجاتا ہے تو جزوی کارروائیوں کے لیے خودکار رول بیک کو ترتیب دیں۔

پرت 4: آؤٹ پٹ فلٹرنگ

ڈیٹا لیکیج کی روک تھام

حساس ڈیٹا کی نمائش کو روکنے کے لیے فلٹر ایجنٹ آؤٹ پٹ:

| فلٹر کی قسم | یہ کیا پکڑتا ہے | نفاذ | |----------------------------|--------------------------------| | PII کا پتہ لگانا | نام، ای میلز، فون نمبرز، SSNs | Regex پیٹرن + ML درجہ بندی | | مالیاتی ڈیٹا | کریڈٹ کارڈ نمبر، بینک اکاؤنٹس | Luhn کی توثیق + پیٹرن کی مماثلت | | اسناد | API کیز، پاس ورڈز، ٹوکنز | اینٹروپی تجزیہ + پیٹرن میچنگ | | اندرونی ڈیٹا | سسٹم فن تعمیر، IP پتے | اپنی مرضی کے پیٹرن کے قوانین |

آؤٹ پٹ کی توثیق

اس بات کی توثیق کریں کہ ایجنٹ کی پیداوار متوقع فارمیٹس سے ملتی ہے:

سٹرکچرڈ آؤٹ پٹ (JSON، ڈیٹا بیس لکھتا ہے) کو متعین اسکیموں کے مطابق ہونا چاہیے
فطری زبان کے نتائج کو فریب کے اشارے کے لئے چیک کیا جانا چاہئے۔
ایکشن آؤٹ پٹس (API کالز، فائل آپریشنز) اعلان کردہ ارادے سے مماثل ہونا چاہیے۔
صارفین کے جوابات میں سسٹم پرامپٹ مواد یا اندرونی استدلال شامل نہیں ہونا چاہیے۔

مواد کی حفاظت

کسٹمر کا سامنا کرنے والے ایجنٹوں کے لیے:

نامناسب مواد کے لیے آؤٹ پٹس کو فلٹر کریں۔
اس بات کو یقینی بنائیں کہ جوابات ایجنٹ کے متعین دائرہ کار میں رہیں
ایجنٹ کو غیر مجاز وعدے یا وعدے کرنے سے روکیں۔
بلاک آؤٹ پٹ جو قانونی، طبی، یا مالی مشورے کی تشکیل کر سکتے ہیں (جب تک کہ خاص طور پر مجاز نہ ہو)

پرت 5: آڈٹ لاگنگ

کیا لاگ کرنا ہے۔

ہر ایجنٹ کی کارروائی کو کافی تفصیل کے ساتھ لاگ ان ہونا چاہیے:

لاگ فیلڈ	مواد	مقصد
ٹائم اسٹیمپ	کارروائی کا عین وقت	ٹائم لائن کی تعمیر نو
ایجنٹ کی شناخت	کس ایجنٹ نے کارروائی کی	احتساب
ایکشن کی قسم	پڑھیں، لکھیں، API کال، فیصلہ	درجہ بندی
ان پٹ	کارروائی کو متحرک کیا	بنیادی وجہ تجزیہ
آؤٹ پٹ	کارروائی نے کیا پیدا کیا	اثر کی تشخیص
ہدف	کون سا سسٹم/ریکارڈ متاثر ہوا	دائرہ کار کا تعین
صارف سیاق و سباق	کس صارف نے (اگر کوئی ہے) بہاؤ شروع کیا	انتساب
فیصلہ استدلال	ایجنٹ نے اس کارروائی کا انتخاب کیوں کیا	وضاحت

لاگ برقرار رکھنا

لاگ کی قسم	برقرار رکھنے کی مدت	ذخیرہ
سیکورٹی کے واقعات	2+ سال	ناقابل تبدیل اسٹوریج
مالی اقدامات	7+ سال (ریگولیٹری)	ناقابل تبدیل اسٹوریج
آپریشنل لاگز	90 دن	معیاری اسٹوریج
ڈیبگ لاگز	30 دن	عارضی ذخیرہ

بے ضابطگی کا پتہ لگانا

مشکوک پیٹرن کے لیے لاگز کی نگرانی کریں:

غیر معمولی رسائی کے اوقات (ایجنٹ کاروباری اوقات سے باہر بغیر طے شدہ کاموں کے کام کرتا ہے)
پیٹرن کی تبدیلیوں تک رسائی (ایجنٹ اچانک مختلف ڈیٹا کیٹیگریز پڑھ رہا ہے)
خرابی کی شرح میں اضافہ (ممکنہ انجیکشن کی کوششیں)
حجم کی بے ضابطگیوں (10x نارمل API کالز)

ہیومن ان دی لوپ کنٹرولز

کب انسانی منظوری کی ضرورت ہے۔

| آپریشن کیٹیگری | منظوری کی ضرورت | |--------------------------------------------| | حد سے اوپر مالی لین دین | ہمیشہ منظوری کی ضرورت ہوتی ہے | | بلک ڈیٹا میں ترمیم (100+ ریکارڈز) | ہمیشہ منظوری کی ضرورت ہوتی ہے | | گاہکوں کو بیرونی مواصلات | قابل اعتماد ثابت ہونے تک منظوری کی ضرورت ہے | | سسٹم کنفیگریشن تبدیلیاں | ہمیشہ منظوری کی ضرورت ہوتی ہے | | نیا پیٹرن/رویہ پہلے نہیں دیکھا گیا | جائزہ لینے کے لیے جھنڈا لگائیں |

منظوری ورک فلو

ایجنٹ ایک ایسی کارروائی کی نشاندہی کرتا ہے جس کی منظوری کی ضرورت ہوتی ہے۔
سیاق و سباق اور دلیل کے ساتھ منظوری کی درخواست بھیجتا ہے۔
انسانی جائزے اور منظوری، ترمیم، یا مسترد کرتے ہیں۔
ایجنٹ منظور شدہ کارروائی انجام دیتا ہے (یا ترمیم شدہ ورژن)
نتیجہ مستقبل کی تربیت اور پالیسی کی اصلاح کے لیے درج کیا جاتا ہے۔

گریجویٹ خود مختاری

سخت انسانی نگرانی کے ساتھ شروع کریں اور آہستہ آہستہ آرام کریں:

مرحلہ	نگرانی کی سطح	دورانیہ
1. شیڈو موڈ	ایجنٹ کا مشورہ، انسانی پھانسی	2-4 ہفتے
2. زیر نگرانی	ایجنٹ پھانسی دیتا ہے، انسانی جائزہ تمام	2-4 ہفتے
3. اسپاٹ چیکڈ	ایجنٹ پھانسی دیتا ہے، انسانی جائزے کا نمونہ (20%)	4-8 ہفتے
4. استثنیٰ پر مبنی	ایجنٹ پھانسی دیتا ہے، انسانی جائزہ بے ضابطگیوں	جاری

اوپن کلا سیکیورٹی کی خصوصیات

OpenClaw ان حفاظتی بہترین طریقوں کو مقامی طور پر نافذ کرتا ہے:

ایجنٹ کی اجازتوں کے لیے کردار پر مبنی رسائی کا کنٹرول
بلٹ میں فوری انجیکشن کا پتہ لگانے اور فلٹرنگ
مہارت پر عمل درآمد کے لیے پھانسی سینڈ باکسنگ
قابل ترتیب برقرار رکھنے کے ساتھ جامع آڈٹ لاگنگ
انسانی منظوری ورک فلو انضمام
بے ضابطگی کا پتہ لگانے والے ڈیش بورڈز

ECOSIRE AI سیکیورٹی سروسز

AI ایجنٹوں کو محفوظ طریقے سے تعینات کرنے کے لیے سائبر سیکیورٹی اور AI سسٹمز پر محیط مہارت کی ضرورت ہوتی ہے۔ ECOSIRE کی OpenClaw security hardening services اس گائیڈ میں بیان کردہ مکمل سیکیورٹی فریم ورک کو نافذ کرتی ہے۔ ہماری OpenClaw نفاذ کی خدمات میں ہر تعیناتی کے بنیادی جزو کے طور پر حفاظتی فن تعمیر شامل ہے۔

اہم نکات

AI ایجنٹ کی سیکیورٹی کے لیے پانچ پرتوں میں دفاع کی گہرائی کی ضرورت ہوتی ہے: ان پٹ کی توثیق، اجازت کی حدود، عملدرآمد سینڈ باکسنگ، آؤٹ پٹ فلٹرنگ، اور آڈٹ لاگنگ
فوری انجیکشن AI ایجنٹوں کے خلاف بنیادی حملہ کرنے والا ویکٹر ہے اور اس کے لیے صرف مواد کی فلٹرنگ نہیں بلکہ ساختی دفاع کی ضرورت ہوتی ہے۔
کم از کم استحقاق کا اصول انسانی صارفین کے مقابلے AI ایجنٹوں پر زیادہ سختی سے لاگو ہوتا ہے کیونکہ ایجنٹ مشین کی رفتار سے کام کرتے ہیں۔
پروڈکشن سسٹم پر ایجنٹ کی تمام کارروائیوں کو فرانزک تجزیہ کے لیے کافی تفصیل کے ساتھ لاگ ان ہونا چاہیے
ہیومن ان دی لوپ چیک پوائنٹس اس وقت تک بہت زیادہ اثر انداز ہونے والے آپریشنز کے لیے ضروری ہیں جب تک کہ ایجنٹ کی قابل اعتمادی ثابت نہ ہو جائے۔

اے آئی ایجنٹ کا خطرہ ماڈل

حملے کی سطح

AI ایجنٹ روایتی ایپلی کیشنز سے ہٹ کر حملے کی سطحوں کو بے نقاب کرتے ہیں:

حملہ ویکٹر	تفصیل	خطرے کی سطح
فوری انجکشن	بدنیتی پر مبنی ان پٹ جو ایجنٹ کے رویے کو تبدیل کرتا ہے	تنقیدی
اجازت میں اضافہ	ایجنٹ اپنے دائرہ کار سے باہر وسائل تک رسائی حاصل کر رہا ہے	ہائی
ڈیٹا اکٹھا کرنا	ایجنٹ آؤٹ پٹس کے ذریعے سامنے آنے والا حساس ڈیٹا	ہائی
سروس سے انکار	زبردست ایجنٹ کے وسائل یا لامحدود لوپس کو متحرک کرنے والے	میڈیم
سپلائی چین	سمجھوتہ شدہ مہارت، پلگ ان، یا ماڈل وزن	ہائی
سوشل انجینئرنگ	بات چیت کے فریب کے ذریعے ایجنٹ کو جوڑ توڑ	میڈیم
ڈیٹا پوائزننگ کی تربیت	ایجنٹ کے فیصلوں کو متاثر کرنے والا تربیتی ڈیٹا کرپٹ	میڈیم

خطرے کے زمرے

زمرہ	مثالیں
رازداری	ایجنٹ کسٹمر PII، مالیاتی ڈیٹا، یا تجارتی رازوں سے پردہ اٹھاتا ہے۔
سالمیت	ایجنٹ غلط طریقے سے ڈیٹا میں ترمیم کرتا ہے، جعلی ریکارڈ بناتا ہے۔
دستیابی	ایجنٹ ضرورت سے زیادہ وسائل استعمال کرتا ہے، جائز کاموں کو روکتا ہے
تعمیل	ایجنٹ کی کارروائیاں ضوابط کی خلاف ورزی کرتی ہیں (GDPR, HIPAA, SOX)

پرت 1: ان پٹ کی توثیق

فوری انجیکشن ڈیفنس

ان پٹ کی توثیق کے قواعد

اصول	نفاذ	مقصد
لمبائی کی حد	فی فیلڈ ان پٹ کی زیادہ سے زیادہ لمبائی	سیاق و سباق کے بہاؤ کو روکیں
کریکٹر فلٹرنگ	بلاک کنٹرول حروف اور خصوصی ٹوکن	انکوڈنگ کے ذریعے انجیکشن کو روکیں
پیٹرن کا پتہ لگانا	جھنڈا معلوم انجیکشن پیٹرن	براہ راست حملوں کو پکڑو
شرح محدود	فی صارف زیادہ سے زیادہ درخواستیں فی ٹائم ونڈو	وحشیانہ طاقت کے حملوں کو روکیں
فارمیٹ کی توثیق	متوقع ان پٹ ڈھانچہ کو نافذ کریں	سٹرکچرڈ فیلڈز میں فریفارم انجیکشن کو روکیں

گہرائی میں دفاع

کوئی ایک دفاع تمام فوری انجیکشن کو نہیں روکتا ہے۔ پرت متعدد دفاع:

ان پٹ سینیٹائزیشن حملے کے معلوم نمونوں کو ہٹا دیتی ہے۔
سسٹم پرامپٹ سختی اوور رائڈ کوششوں کے خلاف مزاحمت کرتی ہے۔
آؤٹ پٹ کی توثیق ایجنٹ کے غیر ارادی رویے کو پکڑتی ہے۔
انجیکشن کامیاب ہونے پر اجازت کی حدود نقصان کو محدود کرتی ہیں۔
آڈٹ لاگنگ پتہ لگانے اور فرانزک تجزیہ کے قابل بناتی ہے۔

پرت 2: اجازت کی حدود

کم سے کم استحقاق کا اصول

ہر AI ایجنٹ کے پاس اس کے کام کے لیے ضروری کم از کم اجازتیں ہونی چاہئیں:

اجازت کا نفاذ

بنیادی ڈھانچے کی سطح پر اجازتوں کو نافذ کریں، نہ کہ فوری سطح پر:

API کلیدی اسکوپنگ: مخصوص اختتامی رسائی کے ساتھ API کیز جاری کریں۔
ڈیٹا بیس کے نظارے: ایجنٹ کے ڈیٹا تک رسائی کے لیے صرف پڑھنے کے نظارے بنائیں
نیٹ ورک کی تقسیم: ایجنٹ کے نیٹ ورک کی رسائی کو صرف مطلوبہ خدمات تک محدود کریں۔
فائل سسٹم آئسولیشن: ایجنٹوں کو نامزد ڈائریکٹریوں سے آگے فائل سسٹم تک رسائی نہیں کرنی چاہیے

اضافہ کی روک تھام

ایجنٹوں کو ان کی اپنی اجازتیں بڑھانے سے روکیں:

ایجنٹوں کو کبھی بھی اجازت نہ دیں کہ وہ اپنی اجازت کی ترتیب میں ترمیم کریں۔
ایجنٹ کے اکاؤنٹس میں ایڈمن APIs یا اجازت کے انتظام کے اختتامی نکات کو ظاہر نہ کریں۔
غیر معمولی رسائی کے نمونوں کی نگرانی کریں (ایجنٹ اپنے عام دائرہ کار سے باہر وسائل تک رسائی حاصل کرتا ہے)
سخت حدود کو لاگو کریں جو ایجنٹ کے استدلال سے اوور رائڈ نہیں ہوسکتی ہیں۔

پرت 3: عملدرآمد سینڈ باکسنگ

سینڈ باکس والے ماحول

الگ تھلگ ماحول میں AI ایجنٹ کے کام کا بوجھ چلائیں:

تنہائی کی سطح	ٹیکنالوجی	کیس استعمال کریں
کنٹینر	Docker, Kubernetes pods	معیاری ایجنٹ ورک بوجھ
VM	ہلکا پھلکا VMs (فائر کریکر)	ناقابل اعتماد کوڈ پر عمل درآمد
ویب اسمبلی	Wasm سینڈ باکس	پلگ ان/ہنر پر عملدرآمد
نیٹ ورک نام کی جگہ	نیٹ ورک تنہائی فی ایجنٹ	پس منظر کی نقل و حرکت کی روک تھام

وسائل کی حدود

ایجنٹوں کو ضرورت سے زیادہ وسائل استعمال کرنے سے روکیں:

وسائل	حد	کیوں
CPU	فی ایجنٹ زیادہ سے زیادہ کور	کمپیوٹ کی اجارہ داری کو روکیں
یادداشت	زیادہ سے زیادہ RAM مختص	یادداشت سے باہر ہونے والے حالات کو روکیں
نیٹ ورک	شرح کی حد API کالز	سروس کے انکار کو روکیں
ذخیرہ	زیادہ سے زیادہ ڈسک کا استعمال	ڈسک کی تھکن کو روکیں
پھانسی کا وقت	فی کام زیادہ سے زیادہ رن ٹائم	لامحدود لوپس کو روکیں
API کالز	زیادہ سے زیادہ بیرونی کالز فی منٹ	غلط استعمال کو روکیں اور لاگت سے زیادہ

ٹائم آؤٹ اور سرکٹ بریکرز

ہر ایجنٹ کے کام کے لیے زیادہ سے زیادہ عملدرآمد کا وقت مقرر کریں۔
سرکٹ بریکرز کو لاگو کریں جو بار بار ناکامی کے بعد ایجنٹ کو غیر فعال کرتے ہیں۔
جب کوئی کام ناکام ہوجاتا ہے تو جزوی کارروائیوں کے لیے خودکار رول بیک کو ترتیب دیں۔

پرت 4: آؤٹ پٹ فلٹرنگ

ڈیٹا لیکیج کی روک تھام

حساس ڈیٹا کی نمائش کو روکنے کے لیے فلٹر ایجنٹ آؤٹ پٹ:

آؤٹ پٹ کی توثیق

اس بات کی توثیق کریں کہ ایجنٹ کی پیداوار متوقع فارمیٹس سے ملتی ہے:

سٹرکچرڈ آؤٹ پٹ (JSON، ڈیٹا بیس لکھتا ہے) کو متعین اسکیموں کے مطابق ہونا چاہیے
فطری زبان کے نتائج کو فریب کے اشارے کے لئے چیک کیا جانا چاہئے۔
ایکشن آؤٹ پٹس (API کالز، فائل آپریشنز) اعلان کردہ ارادے سے مماثل ہونا چاہیے۔
صارفین کے جوابات میں سسٹم پرامپٹ مواد یا اندرونی استدلال شامل نہیں ہونا چاہیے۔

مواد کی حفاظت

کسٹمر کا سامنا کرنے والے ایجنٹوں کے لیے:

نامناسب مواد کے لیے آؤٹ پٹس کو فلٹر کریں۔
اس بات کو یقینی بنائیں کہ جوابات ایجنٹ کے متعین دائرہ کار میں رہیں
ایجنٹ کو غیر مجاز وعدے یا وعدے کرنے سے روکیں۔
بلاک آؤٹ پٹ جو قانونی، طبی، یا مالی مشورے کی تشکیل کر سکتے ہیں (جب تک کہ خاص طور پر مجاز نہ ہو)

پرت 5: آڈٹ لاگنگ

کیا لاگ کرنا ہے۔

ہر ایجنٹ کی کارروائی کو کافی تفصیل کے ساتھ لاگ ان ہونا چاہیے:

لاگ فیلڈ	مواد	مقصد
ٹائم اسٹیمپ	کارروائی کا عین وقت	ٹائم لائن کی تعمیر نو
ایجنٹ کی شناخت	کس ایجنٹ نے کارروائی کی	احتساب
ایکشن کی قسم	پڑھیں، لکھیں، API کال، فیصلہ	درجہ بندی
ان پٹ	کارروائی کو متحرک کیا	بنیادی وجہ تجزیہ
آؤٹ پٹ	کارروائی نے کیا پیدا کیا	اثر کی تشخیص
ہدف	کون سا سسٹم/ریکارڈ متاثر ہوا	دائرہ کار کا تعین
صارف سیاق و سباق	کس صارف نے (اگر کوئی ہے) بہاؤ شروع کیا	انتساب
فیصلہ استدلال	ایجنٹ نے اس کارروائی کا انتخاب کیوں کیا	وضاحت

لاگ برقرار رکھنا

لاگ کی قسم	برقرار رکھنے کی مدت	ذخیرہ
سیکورٹی کے واقعات	2+ سال	ناقابل تبدیل اسٹوریج
مالی اقدامات	7+ سال (ریگولیٹری)	ناقابل تبدیل اسٹوریج
آپریشنل لاگز	90 دن	معیاری اسٹوریج
ڈیبگ لاگز	30 دن	عارضی ذخیرہ

بے ضابطگی کا پتہ لگانا

مشکوک پیٹرن کے لیے لاگز کی نگرانی کریں:

غیر معمولی رسائی کے اوقات (ایجنٹ کاروباری اوقات سے باہر بغیر طے شدہ کاموں کے کام کرتا ہے)
پیٹرن کی تبدیلیوں تک رسائی (ایجنٹ اچانک مختلف ڈیٹا کیٹیگریز پڑھ رہا ہے)
خرابی کی شرح میں اضافہ (ممکنہ انجیکشن کی کوششیں)
حجم کی بے ضابطگیوں (10x نارمل API کالز)

ہیومن ان دی لوپ کنٹرولز

کب انسانی منظوری کی ضرورت ہے۔

منظوری ورک فلو

ایجنٹ ایک ایسی کارروائی کی نشاندہی کرتا ہے جس کی منظوری کی ضرورت ہوتی ہے۔
سیاق و سباق اور دلیل کے ساتھ منظوری کی درخواست بھیجتا ہے۔
انسانی جائزے اور منظوری، ترمیم، یا مسترد کرتے ہیں۔
ایجنٹ منظور شدہ کارروائی انجام دیتا ہے (یا ترمیم شدہ ورژن)
نتیجہ مستقبل کی تربیت اور پالیسی کی اصلاح کے لیے درج کیا جاتا ہے۔

گریجویٹ خود مختاری

سخت انسانی نگرانی کے ساتھ شروع کریں اور آہستہ آہستہ آرام کریں:

مرحلہ	نگرانی کی سطح	دورانیہ
1. شیڈو موڈ	ایجنٹ کا مشورہ، انسانی پھانسی	2-4 ہفتے
2. زیر نگرانی	ایجنٹ پھانسی دیتا ہے، انسانی جائزہ تمام	2-4 ہفتے
3. اسپاٹ چیکڈ	ایجنٹ پھانسی دیتا ہے، انسانی جائزے کا نمونہ (20%)	4-8 ہفتے
4. استثنیٰ پر مبنی	ایجنٹ پھانسی دیتا ہے، انسانی جائزہ بے ضابطگیوں	جاری

اوپن کلا سیکیورٹی کی خصوصیات

OpenClaw ان حفاظتی بہترین طریقوں کو مقامی طور پر نافذ کرتا ہے:

ایجنٹ کی اجازتوں کے لیے کردار پر مبنی رسائی کا کنٹرول
بلٹ میں فوری انجیکشن کا پتہ لگانے اور فلٹرنگ
مہارت پر عمل درآمد کے لیے پھانسی سینڈ باکسنگ
قابل ترتیب برقرار رکھنے کے ساتھ جامع آڈٹ لاگنگ
انسانی منظوری ورک فلو انضمام
بے ضابطگی کا پتہ لگانے والے ڈیش بورڈز

AI Agent Security Best Practices: Protecting Autonomous Systems

اہم نکات

اے آئی ایجنٹ کا خطرہ ماڈل

حملے کی سطح

خطرے کے زمرے

پرت 1: ان پٹ کی توثیق

فوری انجیکشن ڈیفنس

ان پٹ کی توثیق کے قواعد

گہرائی میں دفاع

پرت 2: اجازت کی حدود

کم سے کم استحقاق کا اصول

اجازت کا نفاذ

اضافہ کی روک تھام

پرت 3: عملدرآمد سینڈ باکسنگ

سینڈ باکس والے ماحول

وسائل کی حدود

ٹائم آؤٹ اور سرکٹ بریکرز

پرت 4: آؤٹ پٹ فلٹرنگ

ڈیٹا لیکیج کی روک تھام

آؤٹ پٹ کی توثیق

مواد کی حفاظت

پرت 5: آڈٹ لاگنگ

کیا لاگ کرنا ہے۔

لاگ برقرار رکھنا

بے ضابطگی کا پتہ لگانا

ہیومن ان دی لوپ کنٹرولز

کب انسانی منظوری کی ضرورت ہے۔

منظوری ورک فلو

گریجویٹ خود مختاری

اوپن کلا سیکیورٹی کی خصوصیات

ECOSIRE AI سیکیورٹی سروسز

متعلقہ پڑھنا

ذہین AI ایجنٹس بنائیں

متعلقہ مضامین

25 Business Process Automation Examples That Actually Work in 2026 (From a Team Running Them in Production)

9 ERPNext Implementation Mistakes That Sink Projects (And How to Avoid Them)

Building an OpenClaw Skill That Runs Your Shopify Store: Step-by-Step Tutorial

Security & Cybersecurity سے مزید

API Security 2026: Authentication & Authorization Best Practices (OWASP Aligned)

ای کامرس کے لیے سائبر سیکیورٹی: 2026 میں اپنے کاروبار کی حفاظت کریں

Cybersecurity Trends 2026-2027: Zero Trust, AI Threats, and Defense

Cloud Security Best Practices for SMBs: Protect Your Cloud Without a Security Team

Cybersecurity Regulatory Requirements by Region: A Compliance Map for Global Businesses

Endpoint Security Management: Protect Every Device in Your Organization

AI Agent Security Best Practices: Protecting Autonomous Systems

اہم نکات

اے آئی ایجنٹ کا خطرہ ماڈل

حملے کی سطح

خطرے کے زمرے

پرت 1: ان پٹ کی توثیق

فوری انجیکشن ڈیفنس

ان پٹ کی توثیق کے قواعد

گہرائی میں دفاع

پرت 2: اجازت کی حدود

کم سے کم استحقاق کا اصول

اجازت کا نفاذ

اضافہ کی روک تھام

پرت 3: عملدرآمد سینڈ باکسنگ

سینڈ باکس والے ماحول

وسائل کی حدود

ٹائم آؤٹ اور سرکٹ بریکرز

پرت 4: آؤٹ پٹ فلٹرنگ

ڈیٹا لیکیج کی روک تھام

آؤٹ پٹ کی توثیق

مواد کی حفاظت

پرت 5: آڈٹ لاگنگ

کیا لاگ کرنا ہے۔

لاگ برقرار رکھنا

بے ضابطگی کا پتہ لگانا

ہیومن ان دی لوپ کنٹرولز

کب انسانی منظوری کی ضرورت ہے۔

منظوری ورک فلو

گریجویٹ خود مختاری

اوپن کلا سیکیورٹی کی خصوصیات

ECOSIRE AI سیکیورٹی سروسز

متعلقہ پڑھنا

ذہین AI ایجنٹس بنائیں

متعلقہ مضامین

25 Business Process Automation Examples That Actually Work in 2026 (From a Team Running Them in Production)

9 ERPNext Implementation Mistakes That Sink Projects (And How to Avoid Them)