نظرة عامة
كيف يعمل التخزين المؤقت للمطالبات لدى المزود
يقوم التخزين المؤقت للمطالبات لدى المزود بتخزين التمثيل المعالج لبادئة مطالبتك على خوادم المزود. عندما ترسل طلباً بنفس البادئة، يمكن للمزود تخطي إعادة معالجة تلك الـ tokens.الخصائص الرئيسية
- يعتمد على البادئة: يمكن تخزين بداية مطالبتك فقط مؤقتاً
- مطابقة دقيقة: يتطلب tokens متطابقة تماماً (وليس تشابهاً دلالياً)
- محدد بوقت: تنتهي صلاحية مدخلات التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
- تلقائي: لا يلزم إجراء تكوين خاص
المزودون المدعومون
| المزود | خصم قراءة التخزين المؤقت | تكلفة كتابة التخزين المؤقت | الحد الأدنى للـ Tokens |
|---|---|---|---|
| Anthropic | خصم 90% | علاوة 25% | 1024 |
| OpenAI | خصم 50% | نفس تكلفة الإدخال | 1024 |
| DeepSeek | خصم 90% | نفس تكلفة الإدخال | 64 |
| خصم 75% | علاوة 25% | 32768 |
يتم تطبيق الخصومات تلقائياً. تقوم AI Sonar بتمرير أسعار التخزين المؤقت من المزود إليك مباشرة.
تحديد استخدام التخزين المؤقت
في سجلات الاستخدام
تعرض سجلات الاستخدام الخاصة بك تفصيلاً مفصلاً لـ tokens التخزين المؤقت:| الحقل | الوصف |
|---|---|
cacheReadTokens | الـ tokens المقدمة من التخزين المؤقت للمزود (مخفضة) |
cacheWriteTokens | الـ tokens المكتوبة في التخزين المؤقت (للطلبات المستقبلية) |
nonCachedPromptTokens | الـ tokens المعالجة بدون تخزين مؤقت |
في المعاملات
تعرض المعاملات علامة Provider Cache عند استخدام التخزين المؤقت من المصدر:- Provider Cache (أزرق مخضر): إصابة التخزين المؤقت للمزود - أسعار مخفضة
مثال على حساب التكلفة
لطلب يحتوي على 10,000 token إدخال إلى Claude (Anthropic): بدون تخزين مؤقت:أفضل الممارسات
استخدم مطالبات نظام متسقة
استخدم مطالبات نظام متسقة
ضع مطالبة النظام والسياق الثابت في بداية رسائلك. هذا يزيد من احتمالية إصابة التخزين المؤقت.
اجمع الطلبات المتشابهة
اجمع الطلبات المتشابهة
أرسل الطلبات ذات البادئة المتماثلة بشكل متقارب زمنياً للاستفادة من التخزين المؤقت قبل انتهاء صلاحيته.
استوفِ الحد الأدنى لمتطلبات الـ tokens
استوفِ الحد الأدنى لمتطلبات الـ tokens
تأكد من أن البادئة القابلة للتخزين المؤقت تستوفي الحد الأدنى للمزود (مثلاً 1024 token لـ Anthropic/OpenAI).
راقب مقاييس التخزين المؤقت
راقب مقاييس التخزين المؤقت
تحقق من إحصائيات الاستخدام في لوحة التحكم لمعرفة معدلات إصابة التخزين المؤقت والتوفير.
التحقق من حالة التخزين المؤقت
رؤوس الاستجابة
واجهة برمجة تطبيقات الاستخدام
استعلم عن سجلات الاستخدام لرؤية تفصيل التخزين المؤقت:الأسئلة الشائعة
هل يمكنني تعطيل التخزين المؤقت للمزود؟
هل يمكنني تعطيل التخزين المؤقت للمزود؟
التخزين المؤقت للمزود تلقائي ولا يمكن تعطيله. ومع ذلك، فهو يفيدك فقط (تكاليف أقل)، لذا لا يوجد سبب لتعطيله.
لماذا لم يصب طلبي التخزين المؤقت للمزود؟
لماذا لم يصب طلبي التخزين المؤقت للمزود؟
الأسباب الشائعة:
- تغيرت البادئة (حتى اختلاف token واحد)
- انتهت صلاحية التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
- البادئة قصيرة جداً (أقل من الحد الأدنى للـ tokens)
- تم استخدام مفتاح API مختلف
هل يدعم BYOK التخزين المؤقت للمزود؟
هل يدعم BYOK التخزين المؤقت للمزود؟
نعم! عند استخدام مفاتيح API الخاصة بك (BYOK)، يعمل التخزين المؤقت للمزود بنفس الطريقة. يرتبط التخزين المؤقت بمفتاح API الخاص بك لدى المصدر.
كيف أزيد من توفير التخزين المؤقت؟
كيف أزيد من توفير التخزين المؤقت؟
- نظّم المطالبات بحيث يكون المحتوى الثابت أولاً
- حافظ على اتساق مطالبات النظام عبر الطلبات
- أرسل الطلبات المتعلقة بشكل متتابع وسريع