الانتقال إلى المحتوى الرئيسي

نظرة عامة

كيف يعمل التخزين المؤقت للمطالبات لدى المزود

يقوم التخزين المؤقت للمطالبات لدى المزود بتخزين التمثيل المعالج لبادئة مطالبتك على خوادم المزود. عندما ترسل طلباً بنفس البادئة، يمكن للمزود تخطي إعادة معالجة تلك الـ tokens.

الخصائص الرئيسية

  • يعتمد على البادئة: يمكن تخزين بداية مطالبتك فقط مؤقتاً
  • مطابقة دقيقة: يتطلب tokens متطابقة تماماً (وليس تشابهاً دلالياً)
  • محدد بوقت: تنتهي صلاحية مدخلات التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
  • تلقائي: لا يلزم إجراء تكوين خاص
الطلب 1: [System prompt + Context A + Question 1]
          ^^^^^^^^^^^^^^^^^^^^^^^^
          يتم تخزين هذه البادئة مؤقتاً

الطلب 2: [System prompt + Context A + Question 2]
          ^^^^^^^^^^^^^^^^^^^^^^^^
          إصابة التخزين المؤقت! تتم معالجة السؤال 2 فقط

المزودون المدعومون

المزودخصم قراءة التخزين المؤقتتكلفة كتابة التخزين المؤقتالحد الأدنى للـ Tokens
Anthropicخصم 90%علاوة 25%1024
OpenAIخصم 50%نفس تكلفة الإدخال1024
DeepSeekخصم 90%نفس تكلفة الإدخال64
Googleخصم 75%علاوة 25%32768
يتم تطبيق الخصومات تلقائياً. تقوم AI Sonar بتمرير أسعار التخزين المؤقت من المزود إليك مباشرة.

تحديد استخدام التخزين المؤقت

في سجلات الاستخدام

تعرض سجلات الاستخدام الخاصة بك تفصيلاً مفصلاً لـ tokens التخزين المؤقت:
الحقلالوصف
cacheReadTokensالـ tokens المقدمة من التخزين المؤقت للمزود (مخفضة)
cacheWriteTokensالـ tokens المكتوبة في التخزين المؤقت (للطلبات المستقبلية)
nonCachedPromptTokensالـ tokens المعالجة بدون تخزين مؤقت

في المعاملات

تعرض المعاملات علامة Provider Cache عند استخدام التخزين المؤقت من المصدر:
  • Provider Cache (أزرق مخضر): إصابة التخزين المؤقت للمزود - أسعار مخفضة

مثال على حساب التكلفة

لطلب يحتوي على 10,000 token إدخال إلى Claude (Anthropic): بدون تخزين مؤقت:
10,000 tokens × $3.00/1M = $0.030
مع التخزين المؤقت للمزود (8,000 مخزنة مؤقتاً + 2,000 جديدة):
قراءة التخزين المؤقت:  8,000 tokens × $0.30/1M = $0.0024  (خصم 90%)
كتابة التخزين المؤقت: 2,000 tokens × $3.75/1M = $0.0075  (علاوة 25%)
الإجمالي: $0.0099 (توفير 67%)

أفضل الممارسات

ضع مطالبة النظام والسياق الثابت في بداية رسائلك. هذا يزيد من احتمالية إصابة التخزين المؤقت.
أرسل الطلبات ذات البادئة المتماثلة بشكل متقارب زمنياً للاستفادة من التخزين المؤقت قبل انتهاء صلاحيته.
تأكد من أن البادئة القابلة للتخزين المؤقت تستوفي الحد الأدنى للمزود (مثلاً 1024 token لـ Anthropic/OpenAI).
تحقق من إحصائيات الاستخدام في لوحة التحكم لمعرفة معدلات إصابة التخزين المؤقت والتوفير.

التحقق من حالة التخزين المؤقت

رؤوس الاستجابة

X-Upstream-Cache-Read: 8000   # tokens قراءة التخزين المؤقت للمزود
X-Upstream-Cache-Write: 2000  # tokens كتابة التخزين المؤقت للمزود

واجهة برمجة تطبيقات الاستخدام

استعلم عن سجلات الاستخدام لرؤية تفصيل التخزين المؤقت:
GET /v1/usage/logs is currently not a public endpoint.
Use X-Upstream-Cache-* response headers, plus the dashboard usage page.
تتضمن الاستجابة:
{
  "promptTokens": 10000,
  "cacheReadTokens": 8000,
  "cacheWriteTokens": 2000,
  "nonCachedPromptTokens": 0,
  "completionTokens": 500,
  "cost": 0.0099
}

الأسئلة الشائعة

التخزين المؤقت للمزود تلقائي ولا يمكن تعطيله. ومع ذلك، فهو يفيدك فقط (تكاليف أقل)، لذا لا يوجد سبب لتعطيله.
الأسباب الشائعة:
  • تغيرت البادئة (حتى اختلاف token واحد)
  • انتهت صلاحية التخزين المؤقت (عادةً من 5 إلى 60 دقيقة)
  • البادئة قصيرة جداً (أقل من الحد الأدنى للـ tokens)
  • تم استخدام مفتاح API مختلف
نعم! عند استخدام مفاتيح API الخاصة بك (BYOK)، يعمل التخزين المؤقت للمزود بنفس الطريقة. يرتبط التخزين المؤقت بمفتاح API الخاص بك لدى المصدر.
  1. نظّم المطالبات بحيث يكون المحتوى الثابت أولاً
  2. حافظ على اتساق مطالبات النظام عبر الطلبات
  3. أرسل الطلبات المتعلقة بشكل متتابع وسريع