تخطي إلى المحتوى الرئيسي

التقارير وسجل الذكاء الاصطناعي وقابلية التتبع

البداية · التقارير وسجل الذكاء الاصطناعي وقابلية التتبع

التقارير والآثار

الهدف

تشرح هذه الصفحة الفرق بين الأثر، وإصدار الأثر، ومستند PM، ثم تفصل دور سجل الذكاء الاصطناعي في التدقيق والدعم.

ثلاثة مفاهيم يجب التمييز بينها

المصطلحالدور
الأثركائن محكوم ناتج عن run أو عمل مراجعة
إصدار الأثرحالة دقيقة لأثر، مع سجل، وdiff، ونسب
مستند PMمستند مشروع تمت مراجعته، أو تحريره، أو تنزيله، أو نشره، أو إعادة حقنه في المعرفة

دورة الحياة

التدفق الأكثر شيوعا هو:

  1. ينتج وكيل مخرجا منظما؛
  2. يتحول هذا المخرج إلى أثر في حالة مسودة؛
  3. يفتح المستخدم التقارير والآثار؛
  4. يراجع المحتوى، ويستشير diff والنسب؛
  5. يعتمد المستند، أو ينشره، أو ينزله، أو يضيفه إلى المعرفة.

الحالات الظاهرة

الأثر

الحالات المؤكدة على مستوى الأثر/الإصدار هي:

  • draft
  • approved
  • published
  • superseded

مستند PM

تعرض مستندات PM على الأقل حالات التوافق التالية:

  • draft
  • final

إذا بدت التقارير والآثار فارغة

يمكن أن يعرض مشروع ما مساحة فارغة لعدة أسباب طبيعية:

  • لم يتم بعد إنشاء أي أثر أو مستند PM؛
  • بقي run عند مرحلة المخرج المنظم من دون تحويل لاحق؛
  • يخفي المشروع الخطأ أو أحد المرشحات الصفوف المتوقعة؛
  • لا تحتوي البيئة على أمثلة محملة مسبقا مماثلة للقطات المرجعية.

في هذه الحالة، ارجع أولا إلى الوكلاء أو إلى سجل الذكاء الاصطناعي، ثم عد إلى التقارير والآثار عندما يصبح هناك كائن محكوم.

الإجراءات المتاحة في التقارير والآثار

يعرض المركز إجراءات مثل:

  • review / preview؛
  • diff؛
  • lineage؛
  • edit؛
  • download؛
  • add to knowledge؛
  • publish؛
  • delete.

Diff، والنسب، وإدارة الإصدارات

Diff

يقارن diff بين إصدارات الأثر. وهو مفيد خصوصا من أجل:

  • مراجعة الاختلافات قبل النشر؛
  • التمييز بين اقتراح وكيل وإصدار تم التحقق منه فعلا؛
  • فهم سبب اختلاف مستند نهائي عن مسودة سابقة.

النسب

يربط النسب بين:

  • source run ID؛
  • context snapshot ID؛
  • structured output ID؛
  • الأثر وإصداره؛
  • المنشورات والأدلة المرتبطة.

إدارة الإصدارات

تتيح الواجهة أيضا تحديد إصدار حسب الرقم وتحديد الإصدار السابق، أو أساس المقارنة، أو إصدار تم استبداله.

الاعتماد والنشر

تذكر هذه القواعد:

  • يكون Approve متاحا على إصدار في حالة draft؛
  • تصبح Publish متاحة عندما يكون الإصدار في حالة approved أو published بالفعل؛
  • يرسل النشر التنسيقات والوجهات المحكومة؛
  • تبقى الإضافة إلى المعرفة إجراء منفصلا عن التنزيل والنشر.

المحررات المتاحة

يتضمن المنتج عدة مساحات تحرير:

  • محرر غني / markdown للمخرجات الموجهة إلى المستندات؛
  • محرر بنمط شبكة للمخرجات الموجهة إلى جداول البيانات؛
  • وضع مراجعة / مصدر للقراءة إذا لم يكن التنسيق قابلا للتحرير بالطريقة نفسها.

التنزيلات المؤكدة: DOCX / XLSX.

حدود عملية يجب أخذها في الاعتبار

الحالةقراءة مفيدة
محتوى قابل للتحرير فعلااستخدم المحرر للمراجعة والتعديلات المضبوطة قبل الاعتماد
محتوى في وضع المراجعة أساساتعامل مع الشاشة كمساحة تحقق، لا كمكان رئيسي لإعادة الكتابة
حاجة إلى render مرجعي للإرساليبقى التنزيل المحكوم هو المخرج الأكثر موثوقية للمشاركة خارج التطبيق

محرر مستند PM والمراجعة المستندية

سجل الذكاء الاصطناعي

سجل الذكاء الاصطناعي: ما تغطيه الصفحة

يحتوي سجل الذكاء الاصطناعي على تبويبين منفصلين:

  • Runs؛
  • Activity.

Runs مقابل Activity

التبويبالغرض
Runsمراجعة تنفيذ وكيل، وبياناته الوصفية الخاصة بقابلية التتبع، وآثاره المرتبطة
Activityمراجعة خط زمني لأحداث المشروع وفحص payload الخام لحدث

متى تفتح Runs

افتح Runs من أجل:

  • فهم سبب إنتاج نتيجة؛
  • العثور على المزود المستخدم فعلا؛
  • مراجعة الحداثة، والثقة، والاستشهادات؛
  • ربط تنفيذ بأثر أو بمستند PM.

متى تفتح Activity

افتح Activity من أجل:

  • إعادة بناء تسلسل زمني؛
  • التحقق من أن مسودة، أو اعتمادا، أو نشرا ترك حدثا؛
  • فحص payload الخام عند إجراء دعم أو تدقيق.

أمثلة أحداث مفيدة لتأكيدها في Activity

بحسب التدفق، يمكن أن تساعدك Activity في تأكيد أن حدثا لاحقا تم تسجيله بشكل صحيح، مثلا:

  • إنشاء مسودة؛
  • اعتماد أثر؛
  • نشر؛
  • تحضير إشعار؛
  • قرار اعتماد، أو رفض، أو تنفيذ محكوم.

أمثلة ملموسة على Type / Kind

تستخدم القيم التالية كمرجع للأحداث الشائعة.

TypeKindقراءة عملية
agent_executioncompleted / failedانتهى تنفيذ وكيل بنجاح أو فشل
document_uploadstarted / completed / failedبدأ استيعاب مستند، أو اكتمل، أو فشل
report_generatedcompletedتم إنشاء مستند PM أو تقرير وتسجيله
marketplace_updatecompletedتم تسجيل إشعار أو تحديث نظام في السجل

المرشحات والأعمدة الظاهرة

Runs

المرشحات المتاحة:

  • بحث في الوكيل / الحالة / Run ID؛
  • مرشح الوكيل؛
  • مرشح الحالة.

الأعمدة الظاهرة: Created، Agent، Status، Cost، Run ID، Actions.

يعرض حقل Cost على الأقل tokens وعدد calls عندما تكون هذه المعلومات متاحة.

كيفية قراءة Trace ID، وCost، وConfidence، وSource freshness

حافظ على هذا التفسير بسيطا:

  • Run ID هو المرجع الأكثر عملية للعثور مجددا على صف ظاهر في Runs؛
  • يستخدم Trace ID قبل كل شيء للتشخيص بين الخدمات، والدعم، وربط التدقيق؛
  • يعرض Cost (tokens / calls) الاستخدام وقت التنفيذ لأغراض الشفافية والتحقيق، ولا يكون وحده إشارة اعتماد أعمال؛
  • Confidence إشارة للمراجعة، وليست دليلا بذاتها؛
  • توضح Source freshness إلى أي مدى ما زالت الأدلة المستشهد بها حديثة.

إذا احتجت إلى إشارة على مستوى المحفظة بشأن ضغط الميزانية أو الاستهلاك، فالمؤشر المناسب هو cost_pressure في المحفظة، وليس بطاقة Cost الخام الخاصة بـ run.

Activity

المرشحات المتاحة:

  • بحث في type / kind / actor؛
  • مرشح type؛
  • مرشح kind.

الأعمدة الظاهرة: Created، Type، Kind، Actor، ID، Actions.

التفاصيل التقنية الظاهرة في تنفيذ

يمكن أن يعرض تفصيل تنفيذ ما:

  • Trace ID؛
  • Context snapshot ID؛
  • Structured output ID؛
  • الاستشهادات؛
  • Effective AI Provider؛
  • Deployment-selected AI Provider؛
  • Model family؛
  • Confidence؛
  • Source freshness؛
  • الآثار المرتبطة.

شفافية runtime الذكاء الاصطناعي

التمييز التالي مهم:

  • مزود الذكاء الاصطناعي المحدد أثناء النشر: الاختيار الأولي للبيئة؛
  • مزود الذكاء الاصطناعي الفعلي: المزود المستخدم فعلا لهذا التنفيذ.

قد تختلف هاتان القيمتان. عند الشك، يكون سجل الذكاء الاصطناعي صالحا للتنفيذ الحالي.

قراءة بسيطة لـ Effective AI Provider

يجيب Effective AI Provider عن السؤال: «أي مزود خدم فعلا هذا run المحدد؟»

في التحقيق، تكون هذه القيمة أوثق من افتراض مبني فقط على الإعداد الإداري، لأن قيمة runtime قد تختلف عن المزود المحدد أثناء النشر.

المساحة التي ينبغي فتحها أولا بحسب العرض

العرضالمساحة التي ينبغي فتحها أولاالسبب
اختلاف في المحتوى بين المسودة والإصدار النهائيDiffلرؤية ما تغير فعلا
شك حول الدليل أو المصدرالنسبلربط التنفيذ، والمخرج المنظم، والأثر، والمصادر
شك حول runtime، أو المزود، أو تنفيذ الذكاء الاصطناعيRunsلمراجعة Trace ID، والمزود الفعلي، والحداثة، والثقة
شك حول النشر، أو الاعتماد، أو المتابعة اللاحقةActivityلتأكيد التسلسل الزمني وpayload الخام

سير عمل التحقيق الموصى به

عندما تبدو تسليمة، أو نشر، أو إشعار محل شك، ابدأ من الأكثر ظهورا نحو الأكثر تقنية:

  1. افتح مستند PM أو الأثر المعني؛
  2. راجع diff لمعرفة ما تغير فعلا؛
  3. افتح النسب لتحديد source run ID، وContext snapshot ID، وStructured output ID؛
  4. انتقل إلى Runs لمراجعة الحداثة، والثقة، والاستشهادات، ومزود الذكاء الاصطناعي الفعلي، والآثار المرتبطة؛
  5. استخدم Activity لتأكيد متابعة التدفق: مسودة، أو اعتماد، أو نشر، أو إشعار، أو إجراء محكوم؛
  6. احتفظ أخيرا بـ Trace ID إذا كان التحقيق يجب أن يستأنفه الدعم أو التدقيق.

الحالة 1 - يبدو مستند PM نهائي غير صحيح

  1. افتح مستند PM النهائي وأكد الإصدار المنشور فعلا؛
  2. استخدم Diff لتحديد ما تمت إضافته، أو حذفه، أو إعادة صياغته؛
  3. افتح النسب للعثور على source run ID وStructured output ID؛
  4. في Runs، تحقق من الأدلة، والحداثة، والمزود الفعلي؛
  5. إذا كان المحتوى النهائي لا يعكس التدفق المتوقع، فاختم في Activity للتحقق من الاعتماد، والنشر، والفاعل الذي دفع الإصدار.

الحالة 2 - لم يكتمل إجراء أو إشعار محضر

  1. ابدأ من المسودة، أو قائمة الإجراءات، أو الإشعار الظاهر؛
  2. حدد relatedArtifactId أو relatedNotificationId عندما يكونان موجودين؛
  3. استخدم Activity لتأكيد ما إذا كان اعتماد، أو رفض، أو تنفيذ قد تم تسجيله؛
  4. إذا بقيت المتابعة ملتبسة، فارجع إلى Runs للتحقق من التنفيذ المصدر والمنطق الذي أنتج التوصية؛
  5. وثق أخيرا Trace ID والمعرفات المرتبطة قبل التصعيد.

ما المعرفات التي ينبغي الاحتفاظ بها أولا

نوع الحادثالمعرفات التي ينبغي الاحتفاظ بها أولا
نتيجة تنفيذ محل شكTrace ID، وContext snapshot ID، وStructured output ID
أثر أو مستند PM نهائي مشبوهsource run ID، وStructured output ID، وإصدار الأثر المعني
إجراء أو إشعار بلا متابعة واضحةTrace ID، وrelatedArtifactId، وrelatedNotificationId
تحقيق دعم عابر للمجالاتكل المعرفات السابقة، مع الوقت التقريبي والمشروع المعني

ممارسات جيدة لقابلية التتبع

  • احتفظ بـ Trace ID عندما تكون للنتيجة أهمية؛
  • قبل النشر، تحقق من النسب بين التسليمة والدليل؛
  • عند وجود فرق بين إصدارين، استخدم diff قبل التحكيم؛
  • أضف إلى المعرفة التسليمات التي تمت مراجعتها فعلا فقط؛
  • استخدم Activity لإكمال التحقيق عندما لا تكفي Runs.

التالي