التوقعات
التنبؤ
نظرة عامة
تم تحديد عدم تطابق اللغة وإعداد تحسينات باللغة الإنجليزية
تقدم وحدة التنبؤ في SKOOR تنبؤات قائمة على التعلم الآلي للاتجاهات المستقبلية على بيانات السلاسل الزمنية. تتوفر أربعة نماذج:
الانحدار الخطي (انظر الوثائق الرسمية هنا)
تدعم جميع النماذج السلاسل المفهرسة حسب التاريخ والوقت والمستمدة مباشرة من SKOOR DataSource أو DataQuery.
صفحة التنبؤ
تنقسم صفحة التنبؤ إلى قسمين.
الصفحة العامة
يتضمن هذا القسم إعدادات التنبؤات.
على الجانب الأيسر:
الإعداد | الوصف |
|---|---|
الفترة | الفترة المطلوبة للتنبؤ. |
تمكين الجدولة | جدولة التوقعات لأتمتة عمليات التوقعات. |
تكوين نموذج التوقعات | اختر نموذج التنبؤ. |
تكوين تعريف البيانات | اختر البيانات للتنبؤ. |
محدد نسخ الجدول | زر لنسخ الجدول الذي يحتوي على التوقعات. |
تشغيل التنبؤ | تشغيل توقع واحد باستخدام الإعدادات المحددة. يمكن رؤية الحالة والتقدم على صفحة التشغيل. |
حفظ | يحفظ تكوين التوقعات. إذا تم تحديد خيار البحث عن المعلمات الفائقة في أداة تكوين النموذج، فسيتم تشغيل توقعات تلقائيًا عند الحفظ. |
يوجد على الجانب الأيمن نظرة عامة على بيانات التوقعات في جدول. لا يتم عرضها إلا في حالة وجود توقعات مسبقة.
صفحة التشغيل
هذا القسم مسؤول عن تشغيل ومراقبة عمليات التشغيل للتنبؤ. يوفر التحكم في السجل ويتيح الحصول على رؤى.
يمكن تشغيل التنبؤ بالنقر فوق زر تشغيل التنبؤ. يمكن حذف السجل الكامل للتشغيلات بالنقر فوق زر حذف سجل المهام. لاحظ أن أي جداول تم إنشاؤها بواسطة التنبؤات سيتم حذفها، وللحصول عليها مرة أخرى، يجب تشغيل التنبؤ مرة أخرى. عندما تكون المهمة لا تزال قيد التشغيل، يمكن إلغاؤها بالنقر فوق علامة X الحمراء على الجانب الأيمن من الحالة المعروضة.
عند النقر على مهمة، يمكن رؤية مخرجات وحدة التحكم والتقدم والحالة ومعلومات إضافية. في مخرجات وحدة التحكم، يتم طباعة كل مجموعة ودقتها. يتم قياس الدقة المطبوعة باستخدام WAPE (الخطأ المئوي المطلق المرجح)، وتظهر بالنسب المئوية ويتم حسابها بناءً على أداء النموذج على البيانات التاريخية.
إنشاء توقعات
يمكن إنشاء تكوين توقعات إما بالنقر على زر الإضافة على الجانب الأيسر وإدخال اسم أو باستيراد توقعات باستخدام تنسيق json. عند إنشاء تكوين توقعات، يجب ضبط بعض الإعدادات في الصفحة العامة.
تكوين النموذج
يؤدي النقر على زر "تكوين نموذج التوقعات" إلى فتح مربع حوار حيث يمكن اختيار النموذج. حاليًا، هناك 4 خيارات مختلفة للنموذج يمكن رؤيتها أدناه. تتميز بعض النماذج بزر تحسين المعلمات الفائقة الذي يسمح للنموذج باختبار مجموعات مختلفة من المعلمات الفائقة من أجل العثور على أفضلها. يتم سرد المعلمات الفائقة المختلفة التي يمكن ضبطها أسفل النموذج. إذا تم تشغيل البحث عن المعلمات الفائقة بالفعل، يمكنك عرض المعلمات الفائقة ونسخها بالنقر فوق الزر "إظهار المعلمات الفائقة المحسّنة".
بمجرد الانتهاء من ضبط المعلمات الفائقة، انقر فوق "حفظ" لحفظ تكوين النموذج أو "إلغاء" للتراجع عن التغييرات.
تتوفر النماذج التالية للاختيار من بينها:
Prophet
Prophet هي أداة مفتوحة المصدر تعتمد على التعلم الآلي طورتها Meta (Facebook سابقًا) للتنبؤ ببيانات السلاسل الزمنية. وهي مصممة لتكون قوية في التعامل مع البيانات المفقودة والتغيرات في الاتجاه، وتتميز بشكل خاص في التنبؤ بالسلاسل الزمنية ذات الموسمية القوية. يمكن لـ Prophet التعامل تلقائيًا مع تأثيرات العطلات وتسمح للمستخدم بتعيين المعلمات الفائقة الخاصة به لجعلها أكثر دقة.
يعد Prophet الخيار الأكثر استخدامًا من بين الخيارات المتاحة لأنه يستغرق وقتًا معتدلًا للتدريب ولكنه يقدم أفضل النتائج باستمرار، مما يجعله الخيار الأكثر فعالية من حيث التكلفة في معظم السيناريوهات. يتفوق Prophet عند تزويده ببيانات لعدة مواسم تحدث فيها تأثيرات موسمية متكررة أو تأثيرات العطلات أو تحولات غير منتظمة في الاتجاه.
عند اختياره، يعرض نموذج Prophet أيضًا نطاقات فاصل الثقة، مما يشير إلى درجة يقين النموذج في تنبؤاته. عند عرضها على لوحة المعلومات، تظهر نطاقات فاصل الثقة بلون أفتح حول التوقعات.
يمكن تكوين المتغيرات التالية:
الإعداد | الوصف |
|---|---|
seasonality_mode | يحدد ما إذا كانت التأثيرات الموسمية تُضاف إلى الاتجاه أم تُضرب فيه. الافتراضي: |
yearly_seasonality | تمكين أو تعطيل أو الكشف التلقائي عن ملاءمة نمط موسمي سنوي. الافتراضي: |
weekly_seasonality | تمكين أو تعطيل أو الكشف التلقائي عن ملاءمة نمط موسمي أسبوعي. الافتراضي: |
daily_seasonality | تمكين أو تعطيل أو الكشف التلقائي عن ملاءمة نمط موسمي يومي. الافتراضي: |
interval_width | عرض نطاق عدم اليقين الذي يتم إرجاعه مع كل توقعات. الافتراضي: |
mcmc_samples | عدد عينات MCMC للاستدلال البايزي الكامل؛ 0 يستخدم تقدير MAP بدلاً من ذلك. الافتراضي: |
changepoint_prior_scale | يتحكم في مرونة الاتجاه عند نقاط التغيير؛ تسمح القيم الأعلى بتحولات أكثر حدة في الاتجاه. القيمة الافتراضية: |
seasonality_prior_scale | قوة التنظيم لمكونات الموسمية؛ تسمح القيم الأعلى بتقلبات موسمية أكبر. الافتراضي: |
holidays_prior_scale | يتحكم في حجم تأثيرات العطلات على التوقعات. الافتراضي: |
changepoint_range | نسبة تاريخ التدريب التي يُسمح فيها بحدوث نقاط تغيير الاتجاه. القيمة الافتراضية: |
n_changepoints | عدد نقاط التغيير المحتملة في الاتجاه التي يتم وضعها تلقائيًا في فترة التدريب. القيمة الافتراضية: |
uncertainty_samples | عدد السحوبات اللاحقة المستخدمة لتقدير فترات عدم اليقين في التوقعات. الافتراضي: |
SARIMAX
SARIMAX (المتوسط المتحرك المتكامل الذاتي التراجع الموسمي مع المتغيرات الخارجية) هو نموذج إحصائي يستخدم للتنبؤ بالنقاط المستقبلية بناءً على البيانات السابقة. وهو يتعامل مع كل من الاتجاهات والأنماط الموسمية. وهو امتداد لنموذج ARIMA بإضافة مكونات موسمية.
يعمل SARIMAX بشكل خاص عندما تكون البيانات مستقرة ومتسقة وحيث يُفضل النموذج الإحصائي على نموذج التعلم الآلي.
لا توجد متغيرات في نموذج SARIMAX يمكن للمستخدم ضبطها.
الانحدار الخطي
يُستخدم الانحدار الخطي للتنبؤ بالاتجاهات فقط عن طريق ملاءمة خط مستقيم مع بيانات التدريب وتوسيع هذا الخط إلى المستقبل. وهو أداة قوية للتنبؤ بالاتجاهات المستقبلية في أي بيانات سلسلة زمنية.
يُستخدم الانحدار الخطي بشكل أفضل عندما تُظهر البيانات الأساسية اتجاهًا خطيًا واضحًا ومتسقًا مع الحد الأدنى من الموسمية أو الضوضاء.
لا توجد متغيرات في نموذج الانحدار الخطي يمكن للمستخدم ضبطها.
XGBoost
يستخدم نموذج XGBoost أشجار القرار المعززة بالتدرج للتنبؤ المباشر متعدد الخطوات. قبل التدريب، يطبق هندسة ميزات شاملة على السلسلة الزمنية المدخلة، ويستخرج ميزات التأخير والإحصاءات المتجددة والميزات القائمة على التقويم، ثم يتنبأ بكل نقطة مستقبلية بشكل مستقل.
يعمل XGBoost بشكل أفضل مع البيانات المعقدة وغير الخطية. يمكنه الوصول إلى دقة جيدة ولكنه يستغرق وقتًا للتدريب، وفي بعض الحالات، يجب معالجة البيانات مسبقًا بشكل منفصل.
يمكن تكوين المتغيرات التالية:
الإعداد | الوصف |
|---|---|
الهدف | دالة الخسارة المستخدمة أثناء التدريب؛ تحدد مقياس الخطأ الذي يقوم النموذج بتحسينه. الافتراضي: |
quantile_alpha | مستوى الكميات المستهدف عند استخدام انحدار الكميات كهدف. الافتراضي: |
n_estimators | عدد أشجار التعزيز المطلوب إنشاؤها؛ كلما زاد عدد الأشجار زادت السعة ولكن زاد خطر الإفراط في الملاءمة. الافتراضي: |
learning_rate | انكماش حجم الخطوة المطبق بعد كل شجرة لمنع الإفراط في الملاءمة. الافتراضي: |
max_depth | العمق الأقصى لكل شجرة؛ يتحكم في تعقيد النموذج وترتيب التفاعل. الافتراضي: |
min_child_weight | الحد الأدنى لمجموع أوزان الحالات المطلوب لإنشاء عقدة ورقة. القيمة الافتراضية: |
gamma | الحد الأدنى لتخفيض الخسارة المطلوب لتقسيم عقدة؛ القيم الأعلى تجعل النموذج أكثر تحفظًا. الافتراضي: |
subsample | نسبة الصفوف التدريبية التي يتم أخذ عينات منها لكل شجرة، تُستخدم لتقليل الإفراط في الملاءمة. القيمة الافتراضية: |
colsample_bytree | نسبة الميزات المختارة عشوائيًا عند إنشاء كل شجرة. الافتراضي: |
reg_alpha | مصطلح تنظيم L1 على أوزان الأوراق؛ يعزز الحلول المتفرقة. الافتراضي: |
reg_lambda | مصطلح تنظيم L2 على أوزان الأوراق؛ يعاقب قيم الأوزان الكبيرة. الافتراضي: |
مصدر البيانات
تتيح لك نافذة تكوين مصدر البيانات تحديد البيانات المستخدمة لتدريب النموذج.
يمكن اختيار مصدر البيانات على اليسار. هناك نوعان من مصادر البيانات: مصدر بيانات من قاعدة بيانات SKOOR الخاصة بك أو استعلام بيانات من علامة التبويب "استعلام البيانات". هناك خيارات إضافية مطلوبة عند اختيار مصدر البيانات ويمكن تعيينها في النافذة، مثل مصدر البيانات والجدول والأعمدة. عند اختيار خيار استعلام البيانات، يجب تعيين استعلام البيانات، بالإضافة إلى الأعمدة من استعلام البيانات هذا.
يمكن تحديد أعمدة القيمة والطابع الزمني والمميّز بالنقر فوق القائمة المنسدلة. ستعرض القائمة المنسدلة تلقائيًا الأعمدة التي تفي بالمتطلبات. يجب اختيار الأعمدة التالية:
الإعداد | الوصف |
|---|---|
عمود القيمة | يجب أن يحتوي على قيم رقمية مرتبطة بكل طابع زمني. |
عمود الطابع الزمني | يجب أن تستخدم البيانات تنسيق الطابع الزمني YYYY-MM-DD HH:mm، ويجب أن تحتوي كل مجموعة بيانات على طوابع زمنية فريدة لكل مجموعة (المجموعات المحددة بواسطة أعمدة التمييز أو بنية البيانات المتأصلة). |
أعمدة التمييز | أعمدة اختيارية تُستخدم لتحديد التجميع والتسلسل الهرمي (على سبيل المثال، البلد → الولاية → المدينة). لا توجد متطلبات صارمة للبيانات، ولكن ترتيب الأعمدة مهم، حيث إن كل مستوى يزيد من دقة التجميع. |
على الجانب الأيمن من نافذة البيانات، يمكن اختيار المزيد من المعالجة المسبقة للبيانات.
الإعداد | الوصف |
|---|---|
التردد | يحدد دقة إخراج التوقعات. مزيد من المعلومات. |
نوع الاستيفاء | يحدد كيفية ملء الطوابع الزمنية المفقودة. مزيد من المعلومات. |
نوع التجميع | يتحكم في كيفية دمج القيم المتعددة خلال فترة معينة. مزيد من المعلومات. |
التكرار
سيحدد التكرار ناتج التوقعات. يمكن اختيار التكرارات التالية:
الإعداد | الوصف |
|---|---|
ثانية | إخراج التوقعات بدقة ثانية واحدة. |
MINUTELY | إخراج التنبؤ بدقة كل دقيقة. |
كل ساعة | نتائج التنبؤ بدقة كل ساعة. |
يومي | نتائج التنبؤ بدقة يومية. |
أسبوعي_الأحد | نتائج التنبؤ بدقة أسبوعية، ويبدأ الأسبوع يوم الأحد. |
أسبوعي_الاثنين | نتائج التنبؤ بدقة أسبوعية، يبدأ الأسبوع يوم الاثنين. |
WEEKLY_TUE | نتائج التنبؤ بدقة أسبوعية، يبدأ الأسبوع يوم الثلاثاء. |
WEEKLY_WED | نتائج التنبؤ بدقة أسبوعية، يبدأ الأسبوع يوم الأربعاء. |
WEEKLY_THU | نتائج التنبؤ بدقة أسبوعية، يبدأ الأسبوع يوم الخميس. |
WEEKLY_FRI | نتائج التنبؤ بدقة أسبوعية، يبدأ الأسبوع يوم الجمعة. |
WEEKLY_SAT | نتائج التنبؤ بدقة أسبوعية، يبدأ الأسبوع يوم السبت. |
MONTHLY_END | نتائج التنبؤ بدقة شهرية، مرتبطة بآخر يوم من الشهر. |
MONTHLY_START | نتائج التنبؤ بدقة شهرية، تبدأ من اليوم الأول من الشهر. |
QUARTERLY_END | نتائج التوقعات بدقة ربع سنوية، مرتبطة بآخر يوم من الربع. |
بداية_الربع | نتائج التوقعات بدقة ربع سنوية، مرتبطة بأول يوم من الربع. |
YEARLY_END | نتائج التوقعات بدقة سنوية، مرتبطة بآخر يوم من السنة. |
YEARLY_START | نتائج التوقعات بدقة سنوية، مرتبطة بأول يوم من السنة. |
داخليًا، يتم استيفاء أو تجميع سلسلة البيانات المقدمة إلى التردد المحدد باستخدام نوع الاستيفاء و/أو نوع التجميع. لاحظ أنه إذا كانت بياناتك تحتوي على أي طابع تاريخ مفقود بينها أو تحتوي على عدد كبير جدًا بالنسبة للتردد، يتم تطبيق الاستيفاء و/أو التجميع المحدد تلقائيًا لضمان تنبؤ سلس.
أنواع الاستيفاء:
الإعداد | الوصف |
|---|---|
لا شيء | لا يتم تطبيق أي استيفاء، وتتم معالجة البيانات كما هي. |
خطي | يملأ الفجوات عن طريق رسم خط مستقيم بين القيم المعروفة. |
الأول | يملأ الفجوات للأمام باستخدام آخر قيمة معروفة (ملء للأمام). |
الأخير | يملأ الفجوات للخلف باستخدام القيمة المعروفة التالية (ملء للخلف). |
المنحنى | يملأ الفجوات باستخدام منحنى مكعبي سلس يتم ملاءمته عبر القيم المعروفة. |
أنواع التجميع:
الإعداد | الوصف |
|---|---|
لا شيء | لم يتم تطبيق أي تجميع، تتم معالجة البيانات كما هي. |
المجموع | يجمع جميع القيم داخل كل فترة. |
المتوسط | يحسب متوسط جميع القيم في كل فترة. |
الوسيط | يعرض القيمة الوسطى لجميع القيم في كل فترة. |
العدد | يحسب عدد القيم غير الفارغة في كل فترة. |
الحد الأدنى | يعرض أصغر قيمة في كل فترة. |
الحد الأقصى | يعرض أكبر قيمة في كل فترة. |
الأول | يعرض القيمة الأولى في كل فترة. |
آخر | يعرض القيمة الأخيرة في كل فترة. |
STD | يحسب الانحراف المعياري لجميع القيم في كل فترة. |
الأذونات
للقراءة فقط
قراءة نتائج التوقعات
البحث عن تكوينات التوقعات حسب تعريف القيمة
المحرر
كل ما يمكن أن يفعله "للقراءة فقط"
سرد جميع تكوينات التنبؤات (عرض بسيط فقط)
محرر البيانات
كل ما يمكن أن يفعله المحرر
حقوق كاملة (إنشاء، قراءة، تحديث، حذف) على تكوينات ومجموعات التنبؤات
بدء مهام التنبؤ وعرضها وإلغاؤها
تصدير/استيراد التكوينات
المسؤول
كل ما يمكن أن يفعله محرر البيانات
حذف سجل المهام
عرض التوقعات على لوحة المعلومات
استخدام أداة التنبؤ الافتراضية
يوفر SKOOR وصولاً سهلاً إلى التوقعات من خلال إضافة زر في أداة الرسوم البيانية. ما عليك سوى إنشاء أداة رسوم بيانية على لوحة المعلومات، وتعيين نوع الرسم البياني على "مختلط" وتكوين تعريفات البيانات نفسها كما في تكوين التوقعات. بعد إعداد مصدر البيانات، انقر على "مزامنة الأعمدة" في قسم "الأعمدة" في أسفل يمين مربع حوار تحرير الأداة أو أضف العمود الذي تم توقعه يدويًا. ثم انقر على هذا العمود وحدد مربع "إظهار التوقعات". حدد إعدادات التنبؤ المطابقة من القائمة المنسدلة ثم قم بالتطبيق. الآن، يجب أن تعرض المعاينة بالفعل البيانات التاريخية مع التنبؤ المطابق.
استخدام استعلام بيانات مخصص
يمكن نسخ الجدول الذي يحتوي على نتائج التنبؤ إلى الحافظة بمجرد النقر على محدد "نسخ الجدول" في الصفحة العامة لتكوين التنبؤ. باستخدام هذا الجدول، يمكنك الوصول إلى بيانات التنبؤ وكتابة استعلام البيانات الخاص بك، على سبيل المثال في SKOOR Studio. لاحظ أن هناك اختلافات في أعمدة الجدول كما هو موضح:
عمود
عمود القيمة (يحمل نفس اسم عمود قيمة الإدخال.)
عمود طابع التاريخ (يحمل نفس اسم عمود طابع التاريخ المدخل.)
قيمة الثقة الدنيا (يحمل نفس اسم عمود قيمة الإدخال ولكن مع إضافة "_lower" في النهاية.)
قيمة الثقة العليا (يحمل نفس اسم عمود قيمة الإدخال ولكن مع إضافة "_upper" في النهاية.)
الدقة
أعمدة التمييز (عدد الأعمدة يساوي عدد أعمدة التمييز المحددة. تحمل نفس اسم أعمدة التمييز المدخلة.)
الانحدار الخطي
عمود القيمة (يُسمى بنفس اسم عمود قيمة الإدخال.)
عمود طابع التاريخ (يُسمى بنفس اسم عمود طابع التاريخ المدخل.)
الدقة
أعمدة التمييز (عدد الأعمدة هو نفسه عدد أعمدة التمييز المحددة. وتسمى بنفس أسماء أعمدة التمييز المدخلة.)
SARIMAX
عمود القيمة (يُسمى بنفس اسم عمود قيمة الإدخال.)
عمود طابع التاريخ (يُسمى بنفس اسم عمود طابع التاريخ في المدخلات.)
الدقة
أعمدة التمييز (عدد الأعمدة هو نفسه عدد أعمدة التمييز المحددة. وتسمى بنفس أسماء أعمدة التمييز المدخلة.)
XGBoost
عمود القيمة (يُسمى بنفس اسم عمود قيمة الإدخال.)
عمود طابع التاريخ (يُسمى بنفس اسم عمود طابع التاريخ في المدخلات.)
الدقة
أعمدة التمييز (عدد الأعمدة هو نفسه عدد أعمدة التمييز المحددة. وتسمى بنفس أسماء أعمدة التمييز المدخلة.)





