عدد تنبؤات التصنيف الصحيحة مقسومًا على العدد الإجمالي للتنبؤات. هذا هو:
على سبيل المثال، النموذج الذي أجرى 40 تنبؤًا صحيحًا و10 تنبؤات غير صحيحة سيكون له دقة:
يوفر التصنيف الثنائي (Binary classification) أسماء محددة لفئات مختلفة من التنبؤات الصحيحة والتنبؤات غير الصحيحة. إذن، معادلة الدقة للتصنيف الثنائي هي كما يلي:
حيث:
- TP هو عدد الإيجابيات الحقيقية (True Positives) (تنبؤات صحيحة).
- TN هو عدد السلبيات الحقيقية (True Negatives) (تنبؤات صحيحة).
- FP هو عدد الإيجابيات الخاطئة (False Positives) (تنبؤات غير صحيحة).
- FN هو عدد السلبيات الخاطئة (False Negatives) (تنبؤات غير صحيحة).
قارن الدقة (accuracy) مع الدقة (precision) والاسترجاع (recall).
على الرغم من كونه مقياسًا قيمًا لبعض المواقف، إلا أن الدقة (accuracy) مضللة للغاية بالنسبة للآخرين. والجدير بالذكر أن الدقة (accuracy) عادةً ما تكون مقياسًا ضعيفًا لتقييم نماذج التصنيف التي تعالج مجموعات البيانات غير المتوازنة في الفئة(class-imbalanced datasets).
على سبيل المثال، لنفترض أن الثلج يتساقط 25 يومًا فقط في كل قرن في مدينة شبه استوائية معينة. نظرًا لأن الأيام الخالية من الثلج (الفئة السلبية Negative class) فاق عدد الأيام التي بها تساقط للثلوج (الفئة الإيجابية positive class)، فإن مجموعة بيانات الثلج لهذه المدينة غير متوازنة طبقًا. تخيل نموذج تصنيف ثنائي من المفترض أن يتوقع إما تساقط ثلوج أو عدم وجود ثلوج كل يوم ولكنه ببساطة يتوقع “عدم وجود ثلوج” كل يوم. هذا النموذج دقيق للغاية ولكن ليس له قوة تنبؤية. يلخص الجدول التالي نتائج قرن من التنبؤات:
لذلك فإن دقة هذا النموذج هي:
accuracy = (TP + TN) / (TP + TN + FP + FN)
accuracy = (0 + 36500) / (0 + 36500 + 25 + 0) = 0.9993 = 99.93%
على الرغم من أن الدقة البالغة 99.93٪ تبدو نسبة رائعة جدًا، إلا أن النموذج ليس لديه في الواقع قوة تنبؤية.
عادةً ما تكون الدقة (Precision) والاسترجاع (recall) مقاييس أكثر فائدة من الدقة في تقييم النماذج المدربة على مجموعات البيانات غير المتوازنة في الفئة.