مشین لرننگ میں کنفیوژن میٹرکس: آپ کا ون اسٹاپ حل



اس مضمون میں کنفیوژن میٹرکس پر فوکس کیا گیا ہے ، جو کسی بھی مشین لرننگ الگورتھم کی درستگی کا اندازہ کرنے کے لئے استعمال ہونے والے اہم پہلوؤں میں سے ایک ہے۔

میں ، ہمارے پاس عام طور پر استعمال کے 2 مختلف اقسام ہوتے ہیں ، ، اور مسئلہ کنفیوژن میٹرکس درجہ بندی ماڈل کی درستگی کا حساب لگانے میں مدد کرتا ہے جو درجہ بندی ماڈل کی کارکردگی کو بیان کرنے میں بالواسطہ مدد کرتا ہے۔ جب ماڈل کی جانچ پڑتال کی بات آتی ہے تو یہ سب سے اہم مرحلہ ہوتا ہے۔ میں اس مضمون میں مندرجہ ذیل عنوانات کا احاطہ کرتا ہوں:

1. کنفیوژن میٹرکس کیا ہے؟





2. کنفیوژن میٹرکس کی درستگی اور اجزاء

3. صحت سے متعلق ، یاد اور F پیمائش



4. ازگر اور اسکلرن کا استعمال کرکے کنفیوژن میٹرکس کی تشکیل

کنفیوژن میٹرکس کیا ہے؟

کنفیوژن میٹرکس پیش گوئی کردہ نتائج کا موازنہ کا خلاصہ اور کسی بھی درجہ بندی میں دشواری کے استعمال کے معاملے میں اصل نتائج ہیں۔ کسی تربیتی اعداد و شمار کی تربیت کے بعد ماڈل کی کارکردگی کا تعی toن کرنے کے لئے موازنہ کا خلاصہ انتہائی ضروری ہے۔ Accuracy-Confusion-Matrixبائنری درجہ بندی کے استعمال کے معاملے کے لئے ، کنفیوژن میٹرکس ایک 2 × 2 میٹرکس ہے جو ذیل میں دکھایا گیا ہے
پیش گوئی کلاس 1 ویلیو ای جی: 1 پیش گوئی کلاس 2 ویلیو ای جی: 0
اصل کلاس 1 قیمت

مثال کے طور پر جاوا میں کاسٹنگ ٹائپ کریں

ای جی: 1

ٹی پی (حقیقی مثبت) ایف این (غلط منفی)
اصل کلاس 2 ویلیو



ای جی: 0

ایف پی (غلط مثبت) TN (سچ منفی)

مندرجہ بالا اعداد و شمار سے:
ہمارے پاس ،

  • اصل کلاس 1 قدر = 1 جو بائنری نتائج میں مثبت قدر کی طرح ہے۔
  • اصل کلاس 2 کی قیمت = 0 جو بائنری نتائج میں منفی قدر کی طرح ہے۔

کنفیوژن میٹرکس کا بائیں جانب کا انڈیکس بنیادی طور پر اصل اقدار کی نشاندہی کرتا ہے اور اوپری کالم پیش گوئی کی گئی اقدار کی نشاندہی کرتا ہے۔

جب ہم کنفیوژن میٹرکس تشکیل دیتے ہیں تو بہت سارے اجزاء موجود ہوتے ہیں۔ اجزاء ذیل میں ذکر کیا گیا ہے

مثبت (P): پیش گوئی شدہ نتیجہ مثبت ہے (مثال: شبیہہ بلی ہے)

منفی (ن): پیش گوئی شدہ نتیجہ منفی ہے (مثال: امیجز بلی نہیں ہیں)

ٹھوس مثبت (ٹی پی): یہاں ٹی پی بنیادی طور پر پیش گوئی کی نشاندہی کرتا ہے اور اصل اقدار 1 ہیں (سچ)

سچ منفی (ٹی این): یہاں ٹی این نے پیش گوئی کی نشاندہی کی ہے اور اصل قیمت 0 ہے (غلط)

جھوٹی منفی (ایف این): یہاں ایف این اشارہ کرتا ہے کہ پیش گوئی کی گئی قیمت 0 (منفی) ہے اور اصل قدر 1 ہے۔ یہاں دونوں اقدار مماثل نہیں ہیں۔ لہذا یہ غلط منفی ہے۔

غلط مثبت (FP): یہاں ایف پی اشارہ کرتا ہے کہ پیش گوئی کی گئی قیمت 1 (مثبت) ہے اور اصل قیمت 0 ہے۔ یہاں پھر دونوں اقدار مماثل نہیں ہیں۔ لہذا یہ غلط ہے مثبت.

کنفیوژن میٹرکس کی درستگی اور اجزاء

کنفیوژن میٹرکس بننے کے بعد اور ہم تمام اجزاء کی اقدار کا تعین کرتے ہیں ، تو درستگی کا حساب لگانا ہمارے لئے بہت آسان ہوجاتا ہے۔ تو ، آئیے اس کو بہتر طور پر سمجھنے کے ل the اجزاء پر ایک نظر ڈالیں۔
  • درجہ بندی کی درستگی

مذکورہ فارمولے سے ، TP (True Positive) اور TN (True Negative) کا مجموعہ صحیح پیش گوئی کرنے والے نتائج ہیں۔ لہذا درستگی کا حساب کتاب کرنے کے ل to ، ہم دوسرے تمام اجزاء کے ساتھ تقسیم کرتے ہیں۔ تاہم ، درستگی میں کچھ پریشانیاں ہیں اور ہم اس پر پوری طرح انحصار نہیں کرسکتے ہیں۔

آئیے ہم غور کریں کہ ہمارا ڈیٹاسیٹ مکمل طور پر متوازن ہے۔ اس منظر نامے میں ، 98 فیصد درستگی مسئلے کے بیان کی بنیاد پر اچھی یا بری ہوسکتی ہے۔ لہذا ہمارے پاس کچھ اور اہم شرائط ہیں جو ہمارے حساب سے درستگی کے بارے میں یقینی ہونے میں ہماری مدد کریں گی۔ شرائط ذیل میں دی گئی ہیں:

  • ٹی پی آر (حقیقی مثبت شرح) یا حساسیت:

حقیقی مثبت شرح جو حساسیت کے نام سے بھی جانا جاتا ہے کل اصل مثبت کے حوالے سے حقیقی مثبت کی فیصد کو ماپا جاتا ہے جس کی طرف اشارہ کیا جاتا ہے (TP + FN)

پیش گوئی کلاس 1 ویلیو ای جی: 1 پیش گوئی کلاس 2 ویلیو ای جی: 0 کل
اصل کلاس 1 قیمت

ای جی: 1

ٹی پی (حقیقی مثبت) ایف این (غلط منفی) کل اصل مثبت
اصل کلاس 2 ویلیو

ونڈوز کے لئے بہترین جاوا آئیڈیا

ای جی: 0

ایف پی (غلط مثبت)TN (سچ منفی)کل اصل منفی
ٹی پی آر = سچا مثبت / (سچ مثبت + غلط منفی)
  • TNR (حقیقی منفی شرح) یا خصوصیت:

حقیقی منفی شرح یا خاصیت کل منفیوں کے سلسلے میں اصل نفی کے تناسب کو ماپتی ہے

پیش گوئی کلاس 1 ویلیو ای جی: 1 پیش گوئی کلاس 2 ویلیو ای جی: 0 کل
اصل کلاس 1 قیمت

ای جی: 1

ٹی پی (حقیقی مثبت)ایف این (غلط منفی)کل اصل مثبت
اصل کلاس 2 ویلیو

ای جی: 0

ایف پی (غلط مثبت) TN (سچ منفی) کل اصل منفی

TNR = سچ منفی / (سچ منفی + غلط مثبت)

  • غلط مثبت شرح (ایف پی آر):

جھوٹی مثبت شرح پیش گوئی شدہ مثبت نتائج (ٹی پی + ایف پی) کی کل نمبر کی پیش گوئ شدہ غلط جھوٹی (ایف پی) کی فیصد ہے۔

پیش گوئی کلاس 1 ویلیو ای جی: 1 پیش گوئی کلاس 2 ویلیو ای جی: 0
اصل کلاس 1 ویلیو ای جی: 1 ٹی پی (حقیقی مثبت) ایف این (غلط منفی)
اصل کلاس 2 ویلیو ای جی: 0 ایف پی (غلط مثبت) TN (سچ منفی)
کل پیش گوئی شدہ مثبت کا مجموعہ کل پیش گوئ شدہ منفی کا مجموعہ
ایف پی آر = غلط مثبت / (حقیقی مثبت + غلط مثبت)
  • جھوٹی منفی شرح (FNR):

جھوٹی منفی شرح پیش گوئ شدہ منفی نتائج (ٹی این + ایف این) کی کل تعداد کی پیش گوئ شدہ جھوٹی منفی (ایف پی) کی فیصد ہے۔

پیش گوئی کلاس 1 ویلیو ای جی: 1 پیش گوئی کلاس 2 ویلیو ای جی: 0
اصل کلاس 1 ویلیو ای جی: 1ٹی پی (حقیقی مثبت) ایف این (غلط منفی)
اصل کلاس 2 ویلیو ای جی: 0ایف پی (غلط مثبت) TN (سچ منفی)
کل پیش گوئی شدہ مثبت کا مجموعہ کل پیش گوئ شدہ منفی کا مجموعہ
FNR = غلط منفی / (جھوٹی منفی + حقیقی منفی)

صحت سے متعلق ، یاد رکھنا ، اور ایف پیمائش

  • یاد:

ایک یاد آوری سچے مثبت شرح سے ملتی جلتی ہے اور یہ تمام مثبت قدروں کے ساتھ صحیح پیش گوئ مثبت اقدار (ٹی پی) کی کل تعداد کا تناسب ہے۔

  • صحت سے متعلق:

صحت سے متعلق بنیادی طور پر ان تمام نکات کی نشاندہی کرتی ہے جن کی ماڈل نے پیش گوئی کی ہے کہ وہ مثبت ہے اور ان میں سے کتنا فی صد مثبت ہے۔

صحت سے متعلق اور یاد آوری میٹرک کے نتائج ہیں جو مثبت طبقے پر مرکوز ہیں جیسا کہ مذکورہ فارمولوں سے ظاہر ہوتا ہے۔

  • ایف پیمائش

لہذا ایف پیمائش ایک ایسی تکنیک ہے جو پریسجن اور ریکال دونوں تکنیک کو یکجا کرتی ہے اور اس میں ہرمونک مائن کو معمول کے ارسطھک مائن کی جگہ پر استعمال کیا جاتا ہے ، جس کی وجہ سے انتہائی اقدار کو سزا ملتی ہے۔ ایف پیمائش کو F1- اسکور بھی کہا جاتا ہے اور یہ ذیل کے فارمولے کے ذریعہ دیا گیا ہے۔

آئیے ہم ایک مثال پر غور کریں اور دیکھیں کہ ہم درستگی ، صحت سے متعلق ، یاد آوری اور ایف 1 اسکور کی گنتی کیسے کرسکتے ہیں۔

این = 165 ہاں کی پیش گوئ پیش گوئی نہیں
اصل ہاں ٹی پی = 150 ایف این = 10
موجودہ نمبر ایف پی = 20 TN = 100
    • درستگی = (TP + TN) / (TP + TN + FP + FN) = (150 + 100) / (150 + 100 + 20 + 10) = 0.89
    • یاد کریں = TP / (TP + FN) = 150 / (150 + 10) = 0.93
    • صحت سے متعلق: TP / (TP + FP) = 150 / (150 + 20) = 0.88

  • ایف پیمائش = (2 * یاد * پریسجن) / (یاد + پریسن) = (2 * 0.93 * 0.88) / (0.93 + 0.88) = 0.90

ازگر اور اسکرلن کا استعمال کرکے کنفیوژن میٹرکس کی تشکیل

اب ہم اس کی ایک مثال دیکھیں گے کہ ہم اسکلن لائبریری کے ساتھ ساتھ ہم اژدھے کا استعمال کرکے ایک کنفیوژن میٹرکس کیسے بنا سکتے ہیں۔

ایک ابتدائی طور پر ، ہم اصل اعداد و شمار کی کچھ فہرست تیار کریں گے اور پیش گوئی کی گئی ہے جیسا کہ ذیل میں دکھایا گیا ہے

کنفیوژن میٹرکس تخلیق کے لئے # ازگر اسکرپٹ۔ اصل_ڈیٹا = [1 ، 1 ، 0 ، 1 ، 0 ، 0 ، 1 ، 0 ، 0 ، 0،1،0،1] پیشن گوئی_ڈیٹا = [0 ، 1 ، 1 ، 1 ، 0 ، 0 ، 1 ، 0 ، 1 ، 0،1،0،1]

2 ہمیں اسکیلرن لائبریری سے کنفیوژن میٹرکس درآمد کرنے کی ضرورت ہے جیسا کہ ذیل میں دکھایا گیا ہے:

اسکیلرن ڈیمیٹرکس سے درآمد کنفیوژن_میٹرکس

اگلا ، ہم کنفیوژن میٹرکس تشکیل دیں گے جیسا کہ ذیل میں دکھایا گیا ہے:

حتمی_ نتائج = کنفیوژن_میٹرکس (اصل_ڈیٹا ، پیشن گوئی_ڈیٹا)

چار اب ہم لائبریری کو درآمد کرکے امپورٹ کرکے درآمد اور درستگی کا حساب لگاسکتے ہیں:

اسکیلرن ڈیمیٹرکس سے درآمد کی درستگی_سکور کی درستگی = درستگی_سکور (اصل_ڈیٹا ، پیشن گوئی_ڈیٹا)

5 آخر میں ، ہم F1 اسکور یا F- پیمائش کی گنتی کرتے ہیں جیسا کہ ذیل میں دکھایا گیا ہے:

اسکیلرن ڈیمیٹکس سے درآمد کریں درجہ بندی_ریپورٹ رپورٹ = درجہ بندی_ریپورٹ (اصل_ڈیٹا ، پیشن گوئی_ڈیٹا)

ذیل میں مکمل کوڈ ہے:

سی ++ اسٹوریج کلاس
اصل_ڈیٹا = [1 ، 1 ، 0 ، 1 ، 0 ، 0 ، 1 ، 0 ، 0 ، 0،1،0،1] پیشن گوئی_ڈیٹا = [0 ، 1 ، 1 ، 1 ، 0 ، 0 ، 1 ، 0 ، 1 ، 0،1،0،1] اسکلیرن سے اصلی_ڈیٹا ، پیشن گوئی_ڈیٹا) پرنٹ (درستگی) پرنٹ (رپورٹ)

matrix

تو ، اس کے ساتھ ، ہم اس مضمون کا اختتام کرتے ہیں۔ میں امید کرتا ہوں کہ کنفیوژن میٹرکس کے بارے میں آپ کا سارا کنفیوژن اب حل ہو گیا ہے۔

ایڈورکا کی آپ کو مشین سیکھنے کے مختلف الگورتھم جیسے مہارت حاصل کرنے میں مدد ملتی ہے جیسے رجعت ، جھرمٹ ، فیصلے کے درخت ، بے ترتیب جنگل ، نوائے بائیس اور کیو لرننگ۔ ازگر ٹریننگ کا استعمال کرتے ہوئے یہ مشین لرننگ آپ کو شماریات ، ٹائم سیریز اور مشین سیکھنے کے الگورتھم جیسے مختلف نگران ، غیر نگرانی اور کمک الگورتھم جیسے مختلف کلاسوں کے تصورات سے پردہ اٹھاتی ہے۔ ڈیٹا سائنس سرٹیفیکیشن کورس کے دوران ، آپ میڈیا ، ہیلتھ کیئر ، سوشل میڈیا ، ایوی ایشن ، ایچ آر پر حقیقی زندگی کے کیس اسٹڈیز کو حل کرتے رہیں گے۔