ازگر میں لاجسٹک رجریشن کیسے انجام دیں؟



انحصار کرنے والے اور ایک یا ایک سے زیادہ آزاد متغیر کے مابین تعلقات کا تعی .ن کرکے نتائج کی پیش گوئی کرنے کے لئے اسکیلرن کا استعمال کرتے ہوئے ازگر میں لاجسٹک رجعت۔

ازگر میں لاجسٹک ریگریشن ایک پیشن گوئی تجزیہ تکنیک ہے۔ یہ بائنری درجہ بندی کی دشواریوں کے ل Machine مشین لرننگ میں بھی استعمال ہوتا ہے۔ اس بلاگ میں ہم ازگر میں لاجسٹک رجعت کو سمجھنے کے لئے مندرجہ ذیل موضوعات پر غور کریں گے۔

  1. رجعت کیا ہے؟
  2. ازگر میں لاجسٹک ریگریشن
  3. لاجسٹک رجریشن بمقابلہ لکیری رجریشن
  4. مقدمات استعمال کریں
  5. مظاہرہ

آپ بہتر تفہیم کے ل a مظاہرے کے ساتھ ازگر میں لاجسٹک ریگریشن سے متعلق اس تفصیلی ٹیوٹوریل کا حوالہ بھی دے سکتے ہیں یا پھر لاجسٹک رجعت ماسٹر کرنے کے لئے.





رجعت کیا ہے؟

تجزیہ ایک طاقتور شماریاتی تجزیہ تکنیک ہے۔ A منحصر ہماری دلچسپی کا متغیر دوسرے کی اقدار کی پیش گوئی کے لئے استعمال ہوتا ہے آزاد متغیر ڈیٹا سیٹ میں

ہم ہر وقت بدیہی انداز میں رجعت کا سامنا کرتے ہیں۔ ماضی میں موسمی حالات کے ڈیٹا سیٹ کا استعمال کرکے موسم کی پیش گوئی کرنا۔



نتائج کا تجزیہ اور پیش گوئی کرنے کے لئے یہ بہت ساری تکنیک استعمال کرتا ہے ، لیکن بنیادی طور پر اس پر زور دیا جاتا ہے منحصر متغیر اور ایک یا زیادہ آزاد متغیر کے مابین تعلق۔

تجزیہ ایک ثنائی متغیر میں نتائج کی پیش گوئی کرتا ہے جس کے صرف دو ممکنہ نتائج ہوتے ہیں۔



ازگر میں لاجسٹک ریگریشن

یہ ایک ڈیٹا سیٹ کا تجزیہ کرنے کی ایک تکنیک ہے جس میں ایک انحصار متغیر اور ایک یا ایک سے زیادہ آزاد متغیرات ہوتے ہیں جس کے نتیجے میں بائنری متغیر میں نتائج کی پیش گوئی کی جاسکتی ہے ، یعنی اس کے صرف دو نتائج ہوں گے۔

منحصر متغیر ہے دو ٹوک قدرت میں. منحصر متغیر کو بھی کہا جاتا ہے ہدف متغیر اور آزاد متغیرات کو کہا جاتا ہے پیشن گو .

لاجسٹک رجعت لکیری رجعت کا ایک خاص معاملہ ہے جہاں ہم صرف ایک متغیر متغیر میں انجام کی پیش گوئی کرتے ہیں۔ اس میں لاگ فنکشن کا استعمال کرکے ایونٹ کے امکان کے بارے میں پیش گوئی کی گئی ہے۔

ہم استعمال کرتے ہیں سگمائڈ فنکشن / وکر واضح قدر کی پیشن گوئی کرنے کے لئے. حد کی قیمت نتائج کا فیصلہ کرتی ہے (جیت / ہار)

لکیری رجعت مساوات: y = β0 + β1X1 + X2X2…. + این ایکس این

  • Y کا انحصار متغیر ہے جس کی پیش گوئی کی ضرورت ہے۔
  • β0 Y- انٹرسیپٹ ہے ، جو بنیادی طور پر اس لائن کا وہ نقطہ ہے جو y محور کو چھوتا ہے۔
  • β1 لائن کی ڈھال ہے (ڈھال منفی یا مثبت ہو سکتی ہے جو منحصر متغیر اور آزاد متغیر کے مابین تعلقات پر منحصر ہے۔)
  • X یہاں آزاد متغیر کی نمائندگی کرتا ہے جو ہمارے نتیجے میں منحصر قیمت کی پیش گوئی کے لئے استعمال ہوتا ہے۔

سگمائڈ فنکشن: p = 1/1 + ای-Y

لکیری رجعت مساوات پر سگمائڈ فنکشن لگائیں۔

ازگر-ایڈیورکا میں لاجسٹک ریگریشن

لاجسٹک ریگریشن مساوات: p = 1/1 + ای- (β0 + β1X1 + X2X2…. + XnXn)

آئیے مختلف قسم کے لاجسٹک ریگریشن پر ایک نظر ڈالیں۔

لاجسٹک رجعت کی اقسام

مربع میں ڈیٹا کی قسم
    • ثنائی لاجسٹک رجعت - اس کے صرف دو ہی ممکنہ نتائج ہیں۔ مثال- ہاں یا نہیں
    • متعدد لاجسٹک رجعت - اس میں تین یا زیادہ برائے نام قسمیں ہیں۔ مثال کے طور پر ، بلی ، کتا ، ہاتھی۔
    • عام لاجسٹک رجعت - اس میں تین یا زیادہ عام زمرے ہیں ، عام معنی یہ ہیں کہ زمرے ایک ترتیب میں ہوں گے۔ مثال- صارف کی درجہ بندی (1-5)

لکیری بمقابلہ لاجسٹک ریگریشن

جبکہ لکیری رجعت ہو سکتی ہے لامحدود ممکن اقدار ، لاجسٹک رجعت ہے یقینی نتائج .

جب ردعمل متغیر فطرت میں مستقل ہوتا ہے تو لکیری رجعت کا استعمال ہوتا ہے ، لیکن جب رسپانس متغیر فطرت میں طبقاتی ہو تو لاجسٹک ریگریشن کا استعمال کیا جاتا ہے۔

ماضی میں لین دین کی تفصیلات کا استعمال کرتے ہوئے کسی بینک میں ڈیفالٹر کی پیش گوئی کرنا لاجسٹک رجعت کی ایک مثال ہے ، جبکہ اسٹاک مارکیٹ کے اسکور کی طرح مستقل آؤٹ پٹ لکیری رجعت کی مثال ہے۔

مقدمات استعمال کریں

مندرجہ ذیل استعمال کے معاملات ہیں جہاں ہم لاجسٹک رجعت استعمال کرسکتے ہیں۔

موسم کی پیشن گوئی

موسم کی پیش گوئیاں منطقی رجعت کا نتیجہ ہیں۔ یہاں ، ہم موسم کی سابقہ ​​اطلاعات کے اعداد و شمار کا تجزیہ کرتے ہیں اور کسی خاص دن کے ممکنہ نتائج کی پیش گوئی کرتے ہیں۔ لیکن منطقی رجعت صرف واضح اعداد و شمار کی پیش گوئی کرے گی ، جیسے بارش ہو رہی ہے یا نہیں۔

بیماری کا تعین

ہم کر سکتے ہیںاستعمال کریںمریض کی طبی تاریخ کی مدد سے منطقی رجعت کا اندازہ لگانا کہ بیماری کسی بھی حالت میں مثبت ہے یا منفی۔

آئیے لاجسٹک ریگریشن کا استعمال کرکے پیشن گوئی ماڈل بنانے کیلئے نمونہ کا ڈیٹا سیٹ لیں۔

ڈیمو

ہم ایک پیشن گوئی ماڈل تیار کرنے جارہے ہیںاستعمال کرتے ہوئےمدد کے ساتھ ازگر میں منطقی رجعتکےایک ڈیٹاسیٹ ،اس میںہم منطقی دباؤ کو حاصل کرنے کے لئے مندرجہ ذیل اقدامات کا احاطہ کرنے جارہے ہیں۔

ڈیٹا اکٹھا کرنا

لاجسٹک ریگریشن کو نافذ کرنے کے لئے سب سے پہلے مرحلے میں ڈیٹا اکٹھا کرنا ہے۔ ہم csv فائل کو ڈیٹا سیٹ پر مشتمل پروگراموں میں پانڈوں کا استعمال کرکے لوڈ کریں گے۔ ہم متعلقہ اعداد و شمار کے مابین تعلقات کا تجزیہ کرکے گھریلو کھیل یا دور کھیل کے امکان کی پیش گوئی کرنے کے لئے پی ڈی پی ڈیشن کی پیش گوئی کرنے کے لئے این بی اے ڈیٹا استعمال کررہے ہیں۔

درآمد پانڈوں کے طور پر پی ڈی کی درآمد نمی NP بطور این پی درآمد سی بیورن sns درآمد matplotlib.pyplot بطور plt df = pd.read_csv (r'C: صارفینمحمد وسیم ڈوکیومینٹس ڈیٹا سی ایس وی ') پرنٹ (df.head (5))

آسان تجزیہ کے ل for آپ کو تمام ڈیٹا پڑھنے کے قابل فارمیٹ میں مل جائے گا۔ اور پھر آپ اپنے ماڈل کیلئے منحصر اور آزاد متغیرات کا تعین کرسکتے ہیں۔

ڈیٹا کا تجزیہ کرنا

متغیر کے مابین تعلقات کا تعین کرنے کے لئے ڈیٹا سیٹ کا تجزیہ کیا جاتا ہے۔ متغیر کے مابین تعلقات کو جانچنے کے لئے مختلف پلاٹ تیار کرکے۔

sns.countplot ('ہوم' ، ہیو = 'WINorLOSS' ، ڈیٹا = df) plt.show ()

مندرجہ بالا گھر / دور کھیل کے سلسلے میں جیت / ہار فیصد کے مابین تعلق ہے۔ ایسimilarlyہم ڈیٹا میں دیگر متعلقہ اندراجات کے مابین تعلقات کا گراف پلاٹ کرسکتے ہیں۔

ڈیٹا رینگلنگ

ڈیٹا سیٹ کو ہدف متغیر کے مطابق تبدیل کیا جاتا ہے۔ ہم ڈیٹا فریم کے ساتھ ساتھ تمام منحرف اقدار اور سٹرنگ ویلیوز کو ختم کردیں گے۔

پرنٹ (df.isnull (). رقم ())

ہم تمام غیر متعلقہ اعداد و شمار کی جانچ پڑتال کریں گے جیسے کالع اقدار اور ان اقدار کی جن کی پیش گوئی ماڈل بنانے کے دوران درکار نہیں ہوگی۔ اگر این بی اے ڈیٹاسیٹ میں کوئی خالی قدر نہیں ہے جسے ہم استعمال کررہے ہیں تو ، ہم ڈیٹا کو تقسیم کرنے کے ساتھ آگے بڑھیں گے۔

ٹیسٹ اور ٹرین کا ڈیٹا

ماڈل کی کارکردگی کے لئے ڈیٹا کو ٹیسٹ ڈیٹا اور ٹرین کے اعداد و شمار میں تقسیم کیا جاتا ہے۔ ڈیٹا کا استعمال کرتے ہوئے تقسیم کیا جاتا ہے ٹرین_ٹیسٹ_اسپلٹ . یہاں کا ڈیٹا 70:30 تناسب میں تقسیم ہوتا ہے۔

اب ، کے لئے ماڈل کی پیشن گوئی لاجسٹک ریگریشن فنکشن لاجسٹک ریگریشن ماڈل کو اسکلر ماڈیول میں درآمد کرکے لاگو کیا جاتا ہے۔

اس کے بعد ماڈل ٹرین سیٹ پر فٹ فنکشن کا استعمال کرتے ہوئے فٹ ہوجاتا ہے۔ اس کے بعد پیشن گوئی کی پیش گوئی کی جاتی ہے پیشن گوئی کی تقریب

sklearn.model_selection درآمد کی ٹرین_ٹیسٹ_اسپلٹ سے sklearn.linear_model درآمد لاجسٹک ریگریشن sklearn.metics سے درآمد کریں درجہ بندی_ریپورٹ درآمد کریں الجھن_ماٹرکس ، درستگی_سکور x = df.DP ('ہوم' ، محور = 1) y = df ['ہوم'] x_train ، ایکس_سٹریٹ ، ی_ٹرین ، ی_ٹیسٹ = ٹرین_ٹیسٹ_اسپلٹ (x ، y ، ٹیسٹ_سائز = 0.33 ، رینڈم_اسٹیٹ = 1) لاگ ماڈیل = لاجسٹک ریگریشن () لاگو ماڈیل۔فیٹ (x_ ٹرین ، y_ ٹرین) پیشن گوئی = لاگ ماڈیل.پیریڈکٹ (ایکس_ٹیسٹ) پرنٹ (درجہ بندی_ریپورٹ) پرنٹ (کنفیوژن_میٹرکس (ی_ٹیسٹ ، پیشن گوئیاں)) پرنٹ (درستگی_سکور (ی_ٹیسٹ ، پیشن گوئیاں))

جاوا میں سیمفورس کو کس طرح استعمال کریں

درجہ بندی کی رپورٹ:

درجہ بندی کی رپورٹ میں ظاہر ہوتا ہے صحت سے متعلق ، یاد ، F1 اور سپورٹ ماڈل کے لئے اسکور.

صحت سے متعلق سکور کا مطلب ہے سطح تک جس کی نمائش کے ذریعہ پیش گوئی کی گئی ہو وہ قطعی ہے۔ گھریلو کھیل کے لئے صحت سے متعلق یہ ہے 0.62 اور دور کھیل کے لئے ہے 0.58 .

یاد رکھنا ماڈل اس نتیجے کی پیش گوئی کرسکتا ہے۔ ایک گھر کھیل کے لئے یاد ہے 0.57 اور دور کھیل کے لئے ہے 0.64 . ایف 1 اور سپورٹ اسکور پیشن گوئی کے لئے جانچے گئے ڈیٹا کی مقدار ہیں۔ این بی اے ڈیٹا سیٹ میں ہوم گیم کے لئے تجربہ کیا گیا ڈیٹا ہے 1662 اور دور کھیل کے لئے ہے 1586 .

کنفیوژن میٹرکس:

کنفیوژن میٹرکس ایک ٹیبل ہے جو پیش گوئی کرنے والے ماڈل کی کارکردگی کو بیان کرتا ہے۔ ایک کنفیوژن میٹرکس میں اصل قدریں اور پیش گوئ قدریں شامل ہیں۔ ہم ان اقدار کو ماڈل کے درستگی اسکور کا حساب کرنے کے لئے استعمال کرسکتے ہیں۔

کنفیوژن میٹرکس ہیٹ میپ:

سمندری طوفان کا استعمال کرتے ہوئے کنفیوژن میٹرکس کا ہیٹ میپ تیار کرنے دیں اور ہم نے جو پیشگوئی کی ہے اس ماڈل کو تصور کرنا۔ ہیٹ میپ کی منصوبہ بندی کرنے کے لئے ، مندرجہ ذیل ترکیب ضروری ہے۔

sns.heatmap (pd.DataFrame (الجھن_محرک (y_ تازہ ترین، پیشن گوئی))) plt.show ()

ہیٹ میپ کو دیکھ کر ، ہم مندرجہ ذیل نتائج اخذ کرسکتے ہیں۔

  • تمام پیش قیاسیوں میں سے ، درجہ بند نے کل 1730 بار ہاں کی پیش گوئی کی ، جن میں سے 1012 اصل ہاں میں تھے۔
  • تمام پیش گوئیاں میں سے ، درجہ بند نے کل 1518 بار نہیں کی پیش گوئی کی ، جن میں سے 944 اصل نمبر تھے۔

کنفیوژن میٹرکس کے اس تجزیے سے ہم اپنے پیشن گوئی ماڈل کے درستگی اسکور کا نتیجہ اخذ کرسکتے ہیں۔

درستگی اسکور:

درستگی کا سکور ماڈل کی پیش گوئوں کی درستگی کا فیصد ہے۔ ہمارے ماڈل کے لئے درستگی کا اسکور 0.60 ہے جو کہ کافی حد تک درست ہے۔ لیکن جتنا زیادہ درستگی کا سکور آپ کی پیش گوئی کا ماڈل ہے۔ بہتر پیش گوئی کرنے والے ماڈل کے ل You آپ کو ہمیشہ اعلی درستگی کا اسکور حاصل کرنا ہوگا۔

مذکورہ بالا مراحل پر عمل کرتے ہوئے ، ہم نے NBA ڈیٹاسیٹ کا استعمال کرتے ہوئے گھر / دور کھیل کے امکان کی پیش گوئی کی ہے۔ درجہ بندی کی رپورٹ کا تجزیہ کرنے کے بعد ہم گھر / دور کھیل کے امکان کو سمجھا سکتے ہیں۔

اس بلاگ میں ہم نے ازگر کے تصورات میں لاجسٹک رجعت پر تبادلہ خیال کیا ہے ، کہ یہ لکیری نقطہ نظر سے کس طرح مختلف ہے۔ نیز ، ہم نے این بی اے ڈیٹاسیٹ کا استعمال کرتے ہوئے ایک مظاہرے کا احاطہ کیا ہے۔ مزید بصیرت اور مشق کے ل you ، آپ اپنی پسند کا ڈیٹاسیٹ استعمال کرسکتے ہیں اور ازگر میں لاجسٹک ریگریشن کو لاگو کرنے کے لئے زیربحث اقدامات پر عمل کرسکتے ہیں۔

نیز ، آپ میں ڈیٹا سائنسدان کو عبور حاصل کرنے کے لئے ایڈیورکا پلیٹ فارم پر موجود مختلف ڈیٹا سائنس بلاگوں کی جانچ پڑتال کریں۔

اگر آپ ازگر سیکھنا چاہتے ہیں اور ڈیٹا سائنس میں اپنا کیریئر بنانا چاہتے ہیں تو ہمارا انٹرایکٹو ، براہ راست آن لائن دیکھیں یہاں ، وہ آپ کے سیکھنے کی پوری مدت میں آپ کی رہنمائی کے لئے 24 * 7 سپورٹ کے ساتھ آتا ہے۔
ایک سوال ہے؟ برائے کرم اس کو تبصروں میں ذکر کریں اور ہم آپ کو واپس ملیں گے۔