اعداد و شمار کو سمجھنا اور اس سے قدر پیدا کرنے کے قابل ہونا اس دہائی کی مہارت ہے۔ مشین لرننگ ایک ایسی ہی بنیادی مہارت ہے جو کمپنیوں کو اس کو پورا کرنے میں مدد دیتی ہے۔ تاہم ، شروع کرنے کے ل you ، آپ کو اپنی بنیادیں ٹھیک تعمیر کرنے کی ضرورت ہے۔ لہذا ، اس مضمون میں ، میں کچھ بنیادی تصورات کا احاطہ کروں گا اور مشین لرننگ میں اپنا سفر شروع کرنے کے لئے آپ کو رہنما خطوط فراہم کروں گا۔ لہذا ، مشین سیکھنے کے اعدادوشمار سے متعلق اس مضمون میں ، مندرجہ ذیل موضوعات پر تبادلہ خیال کیا جائے گا:
مشین لرننگ کے لئے امکانات اور شماریات:
امکان کیا ہے؟
احتمال کسی واقعہ کے ہونے کے امکان کو مقدار میں قرار دیتا ہے۔ مثال کے طور پر ، اگر آپ منصفانہ ، غیر جانبدار ڈائی کو رول دیتے ہیں تو پھر اس کا امکان ایک اپ کرنا 1/6 ہے . اب ، اگر آپ حیرت زدہ ہیںہا پھر جواب بہت آسان ہے!
اس کی وجہ یہ ہے کہ وہاں چھ امکانات ہیں اور سب برابر ہیں (منصفانہ ڈائی)۔ لہذا ہم شامل کرسکتے ہیں 1 + 1 + 1 + 1 + 1 + 1 = 6۔ لیکن ، چونکہ ہمیں اس میں دلچسپی ہے واقعہ جہاں 1 بدل جاتا ہے . وہاں ہے واقعہ پیش آنے کا صرف ایک ہی راستہ ہے۔ لہذا ،
1 بدلنے کا امکان = 1/6
دوسری تمام تعداد میں بھی ایسا ہی ہے کیونکہ تمام واقعات کا یکساں طور پر امکان ہے۔ آسان ، ٹھیک ہے؟
ٹھیک ہے ، اس مثال کے لئے احتمال کی ایک متواتر تعریف کچھ یوں محسوس ہوگی - 1 ٹرن اپ کا امکان 1 مرتبہ کی تعداد کا تناسب ہے جب مرنے کی لامحدود تعداد میں رول کیا جاتا تھا تو مرنے کے وقت کی تعداد 1 ہوجاتی ہے۔ اوقاتاس کا کیا مطلب ہے؟
آئیے اسے مزید دلچسپ بنائیں۔ دونوں معاملات پر غور کریں - آپ نے 5 مرتبہ منصفانہ ڈائی لپیٹ دی۔ ایک معاملے میں اعداد کی ترتیب کا نمبر - [1،4،2،6،4،3] ہے۔ دوسرے معاملے میں ، ہمیں - [2،2،2،2،2،2] مل جاتا ہے۔ آپ کے خیال میں کون سا زیادہ امکان ہے؟
دونوں برابر کے امکانات ہیں۔ عجیب لگتا ہے؟
اب ، ایک اور معاملے پر غور کریں جہاں ہر معاملے میں تمام 5 فہرستیں ہیں آزاد . مطلب ، ایک رول دوسرے کو متاثر نہیں کرتا ہے۔ پہلی صورت میں ، جب 6 مڑ جاتے ہیں ، تو اسے اندازہ نہیں ہوتا تھا کہ 2 اس کے سامنے آجائیں گے۔ لہذا ، تمام 5 رول اتنے ہی امکانات ہیں۔
اسی طرح ، دوسرے معاملے میں سیدھے 2s کو آزادانہ واقعات کی ترتیب کے طور پر سمجھا جاسکتا ہے۔ اور یہ سارے واقعات برابر کے امکانات ہیں۔ مجموعی طور پر ، چونکہ ہمارے پاس ایک ہی نرد ہے ، کسی ایک کی صورت میں کسی خاص تعداد میں اضافے کا امکان بھی دوسرا ہی ہوتا ہے۔ اگلا ، مشین سیکھنے کے اعدادوشمار سے متعلق اس مضمون میں ، آئیے اس اصطلاح کو سمجھیں آزادی۔
آزادی
دو واقعات اگر A کی موجودگی واقعہ B کو متاثر نہیں کرتی ہے تو A اور B کو آزاد کہا جاتا ہے . مثال کے طور پر ، اگر آپ ایک سکے کو ٹاس کرتے ہیں اور ڈائی کو رول دیتے ہیں تو ، مرنے کے نتیجے پر اس کا کوئی اثر نہیں ہوتا ہے کہ آیا سکے سر یا دم دکھاتا ہے۔ بھی ، کے لئے دو آزاد واقعات A اور B ، امکان ہے کہ A اور B ایک ساتھ ہوسکتے ہیں . لہذا مثال کے طور پر ، اگر آپ اس امکان کو چاہتے ہیں جو سکہ سر اور ڈائی شو 3 ظاہر کرتا ہے۔
P (A اور B) = P (A) * P (B)
لہذا P = & frac12 (سروں کے اوپر آنے کا امکان) * ⅙ (3 مڑنے کا امکان) = 1/12
پچھلی مثال میں ، دونوں ہی صورتوں میں ، P = ⅙ * ⅙ * ⅙ * ⅙ * ⅙ * ⅙۔
اب آئیے ان واقعات کے بارے میں بات کرتے ہیں جو آزاد نہیں ہیں۔ مندرجہ ذیل ٹیبل پر غور کریں:
موٹا ہونا | موٹا نہیں | |
دل کی پریشانیاں | چار پانچ | پندرہ |
دل کی پریشانی نہیں ہے | 10 | 30 |
100 افراد کا سروے کیا گیا۔ 60 کو دل کی دشواری تھی اور 40 نہیں تھے۔ دل کی تکلیف میں مبتلا 60 میں سے 45 موٹے تھے۔ دل میں کوئی تکلیف نہ ہونے والے 40 میں سے 10 موٹے تھے۔ اگر کوئی آپ سے پوچھتا ہے -
- دل کا مسئلہ ہونے کا کیا امکان ہے؟
- دل کا مسئلہ ہونے اور موٹاپا نہ ہونے کا کیا امکان ہے؟
پہلے سوالوں کا جواب آسان ہے۔ 60/100۔ دوسرے کے لئے ، یہ 15/100 ہوگا۔ اب تیسرے سوال پر غور کریں - ایک شخص کو بے ترتیب منتخب کیا گیا تھا۔ اسے دل کی بیماری ہے۔ اس کا کیا امکان ہے کہ وہ موٹاپا ہے؟
اب آپ کو دی گئی معلومات کے بارے میں سوچیں - یہ معلوم ہے کہ اسے دل کی بیماری ہے۔ لہذا وہ ان 40 میں سے نہیں ہوسکتا ہے جن کو دل کی بیماری نہیں ہے۔ صرف 60 ممکن اختیارات ہیں (ٹیبل میں اوپری قطار)۔ اب ، ان کم امکانات میں سے ، یہ امکان ہے کہ وہ موٹاپا ہے 45/60 ہے۔ اب ، جب آپ جان چکے ہو ، خود مختار واقعات کیا ہیں ، اگلا اس مضمون میں مشینی سیکھنے کے اعدادوشمار کے بارے میں ، آئیے مشروط امکانات کو سمجھیں۔
مشروط امکانات
مشروط احتمالات کو سمجھنے کے لئے آئیے مذکورہ بالا مثال کے ساتھ اپنی گفتگو جاری رکھیں۔ موٹے ہونے کی حیثیت اور دل کی تکلیف میں مبتلا ہونے کی حیثیت آزاد نہیں ہے۔ اگر موٹاپا ہونے سے دل کی دشواریوں پر اثر انداز نہ ہوتا ، تو دل کے دشواریوں کے شکار موٹے اور غیر موٹے معاملات کی تعداد ایک جیسی ہوتی۔
نیز ، ہمیں یہ بھی بتایا گیا کہ اس شخص کو دل کی تکلیف ہے اور ہمیں اس کے موٹے ہونے کا امکان تلاش کرنا پڑا۔ تو ، احتمال ، اس معاملے میں ، یہ کہا جاتا ہے کہ اس کو دل کی تکلیف ہے اس پر مشروط کیا گیا ہے۔ اگر واقعہ A کے ہونے کا امکان ایونٹ B پر مشروط ہے ، تو ہم اس کی نمائندگی کرتے ہیں
منگوڈب کے لئے کیا استعمال ہوتا ہے
P (A | B)
اب ، ایک نظریہ موجود ہے جو ہمیں اس مشروط امکان کو حساب دینے میں مدد کرتا ہے۔ یہ کہا جاتا ہے بیس رول .
P (A | B) = P (A اور B) / P (B)
ہم اس مثال کو پلگ کرکے اس نظریہ کو جانچ سکتے ہیں جس کی ہم نے ابھی بحث کی ہے۔ اگر آپ اب تک سمجھ چکے ہیں تو ، آپ مندرجہ ذیل کے ساتھ شروعات کرسکتے ہیں - بولی . یہ درجہ بندی کرنے کے لئے مشروط احتمالات استعمال کرتا ہے کہ آیا ای میل اسپام ہے یا نہیں۔ یہ درجہ بندی کے بہت سے دوسرے کام انجام دے سکتا ہے۔ لیکن بنیادی طور پر ، مشروط امکانات کے دل میں ہے .
اعدادوشمار:
اعدادوشمار ہیں ڈیٹا پوائنٹس کی ایک بڑی تعداد کے بارے میں خلاصہ اور معلومات کا استعمال کرتے تھے۔ ڈیٹا سائنس اور مشین لرننگ میں ، آپ اکثر مندرجہ ذیل اصطلاحات کو دیکھیں گے
- مرکزیت کے اقدامات
- تقسیم (خاص طور پر عام)
مرکزیت کے اقدامات اور پھیلاؤ کے اقدامات
جس کا مطلب بولوں:
مطلب صرف ایک ہے تعداد کی اوسط . مطلب جاننے کے ل you ، آپ کو اعداد کا حساب لگانا ہوگا اور اسے نمبروں کی تعداد کے ساتھ تقسیم کرنا ہوگا۔ مثال کے طور پر ، [1،2،3،4،5] کا مطلب 15/5 = 3 ہے۔
اوسط:
میڈین ہے تعداد کے ایک سیٹ کا درمیانی عنصر جب وہ صعودی ترتیب میں ترتیب دیئے جاتے ہیں۔ مثال کے طور پر ، نمبروں کو [1،2،4،3،5] ایک چڑھائی ترتیب میں ترتیب دیا گیا ہے [1،2،3،4،5]۔ ان میں سے درمیانی ایک 3 ہے۔ لہذا میڈین 3 ہے۔ لیکن کیا ہوگا اگر نمبروں کی تعداد مساوی ہو اور اس وجہ سے کوئی درمیانی تعداد نہ ہو؟ اس صورت میں ، آپ درمیانے درجے کی دو نمبروں کی اوسط لیتے ہیں۔ چڑھتے ترتیب میں 2n نمبروں کی ترتیب کے لئے ، اوسط نویں اور (n + 1)ویںمیڈین حاصل کرنے کے لئے نمبر مثال - [1،2،3،4،5،6] میں میڈین (3 + 4) / 2 = 3.5 ہے
وضع:
موڈ صرف ہے تعداد کے ایک سیٹ میں سب سے زیادہ کثرت تعداد . مثال کے طور پر ، [1،2،3،3،4،5،5،5] کا موڈ 5 ہے۔
تغیر:
تغیر مرکزیت کا پیمانہ نہیں ہے۔ یہ اقدامات کرتا ہے آپ کا ڈیٹا کس طرح وسط میں پھیلتا ہے . اس کے طور پر مقدار ہے
ایکسن نمبروں کا مطلب ہے۔ آپ ایک نقطہ نکالیں ، مطلب کو گھٹا دیں ، اس فرق کو مربع لیں۔ یہ سب ن نمبروں کے ل Do کریں اور ان کا اوسط کریں۔ تغیر کے مربع جڑ کو معیاری انحراف کہا جاتا ہے۔ اگلا ، مشین سیکھنے کے اعدادوشمار کے بارے میں اس مضمون میں ، آئیے عمومی تقسیم کو سمجھیں۔
عمومی تقسیم
تقسیم ہماری مدد کرتا ہے سمجھیں کہ ہمارا ڈیٹا کیسے پھیلتا ہے . مثال کے طور پر ، عمر کے نمونہ میں ، ہمارے پاس جوان افراد بڑی عمر کے افراد سے زیادہ ہوسکتے ہیں اور اس وجہ سے عمر کی چھوٹی قدریں زیادہ سے زیادہ اقدار سے زیادہ ہیں۔ لیکن ہم تقسیم کی وضاحت کیسے کریں گے؟ ذیل کی مثال پر غور کریں
y محور کثافت کی نمائندگی کرتا ہے۔ اس تقسیم کا انداز 30 ہے کیونکہ یہ چوٹی ہے اور اسی وجہ سے اکثر ہوتا ہے۔ ہم میڈین کو بھی تلاش کرسکتے ہیں۔ میڈین ایکس محور پر اس مقام پر ہے جہاں وکر کے نیچے آدھا رقبہ احاطہ کرتا ہے۔ کسی بھی عام تقسیم کے تحت رقبہ 1 ہے کیونکہ تمام واقعات کے امکانات کا مجموعہ 1 ہے۔ مثال کے طور پر ،
مذکورہ بالا معاملہ میں میڈین 4 کے آس پاس ہے۔ اس کا مطلب یہ ہے کہ 4 سے پہلے وکر کے نیچے کا علاقہ ویسا ہی ہے جیسے 4 کے بعد۔ ایک اور مثال پر غور کریں
ہم تین عام تقسیم دیکھتے ہیں۔ نیلے اور سرخ رنگ کا ایک ہی مطلب ہے۔ سرخ رنگ میں زیادہ فرق ہوتا ہے۔ لہذا ، یہ نیلے رنگ سے کہیں زیادہ پھیلتا ہے۔ لیکن چونکہ یہ علاقہ 1 ہونا ضروری ہے ، لہذا علاقے کو مستحکم رکھنے کے لئے ، سرخ وکر کا چوٹی نیلے رنگ کے وکر سے چھوٹا ہے۔
امید ہے کہ آپ بنیادی اعدادوشمار اور عام تقسیم کو سمجھ گئے ہوں گے۔ اب ، مشین سیکھنے کے اعدادوشمار کے بارے میں اس مضمون میں اگلے ، ہم لکیری الجبرا کے بارے میں جانیں۔
لکیری الجبرا
لینر الجبرا کے بغیر جدید اے ممکن نہیں ہوگا۔ اس کا بنیادی شکل ہے گہری لرننگ اور یہاں تک کہ جیسے آسان الگورتھم میں بھی استعمال ہوتا رہا ہے . مزید کسی تاخیر کے بغیر ، آئیے شروع کریں۔
جاوا میں سٹرنگ کی ڈیفالٹ ویلیو
آپ کو ویکٹر سے واقف ہونا چاہئے۔ وہ خلا میں ایک طرح کی ہندسی نمائندگی ہیں۔ مثال کے طور پر ، ایک ویکٹر [4،4] میں ایکس اکیس کے ساتھ ساتھ along یونٹ اور وائی محور کے ساتھ units یونٹ ہیں۔ مندرجہ ذیل تصویر پر غور کریں -
ویکٹر ڈی 1 میں ایکس محور کے ساتھ 0.707 یونٹ اور وائی محور کے ساتھ 0.707 یونٹ ہیں۔ ایک ویکٹر میں 1 جہت ہے۔ ضروری ہے کہ اس کی وسعت اور سمت ہو۔ مثال کے طور پر،
مذکورہ تصویر میں ایک ویکٹر ہے (4،3) اس کی شدت 5 ہے اور یہ ایکس محور کے ساتھ 36.9 ڈگری بناتا ہے۔
اب ، میٹرکس کیا ہے؟ میٹرکس اعداد کی ایک کثیر جہتی صف ہے۔ اس کا استعمال کیا ہے؟ ہم آگے دیکھیں گے۔ لیکن پہلے ، آئیے دیکھتے ہیں کہ یہ کس طرح استعمال ہوتا ہے۔
میٹرکس
میٹرکس میں بہت ساری جہتیں ہوسکتی ہیں۔ آئیے ایک 2 جہتی میٹرکس پر غور کریں۔ اس میں قطاریں (ایم) اور کالم (این) ہیں۔ لہذا اس میں m * n عناصر ہیں۔
مثال کے طور پر،
اس میٹرکس میں 5 قطاریں اور 5 کالم ہیں۔ آئیے اس کو اے کہتے ہیں۔ لہذا A (2،3) دوسری قطار اور تیسرے کالم پر اندراج ہے جو 8 ہے۔
اب ، جب آپ جانتے ہیں کہ میٹرکس کیا ہے ، تو ہمیں میٹرکس کے مختلف کاموں کا جائزہ لینے دیتا ہے۔
میٹرکس آپریشنز
میٹرکس کا اضافہ
کی دو میٹرک اسی جہتوں کو شامل کیا جاسکتا ہے۔ اضافی عنصر کے لحاظ سے ہوتا ہے۔
اسکیلر ضرب
ایک میٹرکس کو اسکیلر مقدار سے ضرب کیا جاسکتا ہے۔ اس طرح کے ضرب میٹرکس میں ہر اندراج کو اسکیلر کے ذریعہ ضرب دینے کا باعث بنتا ہے۔ اسکیلر صرف ایک عدد ہوتا ہے
میٹرکس ٹرانسپوز
میٹرکس ٹرانسپوس آسان ہے۔ میٹرکس A (m، n) کے ل A ، A کو اس کا ٹرانسپوس بننے دیں۔ پھر
A '(i، j) = A (j، i)
مثال کے طور پر،
میٹرکس ضرب
یہ شاید دوسرے آپریشنوں کے مقابلہ میں قدرے مشکل ہے۔ اس میں غوطہ لگانے سے پہلے ، آئیے دو ویکٹروں کے مابین ڈاٹ پروڈکٹ کی وضاحت کریں۔
ویکٹر X = [1،4،6،0] اور ویکٹر Y = [2،3،4،5] پر غور کریں۔ پھر X اور Y کے مابین ڈاٹ پروڈکٹ کی وضاحت کی جاتی ہے
X.Y = 1 * 2 + 4 * 3 + 6 * 4 + 0 * 5 = 38
تار جاوا سے تاریخ حاصل کریں
تو ، یہ عنصر کے مطابق ضرب اور اضافے ہے۔ ابھی،آئیے دو میٹرک A (m، n) اور B (n، k) پر غور کریں جہاں m، n، k جہت ہیں اور اسی وجہ سے اعداد ہیں۔ ہم میٹرکس کے ضرب کی وضاحت کرتے ہیں
مندرجہ بالا مثال میں ، مصنوعات کا پہلا عنصر (44) دائیں میٹرکس کے پہلے کالم کے ساتھ بائیں میٹرکس کی پہلی صف کے ڈاٹ پروڈکٹ کے ذریعہ حاصل کیا جاتا ہے۔ اسی طرح ، دائیں میٹرکس کے دوسرے کالم کے ساتھ بائیں میٹرکس کی پہلی صف کے ڈاٹ پروڈکٹ کے ذریعہ 72 حاصل کیا جاتا ہے۔
نوٹ کریں کہ بائیں میٹرکس کے لئے ، کالموں کی تعداد دائیں کالم میں قطاروں کی تعداد کے برابر ہونی چاہئے۔ ہمارے معاملے میں ، پروڈکٹ AB موجود ہے لیکن BA نہیں ہے کیونکہ m k کے برابر نہیں ہے۔ دو میٹرکس A (m، n) اور B (n، k) کے ل the ، مصنوعات AB کی وضاحت کی جاتی ہے اور مصنوعات کی طول و عرض (m ، k) (بیرونی سب سے زیادہ طول و عرض (m ، n) ، (n ، k ہے) ))۔ لیکن بی اے کی وضاحت نہیں کی جاتی جب تک کہ m = k نہیں۔
اس کے ساتھ ، ہم مشین سیکھنے کے لئے شماریات سے متعلق اس مضمون کو ختم کردیں گے۔ مجھے امید ہے کہ آپ کو مشین لرننگ جرگون میں سے کچھ سمجھ گئے ہوں گے۔ یہ یہاں ختم نہیں ہوتا ہے۔ یہ یقینی بنانے کے لئے کہ آپ انڈسٹری کے لئے تیار ہیں ، آپ ڈیٹا سائنس اور AI پر ایڈوریکا کے کورسز چیک کرسکتے ہیں۔ وہ پایا جاسکتا ہے