اسپارک ایم ایللیب۔ اپاچی چنگاری کی مشین لرننگ لائبریری



یہ اسپارک ایم ایللیب بلاگ آپ کو اپاچی اسپارک کی مشین لرننگ لائبریری سے متعارف کرائے گا۔ اس میں اسپارک ایم ایل لیب کا استعمال کرتے ہوئے مووی سفارشی سسٹم پروجیکٹ شامل ہے۔

MLlib چنگاری کریں اپاچی اسپارک کی مشین لرننگ جزو ہے۔اسپارک کے سب سے بڑے پرکشش مقامات میں بڑے پیمانے پر کمپیوٹنگ پیمانے کی صلاحیت ہے ، اور یہی آپ کو مشین لرننگ الگورتھم کی ضرورت ہے۔ لیکن حد یہ ہے کہ تمام مشین سیکھنے الگورتھم کو مؤثر طریقے سے ہم آہنگ نہیں کیا جاسکتا۔ ہم آہنگی کے ل Each ہر الگورتھم کے اپنے چیلنجز ہیں ، چاہے یہ ٹاسک پیرسلیزم ہو یا ڈیٹا کی ہم آہنگی۔

یہ کہتے ہوئے ، سپارک مشین لرننگ الگورتھم اور ایپلیکیشنس کی تعمیر کے لئے ڈی فیکٹو پلیٹ فارم بن رہا ہے۔ٹھیک ہے ، آپ چیک کرسکتے ہیں صنعت کے ماہرین کے ذریعہ بلاگ کے ساتھ آگے بڑھنے سے پہلےاسپارک ایم ایللیب پر کام کرنے والے ڈویلپرز اسپارک فریم ورک میں زیادہ سے زیادہ مشین الگورتھم کو توسیع پزیر اور جامع انداز میں نافذ کررہے ہیں۔ اس بلاگ کے ذریعہ ، ہم مشین لرننگ ، اسپارک ایم ایللیب ، اس کی افادیت ، الگورتھم اور مووی تجویزاتی نظام کے مکمل استعمال کے معاملات سیکھیں گے۔





اس بلاگ میں درج ذیل موضوعات کا احاطہ کیا جائے گا:

  1. مشین لرننگ کیا ہے؟
  2. ایم ایل لیب کا جائزہ لیں
  3. MLlib ٹولز کو چنگاری کریں
  4. MLlib الگورتھم
  5. کیس کا استعمال کریں - فلم کی سفارش کا نظام

مشین لرننگ کیا ہے؟

مصنوعی ذہانت میں پیٹرن کی پہچان اور کمپیوٹیشنل لرننگ تھیوری کے مطالعہ سے تیار ہوا ، مشین لرننگ الگورتھم کے مطالعے اور تعمیر کا جائزہ لیتی ہے جو اعداد و شمار سے سیکھ سکتی ہے اور پیش گوئیاں کر سکتی ہے - اس طرح کے الگورتھم ڈیٹا سے چلنے والی پیش گوئوں یا فیصلوں کے ذریعہ سختی سے جامد پروگرام کی ہدایات پر عمل کرتے ہیں۔ ، نمونہ آدانوں سے ماڈل تیار کرنے کے ذریعے۔



مشین لرننگ - چنگاری MLlib - Edureka اعداد و شمار: مشین لرننگ ٹولز

مشین لرننگ کا حساب کتابی اعدادوشمار سے بہت گہرا تعلق ہے ، جو کمپیوٹر کے استعمال سے پیشن گوئی کرنے پر بھی مرکوز ہے۔ اس کے ریاضی کی اصلاح کے ساتھ مضبوط تعلقات ہیں ، جو فیلڈ میں طریقوں ، نظریہ اور اطلاق کے ڈومین فراہم کرتا ہے۔ ڈیٹا اینالیٹکس کے شعبے میں ، مشین لرننگ ایک ایسا طریقہ ہے جو پیچیدہ ماڈل اور الگورتھم وضع کرنے کے لئے استعمال ہوتا ہے جو اپنے آپ کو ایک پیش گوئی کرنے کے لئے قرض دیتا ہے جسے تجارتی استعمال میں پیشن گوئی تجزیات کے نام سے جانا جاتا ہے۔

مشین سیکھنے کے کاموں کی تین اقسام ہیں۔



HTML اور XML کے مابین فرق
  1. زیر نگرانی سیکھنا : نگرانی سیکھنے وہ جگہ ہے جہاں آپ کے پاس ان پٹ متغیر (x) اور آؤٹ پٹ متغیر (Y) ہوتے ہیں اور آپ ان پٹ سے آؤٹ پٹ تک میپنگ فنکشن سیکھنے کے لئے الگورتھم استعمال کرتے ہیں۔
  2. غیر سروے شدہ سیکھنا : غیر نگرانی حاصل کرنا سیکھنے کی ایک قسم کی مشین سیکھنے کا الگورتھم ہے جس میں ڈیٹاسیٹس سے معلومات لیبل کیے جانے والے جوابات کے بغیر ان پٹ ڈیٹا سے معلومات حاصل کی جاسکتی ہیں۔
  3. کمک سیکھنا : ایک کمپیوٹر پروگرام متحرک ماحول کے ساتھ بات چیت کرتا ہے جس میں اسے ایک خاص مقصد انجام دینا ہوتا ہے (جیسے گاڑی چلانا یا مخالف کے خلاف کھیل کھیلنا)۔ پروگرام کو انعامات اور سزاؤں کے لحاظ سے رائے فراہم کی جاتی ہے کیونکہ یہ اپنی پریشانی کی جگہ کو لے جاتا ہے۔اس تصور کو کمک سیکھنا کہا جاتا ہے۔

ایم ایل لیب کا جائزہ لیں

اسپارک ایم ایللیب اپاچی چنگاری میں مشین لرننگ انجام دینے کے لئے استعمال ہوتا ہے۔ MLlib مقبول الگورتھم اور افادیت پر مشتمل ہے۔

ایم ایل لیب جائزہ:

  • spark.mllib RDDs کے سب سے اوپر پر بنایا گیا اصلی API پر مشتمل ہے۔ یہ فی الحال بحالی کی حالت میں ہے۔
  • spark.ML اعداد و شمار کے چوٹیوں پر بنایا ہوا اعلی سطح کا API فراہم کرتا ہےایم ایل پائپ لائنوں کی تعمیر spark.ML اس وقت چنگاری کیلئے بنیادی مشین لرننگ API ہے۔

MLlib ٹولز کو چنگاری کریں

اسپارک ایم ایل لیب مندرجہ ذیل ٹولز مہیا کرتا ہے۔

  • ایم ایل الگورتھم: ایم ایل ایلگوردمز ایم ایل ایلب کا بنیادی حصہ تشکیل دیتے ہیں۔ ان میں عام سیکھنے الگورتھم جیسے درجہ بندی ، رجعت ، کلسٹرنگ اور باہمی تعاون کے ساتھ فلٹرنگ شامل ہیں۔
  • خصوصیات: خصوصیات میں خصوصیت کو نکالنا ، تبدیلی ، جہت میں کمی اور انتخاب شامل ہے۔
  • پائپ لائنز: پائپ لائنز ایم ایل پائپ لائنوں کی تعمیر ، تشخیص اور ٹیوننگ کے ل tools ٹولز مہیا کرتی ہیں۔
  • استقامت: استقامت الگورتھم ، ماڈل اور پائپ لائنوں کو بچانے اور ان میں اضافے میں معاون ہے۔
  • افادیت: افادیتلکیری الجبرا ، اعداد و شمار اور ڈیٹا سے نمٹنے کے ل.۔

MLlib الگورتھم

سپارک ایم ایل ایلب میں مقبول الگورتھم اور افادیت یہ ہیں:

  1. بنیادی اعدادوشمار
  2. رجعت
  3. درجہ بندی
  4. تجویز کا نظام
  5. کلسٹرنگ
  6. طول و عرض میں کمی
  7. خصوصیت کا اخراج
  8. اصلاح

آئیے ہم ان میں سے کچھ تفصیل سے دیکھیں۔

بنیادی اعدادوشمار

بنیادی اعدادوشمار مشین سیکھنے کی سب سے بنیادی تکنیک بھی شامل ہے۔ یہ شامل ہیں:

  1. خلاصہ شماریات : مثالوں میں وسط ، تغیر ، گنتی ، زیادہ سے زیادہ ، کم سے کم اور numNonZeros شامل ہیں۔
  2. اصلاحات : اسپیئر مین اور پیئرسن باہمی ربط تلاش کرنے کے کچھ طریقے ہیں۔
  3. مصنوعی نمونے لینے : ان میں نمونہ بائیکی اور نمونہ بائکیی ایکسیکٹ شامل ہیں۔
  4. مفروضے کا امتحان : پیئرسن کا چی مربع ٹیسٹ مفروضے کی جانچ کی ایک مثال ہے۔
  5. بے ترتیب ڈیٹا جنریشن : بے ترتیب ڈیٹا بنانے کے لئے رینڈم آر ڈی ڈی ، نارمل اور پوسن کا استعمال ہوتا ہے۔

رجعت

رجعت متغیر کے مابین تعلقات کا اندازہ لگانے کے لئے تجزیہ ایک شماریاتی عمل ہے۔ اس میں متعدد متغیروں کی ماڈلنگ اور تجزیہ کرنے کی بہت سی تکنیکیں شامل ہیں جب ایک انحصار متغیر اور ایک یا زیادہ آزاد متغیر کے مابین تعلقات پر توجہ دی جاتی ہے۔ مزید خاص طور پر ، رجعت تجزیہ سے یہ سمجھنے میں مدد ملتی ہے کہ جب کسی بھی آزاد متغیر میں متنوع ہوتا ہے تو انحصار متغیر کی مخصوص قیمت کس طرح تبدیل ہوتی ہے۔

پیش گوئی اور پیش گوئی کے لئے ریگریشن تجزیہ وسیع پیمانے پر استعمال ہوتا ہے ، جہاں اس کے استعمال سے مشین لرننگ کے شعبے میں کافی حد سے زیادہ اثر پڑتا ہے۔ ریگریشن تجزیہ کو یہ سمجھنے کے لئے بھی استعمال کیا جاتا ہے کہ آزاد متغیرات میں سے کس کا تعلق انحصار متغیر سے ہے ، اور ان تعلقات کی شکلوں کو تلاش کرنا ہے۔ محدود حالات میں ، رجعت تجزیہ کا استعمال آزاد اور منحصر متغیر کے مابین ہونے والے کاوش کے تعلقات کو سمجھنے کے لئے کیا جاسکتا ہے۔

درجہ بندی

درجہ بندی مشاہدات (یا مثالوں) پر مشتمل اعداد و شمار کے ٹریننگ سیٹ کی بنیاد پر جس کے زمرے کی ممبرشپ معلوم ہوتی ہے ، اس کی نشاندہی کرنے میں مسئلہ یہ ہے کہ کون سا زمرے (ذیلی آبادی) میں سے ایک سیٹ ہے۔ یہ پیٹرن کی پہچان کی ایک مثال ہے۔

یہاں ، ایک مثال دی گئی ای میل کو 'سپیم' یا 'غیر سپیم' کلاسوں میں تفویض کرنا یا کسی مریض کو تشخیص تفویض کرنا ہوگی جیسے مریض کی مشاہدہ شدہ خصوصیات (صنف ، بلڈ پریشر ، کچھ علامات کی موجودگی یا غیر موجودگی) وغیرہ)۔

تجویز کا نظام

TO سفارش کا نظام انفارمیشن فلٹرنگ سسٹم کا ایک ذیلی کلاس ہے جو 'درجہ بندی' یا 'ترجیح' کی پیش گوئی کرنا چاہتا ہے جو صارف کسی شے کو دے گا۔ تجویز کنندہ نظام حالیہ برسوں میں تیزی سے مقبول ہو چکے ہیں ، اور فلموں ، موسیقی ، خبروں ، کتب ، تحقیقی مضامین ، تلاش کے سوالات ، سماجی ٹیگز اور عام طور پر مصنوعات سمیت متعدد شعبوں میں استعمال ہوتے ہیں۔

باہمی تعاون کے ساتھ اور مشمولات پر مبنی فلٹرنگ یا شخصیت پر مبنی نقطہ نظر کے ذریعہ تجویز کنندہ نظام عام طور پر دو طریقوں میں سے ایک میں سفارشات کی فہرست تیار کرتے ہیں۔

  1. باہمی تعاون کے ساتھ فلٹرنگ کسی صارف کے ماضی کے طرز عمل (جو پہلے خریدی گئی یا منتخب کردہ اور / یا ان اشیا کو دی گئی عددی درجہ بندیاں) نیز اسی طرح کے دوسرے فیصلوں کے ذریعہ کیے گئے فیصلوں سے ماڈل بنانے میں رجوع کرتے ہیں۔ اس ماڈل کا استعمال پھر آئٹمز (یا آئٹمز کے لئے درجہ بندی) کی پیش گوئی کرنے کے لئے کیا جاتا ہے جس میں صارف کو دلچسپی ہوسکتی ہے۔
  2. مواد پر مبنی فلٹرنگ اسی طرح کی خصوصیات کے ساتھ اضافی اشیاء کی سفارش کرنے کے لaches نقطہ نظر کسی آئٹم کی متضاد خصوصیات کا ایک سلسلہ استعمال کرتا ہے۔

مزید یہ کہ ان طریقوں کو اکثر ہائبرڈ تجویز کنندہ سسٹم کے نام سے جوڑا جاتا ہے۔

کلسٹرنگ

کلسٹرنگ چیزوں کے سیٹ کو اس طرح سے گروہ بندی کرنا ہے کہ ایک ہی گروپ (جس کو کلسٹر کہا جاتا ہے) میں اشیاء دوسرے گروپس (گروپوں) کی نسبت ایک دوسرے سے زیادہ مماثلت رکھتی ہیں۔ لہذا ، یہ ریسرچ ڈیٹا کان کنی ، اور اعدادوشمار کے اعداد و شمار کے تجزیے کے لئے ایک مشترکہ تکنیک ہے ، جس میں مشینری لرننگ ، پیٹرن کی پہچان ، تصویری تجزیہ ، معلومات کی بازیافت ، بائیو انفارمیٹکس ، ڈیٹا کمپریشن اور کمپیوٹر گرافکس شامل ہیں۔

طول و عرض میں کمی

طول و عرض میں کمی پرنسپل متغیرات کا ایک سیٹ حاصل کرنے کے ذریعے ، بے ترتیب متغیرات کی تعداد کو زیر غور لایا جارہا ہے۔ اس کو فیچر سلیکشن اور فیچر نکالنے میں تقسیم کیا جاسکتا ہے۔

  1. نمایاں انتخاب: خصوصیت کا انتخاب اصل متغیرات (جسے خصوصیات یا صفات بھی کہا جاتا ہے) کا سب سیٹ مل جاتا ہے۔
  2. خصوصیت کا اخراج: یہ اعلی جہتی خلا میں موجود ڈیٹا کو کم جہت والی جگہ میں تبدیل کرتا ہے۔ پرنسپل اجزاء تجزیہ (پی سی اے) کی طرح ، اعداد و شمار میں تبدیلی لکیری ہوسکتی ہے ، لیکن بہت سی نان لائنر جہت کم کرنے کی تکنیک بھی موجود ہے۔

خصوصیت کا اخراج

خصوصیت کا اخراج ماپنے اعداد و شمار کے ابتدائی سیٹ سے شروع ہوتا ہے اور اخذ کردہ قدروں (خصوصیات) کی تشکیل ہوتی ہے جس کا مقصد معلوماتی اور غیر فالتو ہونا ہوتا ہے ، اس کے نتیجے میں سیکھنے اور عام کرنے کے اقدامات کو سہولت فراہم کرنا اور کچھ معاملات میں بہتر انسانی تشریحات کا باعث بنتا ہے۔ اس کا تعلق جہتی کمی میں ہے۔

اصلاح

اصلاح بہترین کا انتخاب ہےدستیاب متبادلات کے کچھ سیٹ سے عنصر (کچھ معیار کے حوالے سے)۔

آسان ترین معاملے میں ، ایک اصلاحی مسئلہ مستند سیٹ میں سے ان پٹ ویلیو کو منظم طریقے سے منتخب کرکے اور فنکشن کی ویلیو کی کمپیوٹنگ کرکے کسی حقیقی فنکشن کو زیادہ سے زیادہ یا کم سے کم کرنے پر مشتمل ہوتا ہے۔ اصلاحی تھیوری کو عام کرنے اور دیگر وضعوں کی تکنیکوں کو قابل عمل ریاضی کا ایک بہت بڑا حصہ شامل ہے۔ عام طور پر ، اصلاح میں کچھ معروضی فعل کی 'بہترین دستیاب' اقدار کی وضاحت کرنا شامل ہوتا ہے جس میں ایک ڈومین (یا ان پٹ) دیا جاتا ہے ،مختلف قسم کے معروضی افعال اور مختلف اقسام کے ڈومین شامل ہیں۔

کیس کا استعمال کریں - فلم کی سفارش کا نظام

مسئلہ یہ بیان: مووی ریسرچ سسٹم کی تعمیر کے ل which جو اپاچی اسپارک کو استعمال کرتے ہوئے صارف کی ترجیحات پر مبنی فلموں کی سفارش کرتا ہے۔

ہماری ضروریات:

لہذا ، ہمیں اپنے فلم کی سفارش کے نظام کو بنانے کے ل to تقاضوں کا جائزہ لیں:

  1. ڈیٹا کی بڑی مقدار پر کارروائی کریں
  2. متعدد ذرائع سے ان پٹ
  3. استعمال میں آسان
  4. فاسٹ پروسیسنگ

جیسا کہ ہم اندازہ کرسکتے ہیںہماری ضروریات ، مختصر وقت میں بڑے ڈیٹا پر کارروائی کرنے کیلئے ہمیں بگ ڈیٹا کے بہترین ٹول کی ضرورت ہے۔ لہذا ، اپاچی چنگاری ہمارے مووی کی سفارش کے نظام کو نافذ کرنے کا ایک بہترین ٹول ہے۔

آئیے اب اپنے سسٹم کے لئے فلو ڈایاگرام کو دیکھیں۔

جیسا کہ ہم دیکھ سکتے ہیں ، اسٹارکنگ اسپارک اسٹریمنگ سے مندرجہ ذیل استعمال ہوتے ہیں۔ ہم ریئل ٹائم میں اسٹریم کرسکتے ہیں یا ہڈوپ ایچ ڈی ایف ایس سے ڈیٹا پڑھ سکتے ہیں۔

ڈیٹاسیٹ حاصل کرنا:

ہمارے مووی کی سفارش کے نظام کے ل we ، ہم آئی ایم ڈی بی ، روٹن ٹماٹر اور ٹائمز مووی ریٹنگ جیسی بہت سی مشہور ویب سائٹوں سے صارف کی درجہ بندی حاصل کرسکتے ہیں۔ یہ ڈیٹاسیٹ بہت سے فارمیٹس میں دستیاب ہے جیسے CSV فائلیں ، ٹیکسٹ فائلز aاین ڈی ڈیٹا بیس. ہم یا تو ویب سائٹ سے ڈیٹا کو براہ راست اسٹریم کرسکتے ہیں یا ان کو ڈاؤن لوڈ اور اسٹور کرسکتے ہیںہمارا مقامی فائل سسٹم یا ایچ ڈی ایف ایس۔

ڈیٹاسیٹ:

مندرجہ ذیل اعداد و شمار سے پتہ چلتا ہے کہ ہم کس طرح مقبول ویب سائٹ سے ڈیٹاسیٹ اکٹھا کرسکتے ہیں۔

ایک بار جب ہم ڈیٹا کو اسپارک میں منتقل کرتے ہیں تو ، یہ کچھ اس طرح نظر آتا ہے۔

مشین لرننگ:

پوری سفارش کا نظام مشین لرننگ الگورتھم پر مبنی ہے کم سے کم چوکوں کو تبدیل کرنا . یہاں ، ALS رجعت تجزیہ کی ایک قسم ہے جہاں ڈیٹا پوائنٹس کے درمیان اس طرح سے لکیر کھینچنے کے لئے رجعت کا استعمال کیا جاتا ہے تاکہ ہر ڈیٹا پوائنٹ سے فاصلے کے مربع کا مجموعہ کم سے کم ہوجائے۔ اس طرح ، اس لائن کو پھر اس فنکشن کی اقدار کی پیش گوئی کے لئے استعمال کیا جاتا ہے جہاں یہ آزاد متغیر کی قدر کو پورا کرتا ہے۔

آریگرام میں نیلی لائن بہترین فٹ ریگریشن لائن ہے۔ اس لائن کے ل the ، طول و عرض D کی قدر کم سے کم ہے۔ دیگر تمام سرخ لکیریں ہمیشہ ڈیٹاسیٹ سے دور ہی رہیں گی۔

MLlib نفاذ کو شروع کریں:

  1. ہم دیگر فلموں کے لئے ان کی درجہ بندی پر مبنی خاص فلموں کے ل the صارفین کی درجہ بندی کی پیش گوئی کرنے کے لئے باہمی تعاون کے ساتھ فلٹرنگ (سی ایف) استعمال کریں گے۔
  2. اس کے بعد ہم دوسرے خاص لوگوں کی درجہ بندی کے ساتھ اس فلم کے ساتھ تعاون کرتے ہیں۔
  3. ہماری مشین لرننگ سے درج ذیل نتائج حاصل کرنے کے ل we ، ہمیں اسپارک ایس کیو ایل کا ڈیٹا فریم ، ڈیٹاسیٹ اور ایس کیو ایل سروس استعمال کرنے کی ضرورت ہے۔

ہمارے پروگرام کا چھدم کوڈ یہ ہے:

درآمد کریں org.apache.spark.mllib.rec سفارشationALAL درآمد ) {ویلف کنف = نیا اسپارککونف (). سیٹ ایپ نام ('مووی'). سیٹ ماسٹر ('مقامی [2]') ویل اسک = نیا اسپارک کانٹیکسٹ (کونفٹ) ویل ڈاٹا ڈیٹا = sc.textFile ('* مووی CSV فائل سے ڈیٹا پڑھیں * ') //rawData.first () raw RawRatings = RawData.map (* ٹیب ڈلیمیٹر پر خام ڈیٹا تقسیم کریں)) والو کی درجہ بندی = RawRatings.map {* صارف ، مووی اور درجہ بندی کی نقشہ کیس کی صف *} // ڈیٹا ویل ماڈل کی تربیت = ALS.train (درجہ بندی ، 50 ، 5 ، 0.01) Model.userF خصوصیاتures Model.userF خصوصیاتures.count ماڈل.پروڈیکٹ فیچرز کاونٹ ویل پیش گوئی کی گئی ہے * * فلم 123 کے لئے صارف 789 کی پیش گوئی * * وال صارف * = * صارف 789 * ویل K = 10 ویل topKRecs = ماڈل.rec सुझाव پروڈکٹ (* K کی مخصوص قیمت کے ل User صارف کے لئے تجویز کریں) پرنٹ لین (topKRecs.mkString ('')) ویل فلمیں = sc.textFile ('* مووی کی فہرست کے اعداد و شمار کو پڑھیں *') ویل ٹائٹلز = مووی ای نقشہ (لائن => line.split ('|'). لے ( 2)). نقشہ (سرنی => (سرنی (0). ٹوئنٹ ، سرنی (1))) اکٹھا کریں۔ ASMap () ویل ٹائٹلس آر ڈی ڈی = فلمز۔ماپ (لائن => لائن.اسپلٹ ('|')۔ لے (2) ). نقشہ (سرنی => (سرنی (0) .TOnt ، سرنی (1))) کیشے () عنوانات (123) ویل فلمیں forUser = درجہ بندی۔ * صارف 789 کے لئے تلاش کریں * Val sqlContext = * SQL سیاق و سباق بنائیں * فلمیں تجویز کردہ = sqlContext. * تجویز کردہ فلموں کا ایک ڈیٹا فریم بنائیں * فلموں کی سفارش کی جاتی ہے۔ * صارف کے لئے درجہ بندی ترتیب دیں 9 789 * .map (* فلم کے عنوان پر درجہ بندی کا نقشہ بنائیں)۔ * درجہ بندی پرنٹ کریں * والو نتائج = فلمیں برائے صارف ۔سورٹ بائی (-_. درجہ بندی) .پیک (30). نقشہ (درجہ بندی => (عنوانات (درجہ بندی. مصنوع) ، ریٹنگ۔ریٹنگ))}}

ایک بار جب ہم پیش گوئیاں پیدا کردیتے ہیں تو ، ہم نتائج کو آر ڈی بی ایم ایس سسٹم میں اسٹور کرنے کے لئے اسپارک ایس کیو ایل کا استعمال کرسکتے ہیں۔ مزید یہ کہ اس کو ویب ایپلیکیشن پر ظاہر کیا جاسکتا ہے۔

نتائج:

اعداد و شمار: فلم 77 کے صارف کیلئے تجویز کردہ

ہورے! اس طرح ہم نے اپاچی چنگاری کا استعمال کرتے ہوئے مووی تجویز کا نظام کامیابی کے ساتھ تشکیل دیا ہے۔ اس کے ساتھ ، ہم اسپارک ایم ایللیب نے پیش کردہ بہت سے مشہور الگورتھموں میں سے صرف ایک کا احاطہ کیا ہے۔ ہم ڈیٹا سائنس الگورتھم پر آئندہ بلاگز میں مشین لرننگ کے بارے میں مزید معلومات حاصل کریں گے۔

آگے بڑھاتے ہوئے ، آپ اپاچی اسپارک کو اسپارک ٹارٹوریلٹ ، اسپارک اسٹریمنگ ٹیوٹوریل کے ساتھ سیکھنا جاری رکھ سکتے ہیں، اور اسپارک انٹرویو سے متعلق سوالات۔ایڈوریکا آن لائن سیکھنے کا بہترین تجربہ فراہم کرنے کی طرف سرشار ہے۔

چیک کریں ہمارے میں f آپ سپارک کو سیکھنا چاہتے ہیں اور اسپارک کے ڈومین میں کیریئر بنانا چاہتے ہیں اور حقیقی زندگی کے استعمال کے معاملات کے ساتھ RDD ، Spark Streaming ، SparkSQL ، MLlib ، GraphX ​​اور Scala کا استعمال کرکے بڑے پیمانے پر ڈیٹا پروسیسنگ کر سکتے ہیں۔