ہڈوپ جاوا پر مبنی پروگرامنگ فریم ورک ہے جو تقسیم شدہ کمپیوٹنگ ماحول میں بڑے ڈیٹا سیٹوں کی پروسیسنگ کی حمایت کرتا ہے ، جبکہ آر اعدادوشمار کمپیوٹنگ اور گرافکس کے لئے پروگرامنگ زبان اور سافٹ ویئر ماحول ہے۔ اعدادوشمار کے سافٹ ویئر تیار کرنے اور اعداد و شمار کے تجزیے کو انجام دینے کے لئے R زبان کا استعمال بڑے پیمانے پر شماریات دانوں اور ڈیٹا کان کنوں کے لئے کیا جاتا ہے۔ انٹرایکٹو اعداد و شمار کے تجزیہ ، عمومی مقصد کے اعدادوشمار اور پیش گوئی کرنے والی ماڈلنگ کے شعبوں میں ، آر اپنی درجہ بندی ، کلسٹرنگ اور درجہ بندی کی صلاحیتوں کی وجہ سے بڑے پیمانے پر مقبولیت حاصل کر چکا ہے۔
ہڈوپ اور آر بڑے اعداد و شمار کے تصور اور تجزیات کے معاملے میں ایک دوسرے کو کافی اچھی طرح سے پورا کرتے ہیں۔
R اور ہڈوپ کا استعمال کرتے ہوئے
ہڈوپ اور آر کو ایک ساتھ استعمال کرنے کے چار مختلف طریقے ہیں:
1. RHadoop
RHadoop تین R پیکیجوں کا ایک مجموعہ ہے: rmr، rhdfs اور rhbase. rmr پیکیج R میں ہڈوپ میپریڈوسی فعالیت مہیا کرتا ہے ، rhdfs R میں ایچ ڈی ایف ایس فائل مینجمنٹ فراہم کرتا ہے اور rhbase R کے اندر سے HBase ڈیٹا بیس مینجمنٹ فراہم کرتا ہے۔ ان میں سے ہر پرائمری پیکیج کو ہڈوپ فریم ورک ڈیٹا کو بہتر طریقے سے تجزیہ کرنے اور ان کا نظم کرنے کے لئے استعمال کیا جاسکتا ہے۔
2 اورچ
او آر سی ایچ کا معنی اوروکل آر رابط کے لئے ہڈوپ کے لئے ہے۔ یہ آر پیکیجوں کا ایک مجموعہ ہے جو Hive میزیں ، اپاچی ہڈوپ کمپیوٹ انفراسٹرکچر ، مقامی R ماحولیات ، اوریکل ڈیٹا بیس ٹیبلز کے ساتھ کام کرنے کے لئے متعلقہ انٹرفیس فراہم کرتا ہے۔ مزید برآں ، ORCH پیش گوئی کرنے والی تجزیاتی تکنیک بھی مہیا کرتا ہے جسے ایچ ڈی ایف ایس فائلوں میں ڈیٹا پر لاگو کیا جاسکتا ہے۔
3۔ رائپ کریں
RHIPE ایک آر پیکیج ہے جو ہڈوپ استعمال کرنے کے لئے ایک API فراہم کرتا ہے۔ RHIPE کا مطلب ہے R اور ہڈوپ انٹیگریٹڈ پروگرامنگ ماحولیات ، اور بنیادی طور پر RHadoop ایک مختلف API کے ساتھ ہے۔
پی ایچ پی پرنٹ سرنی اقدار صرف
چار ہڈوپ اسٹریمنگ
ہڈوپ اسٹریمنگ ایک افادیت ہے جو صارفین کو کسی بھی قابل عمل افراد کے ساتھ نوکریاں بنانے اور چلانے کی اجازت دیتی ہے جیسے میپر اور / یا ریڈوسر۔ اسٹریمنگ سسٹم کا استعمال کرتے ہوئے ، کوئی جاوا کے کافی علم کے ساتھ کام کرنے والے ہڈوپ ملازمتوں کو تیار کرسکتا ہے جس سے دو شیل اسکرپٹ لکھیں جا سکیں جو کام نہیں کرسکتے ہیں۔
R اور ہڈوپ کا مجموعہ ان اعداد و شمار اور بڑے ڈیٹا سیٹس کے ساتھ کام کرنے والے لوگوں کے لئے ضروری ٹول کٹ کے طور پر سامنے آرہا ہے۔ تاہم ، ہڈوپ کے کچھ شائقین نے انتہائی بڑے بگ ڈیٹا کے ٹکڑوں سے نمٹنے کے دوران سرخ پرچم اٹھایا ہے۔ ان کا دعوی ہے کہ R کا فائدہ اس کا نحو نہیں ہے بلکہ تصور اور اعدادوشمار کے لئے قدیم افراد کی جامع لائبریری ہے۔ یہ لائبریریاں بنیادی طور پر غیر تقسیم ہیں ، جس سے اعداد و شمار کی بازیابی میں وقت کا استعمال ہوتا ہے۔ یہ آر کے ساتھ موروثی خامی ہے ، اور اگر آپ اسے نظر انداز کرنا چاہتے ہیں تو ، آر اور ہڈوپ اب بھی حیرت زدہ کر سکتے ہیں۔
اب ہم ایک ڈیمو دیکھتے ہیں:
ہمارے لئے ایک سوال ہے؟ برائے کرم ان کا تذکرہ سیکشن میں ذکر کریں اور ہم آپ کو واپس ملیں گے۔
متعلقہ اشاعت: