hadoop - Filtering in pig by concatenating two column -
मेरे पास निम्न तालिका में दो तालिकाएं हैं
तालिका 1: com_Data
# सीसी बीबी मिमी # 41 22 2563 42 24 3562
42 24 3562
तालिका 2:
#name cid # sasi 41-22-2563 सोमान 42-47-2562
सोमान 42-47-2562
मैं तालिका 1 से तीन कॉलम सीसी बीबी मिमी को जोड़ना चाहता हूं और सभी कॉलम को फ़िल्टर करने की आवश्यकता है तालिका 2 से जो संयुक्त मानों से मेल खाता है
इसे सुअर में कैसे फ़िल्टर करें
जब सुअर का उपयोग करके तीन-स्तंभ अलग-अलग कॉलम को सम्मिलित करने का प्रयास करते हैं तो नीचे दिया गया त्रुटि कोड जो मैंने इस्तेमाल किया
a = LOAD 'default.com_data' का उपयोग करना org.apache.hcatalog.pig.HCatLoader (); बी = एक उत्पन्न कॉन्टैक्ट (सीसी, '-', बीबी, '-', मिमी); तालिका को कैसे फ़िल्टर करें?
उसकी तरह दिखें सीसी, बीबी और एमएम के डेटाटाइप संख्याएं हैं। क्या आप डेटैट टाइप को चार्ररा या बायटेयर बदल सकते हैं, ताकि कंसल्ट काम करे कृपया नीचे दिए गए उदाहरण देखें
input.txt 41 22 2563 42 24 3562 43 46 1234 इनपुट 1.txt sasi 41-22-2563 सोमान 42-47-2562 परीक्षण 43-46-1234 पईजीस्क्रिप्ट: ए = लोड 'input.txt' का प्रयोग PigStorage ('') एएस (सीसी: चारराय, बीबी: चारराय, मिमी: चारराय); एए = लोड 'input1.txt' का उपयोग PigStorage ('') के रूप में (नाम: chararray, cid: chararray); बी = FOREACH एक जनक CONCAT (सीसी, '-', बीबी, '-', मिमी) newCid के रूप में; सी = सीआईडी द्वारा एए द्वारा जुड़ें, बी द्वारा नए सीआईडी; डी = FOREACH सी उत्पन्न $ 0, $ 1; डंप डी; आउटपुट: (ससी, 41-22-2563) (परीक्षण, 43-46-1234)
Comments
Post a Comment