hadoop - Filtering in pig by concatenating two column -


मेरे पास निम्न तालिका में दो तालिकाएं हैं

तालिका 1: com_Data

# सीसी बीबी मिमी #

41 22 2563

42 24 3562

तालिका 2:

#name cid #

sasi 41-22-2563

सोमान 42-47-2562

मैं तालिका 1 से तीन कॉलम सीसी बीबी मिमी को जोड़ना चाहता हूं और सभी कॉलम को फ़िल्टर करने की आवश्यकता है तालिका 2 से जो संयुक्त मानों से मेल खाता है

इसे सुअर में कैसे फ़िल्टर करें

जब सुअर का उपयोग करके तीन-स्तंभ अलग-अलग कॉलम को सम्मिलित करने का प्रयास करते हैं तो नीचे दिया गया त्रुटि कोड जो मैंने इस्तेमाल किया

  a = LOAD 'default.com_data' का उपयोग करना org.apache.hcatalog.pig.HCatLoader (); बी = एक उत्पन्न कॉन्टैक्ट (सीसी, '-', बीबी, '-', मिमी);   

तालिका को कैसे फ़िल्टर करें?

उसकी तरह दिखें सीसी, बीबी और एमएम के डेटाटाइप संख्याएं हैं। क्या आप डेटैट टाइप को चार्ररा या बायटेयर बदल सकते हैं, ताकि कंसल्ट काम करे कृपया नीचे दिए गए उदाहरण देखें

  input.txt 41 22 2563 42 24 3562 43 46 1234 इनपुट 1.txt sasi 41-22-2563 सोमान 42-47-2562 परीक्षण 43-46-1234 पईजीस्क्रिप्ट: ए = लोड 'input.txt' का प्रयोग PigStorage ('') एएस (सीसी: चारराय, बीबी: चारराय, मिमी: चारराय); एए = लोड 'input1.txt' का उपयोग PigStorage ('') के रूप में (नाम: chararray, cid: chararray); बी = FOREACH एक जनक CONCAT (सीसी, '-', बीबी, '-', मिमी) newCid के रूप में; सी = सीआईडी ​​द्वारा एए द्वारा जुड़ें, बी द्वारा नए सीआईडी; डी = FOREACH सी उत्पन्न $ 0, $ 1; डंप डी; आउटपुट: (ससी, 41-22-2563) (परीक्षण, 43-46-1234)    

Comments

Popular posts from this blog

java - ImportError: No module named py4j.java_gateway -

python - Receiving "KeyError" after decoding json result from url -

.net - Creating a new Queue Manager and Queue in Websphere MQ (using C#) -