Hive (בתרגום מאנגלית- כוורת) נבנה על גבי Hadoop ומאפשר שירותי סיכום נתונים.
Hive פותח על ידי פייסבוק, מאוחר יותר נכנס לשימוש ופותח על ידי חברות אחרות כגון נטפליקס ו FINRA.
Hive מספק אבסטרקציה של SQL לאינטגרציה של שאילתות עם מאפייני SQL, הנקרא HiveQL לתוך שכבת הקוד (Java) ללא צורך למימוש השאילתות בממשק Java.
כמו כן, מספקים שפה פשוטה ואינטואיטיבית יותר לכתוב שאילתות דמוי SQL אשר מתורגמות ל- Map Reduce.
Map reduce כולל שני שלבים:
1. Map -מיפוי המכונות, תהליך הנתונים וחלוקת הנתונים במכונות.
2. Reduce- קבלת כלל הנתונים לאחר העיבוד סיכומם חזרה יחד
יתרונות:
1. מנוהל ב-Cloudera manager כחלק מה Hadoop.
2. יכולות לבצע אנליזות וניתוחים על בסיסי מידע גדולים בעזרת ה Map Reduce.
חסרונות:
1. לא עובד בטרנזקציות בזמן אמת היות ועובד ב batch proccessing.