לדלג לתוכן

פיג

מתוך ויקיפדיה, האנציקלופדיה החופשית
(הופנה מהדף Pig)
פיג
מפתח קרן התוכנה אפאצ'י עריכת הנתון בוויקינתונים
מחזור חיים 11 בספטמבר 2008 – הווה (16 שנים) עריכת הנתון בוויקינתונים
גרסה אחרונה 0.17.0 (19 ביוני 2017) עריכת הנתון בוויקינתונים
מערכת הפעלה Microsoft Windows, macOS, לינוקס עריכת הנתון בוויקינתונים
נכתבה בשפות Java עריכת הנתון בוויקינתונים
סוג רישיון רישיון אפאצ'י עריכת הנתון בוויקינתונים
קוד מקור http://svn.apache.org/repos/asf/pig/ עריכת הנתון בוויקינתונים
pig.apache.org
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית

פיג[1] היא פלטפורמה מבית קרן התוכנה אפאצ'י ליצירת תוכניות הרצות על האדופ. השפה המשמשת את הפלטפורמה מכונה פיג לאטין (באנגלית: Pig Latin. מילולית: לטינית חזירית. כינוי לשפת סתרים באנגלית). פיג יכולה להריץ יישומי האדופ ב-MapReduce, אפאצ'י טז, או אפאצ'י ספארק. פיג מפשיטה את רמת הג'אווה של MapReduce לנוטציות הופכות תכנות ב-MapReduce לרמה עילית, בדומה לזו של SQL עבור מסדי נתונים יחסיים. פיג ניתנת להרחבה באמצעות פונקציות המוגדרות על ידי המשתמש (UDFs) אותן ניתן לכתוב ב-Java, פייתוןJavaScript, Ruby או Groovy[2] והן קוראות באופן ישיר לשפה.

פיג לעומת SQL

[עריכת קוד מקור | עריכה]

בהשוואה ל-SQL, פיג:

  1. משתמש בהערכה עצלה (Lazy evaluation)
  2. משתמש ב-ETL
  3. מסוגל לאחסן נתונים בכל נקודה במהלך צינור (Pipeline)
  4. מצהיר על תוכניות ביצוע (execution plan)
  5. תומך בפיצול הצינור (pipeline split), ובכך מאפשר זרימות לאורך DAG (גרף מכוון ללא לולאות) במקום בצינורות רציפים בלבד

קישורים חיצוניים

[עריכת קוד מקור | עריכה]

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ "Hadoop: Apache Pig". נבדק ב-2 ספט' 2011. {{cite web}}: (עזרה)
  2. ^ "Pig user defined functions". נבדק ב-3 במאי 2013. {{cite web}}: (עזרה)