לדלג לתוכן

מסד נתונים לסדרות עתיות

מתוך ויקיפדיה, האנציקלופדיה החופשית
יש לערוך ערך זה. ייתכן שהערך סובל מבעיות ניסוח, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו, או מפגמים טכניים כגון מיעוט קישורים פנימיים.
אתם מוזמנים לסייע ולערוך את הערך. אם לדעתכם אין צורך בעריכת הערך, ניתן להסיר את התבנית.
יש לערוך ערך זה. ייתכן שהערך סובל מבעיות ניסוח, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו, או מפגמים טכניים כגון מיעוט קישורים פנימיים.
אתם מוזמנים לסייע ולערוך את הערך. אם לדעתכם אין צורך בעריכת הערך, ניתן להסיר את התבנית.

מסד נתונים לסדרות עתיותאנגלית: Time series database‏ או TSDB) הוא תוכנת מערכת המותאמת לאחסון והגשת סדרות עתיות של זוגות "זמן-ערך"[1]. בתחומים מסוימים, "סדרות עתיות" יכולות להיקרא פרופילים, עקומות, עקבות או מגמות[2]. מספר מסדי נתונים של סדרות עתיות מוקדמות קשורים ליישומים תעשייתיים אשר יכולים לאחסן ביעילות ערכים שנמדדו מחיישנים, אך כיום מסדי נתונים אלו משמשים לתמיכה במגוון רחב בהרבה של יישומים.

במקרים רבים, המאגרים של נתוני סדרות עתיות ישתמשו באלגוריתמי דחיסה על מנת לנהל את הנתונים ביעילות[3]. אף על פי שניתן לאחסן נתוני סדרות עתיות במגוון סוגים של מסדי נתונים, העיצוב של מערכות אלו עם זמן כמדד מפתח שונה באופן מובהק ממאגרי מידע יחסיים המפחיתים קשרים נפרדים באמצעות מודלים ייחוסיים[4].

מסדי נתונים של סדרות עתיות מפרידים בדרך כלל את מערך המאפיינים הקבועים מהערכים הדינמיים והרציפים לקבוצות נקודות או 'תגים'. דוגמה לכך היא שמירת ניצולת המעבד לניטור ביצועים: המאפיינים הקבועים יכללו את השם 'ניצולת מעבד' את יחידות המידה '%' וטווח '0 עד 1'; והערכים הדינמיים יאחסנו את אחוז הניצול ואת חותמות הזמן. ההפרדה נועדה לאחסן ביעילות נתונים למטרות יישום אשר יכולות לחפש את קבוצת הנקודות באופן שונה מהערכים הצמודים למדד.

מסדי הנתונים שונים באופן משמעותי בתכונותיהם, אך רובם יאפשרו ליצור, לקרוא, לעדכן ולמחוק את צמדי "זמן-ערך" וכן את הנקודות אליהם הם משויכים. יכולות חישוב נוספות הנפוצות: אינטרפולציה, סינון וניתוח ממצאים, אך בדרך כלל אינן זהות בין מסדי הנתונים.

רשימת מסדי נתונים לסדרות עתיות

[עריכת קוד מקור | עריכה]

למערכות מסד הנתונים הבאות אופטימיזציה לטיפול בנתוני סדרות עתיות:

שם רישיון שפה מידע נוסף
Druid רישיון אפאצ'י 2.0 ג'אווה
eXtremeDB מִסְחָרִי SQL, Python, C / C ++, Java ו- C # [5]
InfluxDB MIT .[6] כרונוגרף AGPLv3, מסחרי באשכולות [7] Go [8]
Informix TimeSeries מִסְחָרִי C / C ++ [9]
kdb+ מִסְחָרִי Q
Kudu רישיון אפאצ'י 2.0 C ++ [10]
Prometheus רישיון אפאצ'י 2.0 Go
RedisTimeSeries RASL C [5]
Riak-TS רישיון אפאצ'י 2.0 Erlang
RRDtool GPLv2 C
Graphite אפאצ'י 2 Python [11]

הערות שוליים

[עריכת קוד מקור | עריכה]
  1. ^ Mueen, Abdullah; Keogh, Eamonn; Zhu, Qiang; Cash, Sydney; Westover, Brandon. "Exact Discovery of Time Series Motifs" (PDF). University of California, Riverside. p. 2. אורכב מ-המקור (PDF) ב-25 ביוני 2010. נבדק ב-31 ביולי 2019. Definition 2:A Time Series Database(D)is an unordered set of m time series possibly of different lengths. {{cite web}}: (עזרה)
  2. ^ Villar-Rodriguez, Esther; Del Ser, Javier; Oregi, Izaskun; Bilbao, Miren Nekane; Gil-Lopez, Sergio (2017). "Detection of non-technical losses in smart meter data based on load curve profiling and time series analysis". Energy. 137: 118–128. doi:10.1016/j.energy.2017.07.008.
  3. ^ Pelkonen, Tuomas; Franklin, Scott; Teller, Justin; Cavallaro, Paul; Huang, Qi; Meza, Justin; Veeraraghavan, Kaushik (2015). "Gorilla". Proceedings of the VLDB Endowment. 8 (12): 1816–1827. doi:10.14778/2824032.2824078.
  4. ^ Asay, Matt (26 ביוני 2019). "Why time series databases are exploding in popularity". TechRepublic. אורכב מ-המקור ב-26 ביוני 2019. נבדק ב-31 ביולי 2019. Relational databases and NoSQL databases can be used for time series data, but arguably developers will get better performance from purpose-built time series databases, rather than trying to apply a one-size-fits-all database to specific workloads. {{cite web}}: (עזרה)
  5. ^ 1 2 Stephens, Rachel (2018-04-03). "State of the Time Series Database Market". נבדק ב-2018-10-03.
  6. ^ "influxdb license". GitHub. נבדק ב-2016-08-14.
  7. ^ "influxdb clustering". influxdata.com. נבדק ב-2016-03-10.
  8. ^ Anadiotis, George (2018-09-28). "Processing time series data: What are the options?". zdnet.com. נבדק ב-2016-03-10.
  9. ^ Dantale, Viabhav (2012-09-21). Solving Business Problems with Informix TimeSeries (PDF). IBM Redbooks. ISBN 9780738437231.
  10. ^ "Benchmarking Time Series workloads on Apache Kudu using TSBS".
  11. ^ Joshi, Nishes (23 במאי 2012). Interoperability in monitoring and reporting systems (Thesis). hdl:10852/9085. {{cite book}}: (עזרה)