בנק מידע החלבונים
סוג | מאגר מידע קריסטלוגרפי |
---|---|
תקופת הפעילות | 1971–הווה (כ־53 שנים) |
www | |
בנק מידע החלבונים (אנגלית: Protein Data Bank או בראשי תיבות PDB) הוא מאגר מידע ממוחשב אשר מכיל תיאור של המבנה התלת־ממדי של מולקולות ביולוגיות גדולות, כדוגמת חלבונים וחומצות גרעין. המידע, שבדרך כלל מושג בקריסטלוגרפיה באמצעות קרני רנטגן או בספקטרוסקופיה באמצעות NMR, ונשלח על ידי ביולוגים וביוכימאים מרחבי העולם, ניתן לאחזור בחינם מהאינטרנט. על בנק המידע מפקח ארגון ושמו "Worldwide Protein Data Bank" ("בנק מידע החלבונים ברחבי העולם" בראשי תיבות wwPDB).
בנק המידע הוא מקור חשוב בתחומי הביולוגיה המבנית כדוגמת גנומיקה מבנית. מרבית כתבי העת המדעיים, וכמה מהארגונים המחלקים מענקי מחקר כדוגמת המכונים הלאומיים לבריאות (NIH) שבארצות הברית, דורשים כיום מהמדענים לשלוח מידע על מבנים שפוענחו לבנק המידע. בנק המידע הוא המקור הראשי למאות מאגרי מידע נגזרים המסווגים את המידע בצורה שונה. דוגמאות הן שיטת הסיווג המכונה SCOP (ראשי תיבות של Structural Classification of Proteins – סיווג מבני של חלבונים) ושיטת הסיווג CATH (ראשי תיבות של שיטת הסיווג Class Architecture Topology Homologous superfamily – מחלקה, ארכיטקטורה, טופולוגיה ומשפחת על הומולוגית) מסווגים מבנים על פי סוג המבנה ומניחים קשרים אבולוציוניים, שיטת הסיווג GO (ראשי תיבות Gene ontology – אונטולוגיה של גנים) מסווגת מבנים על בסיס גנים.[1]
היסטוריה
[עריכת קוד מקור | עריכה]בנק מידע החלבונים (PDB) החל כמיזם עצמאי של כמה מדענים.[1] ב-1971 הסכים וולטר המילטון (Walter Hamilton) מהמעבדה הלאומית בברוקהייבן (Brookhaven National Laboratory) לנהל את ה-PDB בברוקהייבן. המילטון נפטר שנתיים אחר כך, וטום קוזטלה (Tom Koeztle) נטל על עצמו את ניהול ה-PDB. בינואר 1994 מונה הקריסטלוגרף והביולוג הישראלי פרופ' יואל זוסמן ממכון ויצמן למנהל ה-PDB. באוקטובר 1998[2] הועבר ה-PDB לResearch Collaboratory for Structural Bioinformatics או בראשי תיבות RSCB. ההעברה הושלמה ביוני 1999. כמנהל בנק המידע מונתה הלן ברמן מאוניברסיטת ראטגרס (אחד מהמוסדות החברים ב-RSCB).[3] עם הקמת ה-wwPDB ב-2003 הפך ה-PDB להיות ארגון בינלאומי. כל אחד מארבעת החברים בארגון (שניים מארצות הברית, ארגון אירופי וארגון יפני) יכול לפעול כמרכז לאחסון, עיבוד נתונים והפצה של המידע המצוי ב-PDB. עיבוד נתונים מתייחס לעובדה שהצוות של ה-wwPDB בוחן ומעיר הערות על כל מבנה המתקבל. המידע נבדק בצורה ממוחשבת לישימות המבנה. (תוכנת הבדיקה שוחררה לציבור בלא תשלום).
תכולה
[עריכת קוד מקור | עריכה]בנק מידע החלבונים מתעדכן פעם בשבוע (ביום שלישי). בדומה, האתר PDB Current Holdings Breakdown (אורכב 04.07.2007 בארכיון Wayback Machine) מתעדכן פעם בשבוע. נכון לשבוע של ה-27 בדצמבר 2015 הכיל המאגר 114,569 מבנים של חלבונים שפוענחו על פי הפירוט הבא:
שיטת הפענוח |
חלבונים | חומצות גרעין | תרכובות חלבון/חומצת גרעין |
אחרים | סך-הכול |
---|---|---|---|---|---|
עקיפה של קרני רנטגן | 95,636 | 1,694 | 4,817 | 4 | 102,151 |
NMR | 9,840 | 1,135 | 231 | 8 | 11,214 |
מיקרוסקופ אלקטרוני | 666 | 29 | 227 | 0 | 922 |
מעורב | 83 | 3 | 2 | 1 | 89 |
אחר | 170 | 4 | 6 | 13 | 193 |
סך הכול | 106,293 | 2,865 | 5,283 | 26 | 114,569 |
- ל-91,748 מבנים ב-PDB יש קובץ structure factor
- ל-8,531 מבנים יש קובץ NMR restraint
- ל-2,289 מבנים יש קובץ chemical shifts
- ל-901 מבנים ב-PDB יש קובץ מיפוי 3 ממדי המאוחסן ב-EM Data Bank
הטבלה מראה כי מרבית המבנים פוענחו על ידי עקיפה באמצעות קרני רנטגן, אבל בשנים האחרונות כ-10% מהמבנים נקבעים על ידי שימוש ב-NMR, ומספר נמוך מזה באמצעות מיקרוסקופ אלקטרוני או, ליתר דיוק, קריו-מיקרוסקופ אלקטרוני, שכן הדגימה נחקרת בטמפרטורה של חנקן נוזלי (הקלקה על המספרים בטבלה המוצגת באתר מראה דוגמאות למבנים שפוענחו בשיטה זו).
החשיבות של קובצי ה-structure factor שהוזכרו דלעיל היא שעבור מבנים ב-PDB שנקבעו על ידי עקיפה של קרני רנטגן, שלהם יש קובץ מבנה, ניתן לצפות במפת צפיפות האלקטרונים. המידע על מבנים אלו מאוחסן ב-electron density server, שם ניתן לצפות במפות האלקטרונים.
בעבר גדל מספר המבנים ב-PDB כמעט בצורה מעריכית, וב-2014 עבר מספר המבנים את נקודת ה-100,000,[4] ועם זאת, מ-2007 החל קצב הגידול להתייצב והוא מתקרב ל-10,000 מבנים חדשים מדי שנה.
פורמט הקובץ
[עריכת קוד מקור | עריכה]הפורמט המקורי בו נעשה שימוש ב-PDB היה קרוי פורמט PDB. פורמט זה היה מוגבל לרוחב של כרטיסי מחשב מנוקבים, כלומר 80 תווים בשורה. החל משנת 1996 החל להיכנס לשימוש הפורמט "mmCIF" (ראשי תיבות של "macromolecular Crystallographic Information file" - קובץ מידע קריסטלוגרפי מאקרומולקולרי). גרסת XML של פורמט זה תוארה ב-2005.[5] את קובצי המבנה ניתן להוריד בכל אחד משלושת הפורמטים. למעשה, קבצים בודדים נטענים בקלות לתוך תוכנות גרפיות תוך שימוש בכתובות רשת (URL):
- לקבצים בפורמט PDB יש להשתמש ב:
http://www.pdb.org/pdb/files/4hhb.pdb.gz
- לקבצים בפורמט PDBML (XML) יש להשתמש ב:
http://www.pdb.org/pdb/files/4hhb.xml.gz
ה-"4hhb
" הוא מזהה ה-PDB. כל מבנה המתפרסם ב-PDB מקבל מזהה בן ארבעה תווים אלפאנומריים, ה-PDB ID שלו (לא ניתן להשתמש במספר מזהה זה כמזהה של הביומולקולה, שכן לעיתים קרובות מכיל ה-PDB כמה מבנים לאותה מולקולה – בסביבות או תצורות שונות – תחת PDB ID שונים).
צפייה במידע
[עריכת קוד מקור | עריכה]ניתן לצפות בתצוגה גרפית של המבנים בעזרת אחת מכמה תוכנות חופשיות. בין התוכנות החופשיות, אם כי לא בקוד פתוח מצויות:
- VMD – ראשי תיבות של Visual molecular dynamics
- MDL Chime
- Swiss-PDB Viewer
- StarBiochem – תוכנת הצגה מולקולות אינטראקטיבית הכתובה ב-Java והכוללת מנוע חיפוש בתוך בנק מידע החלבונים.
- Sirius visualization software
- VisProt3DS – כלי לדימות של חלבון בתלת־ממד בתצוגה סטריאוסקופית
אתר ה-PDB של ה-RSCB מכיל רשימה נרחבת (אורכב 24.08.2018 בארכיון Wayback Machine) של תוכנות לתצוגה של מולקולות (חופשיות ומסחריות) ותוכנות תקע לדפדפני אינטרנט.
קישורים חיצוניים
[עריכת קוד מקור | עריכה]- אתר האינטרנט הרשמי של בנק מידע החלבונים (באנגלית)
- RCSB Protein Data Bank (ארצות הברית)
- PDBe (אירופה)
- PDBj (יפן)
- BMRB - ראשי תיבות של Biological Magnetic Resonance Data Bank - בנק מידע ביולוגי של תהודה מגנטית (ארצות הברית)
- תיעוד - תיעוד על מבנה הקבצים בפורמטים: PDB ו-PDBML
- צפייה במבנים (אורכב 24.03.2011 בארכיון Wayback Machine) - ההקדמה של PDB לקריסטלוגרפיה
- דף הבית של PDBsum תמצית ממאגרי מידע אחרים על המבנים של ה-PDB
- NDB - ראשי תיבות של Nucleic Acid Database - מאגר המידע של חומצות גרעין. אתר ראי של PDB במיוחד לשם חיפוש חומצות גרעין
הערות שוליים
[עריכת קוד מקור | עריכה]- ^ 1 2 Berman, H. M. (בינואר 2008). "The Protein Data Bank: a historical perspective" (PDF). Acta Crystallographica Section A: Foundations of Crystallography. A64 (1): 88–95. doi:10.1107/S0108767307035623.
{{cite journal}}
: (עזרה) - ^ Berman, H. M. (בינואר 2000). "The Protein Data Bank". Nucleic Acids Res. 28 (1): 235–242. doi:10.1093/nar/28.1.235. PMC 102472. PMID 10592235.
{{cite journal}}
: (עזרה) - ^ RCSB PDB Staff
- ^ Hard data מתוך Nature
- ^ Westbrook, J. (2005). "PDBML: the representation of archival macromolecular structure data in XML" (PDF). Bioinformatics. 21 (7): 988–992. doi:10.1093/bioinformatics/bti082.