ריצוף RNA
ערך ללא מקורות
| ||
ערך ללא מקורות | |
יש לערוך ערך זה. ייתכן שהערך סובל מבעיות ניסוח, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו, או מפגמים טכניים כגון מיעוט קישורים פנימיים.
| ||
יש לערוך ערך זה. ייתכן שהערך סובל מבעיות ניסוח, סגנון טעון שיפור או צורך בהגהה, או שיש לעצב אותו, או מפגמים טכניים כגון מיעוט קישורים פנימיים. | |
ריצוף RNA או RNA-seq (קיצור של RNA Sequencing) הוא שיטת ריצוף שעושה שימוש בטכנולוגיות ריצוף בתפוקה גבוהה כדי לגלות את קיומו וכמותו של RNA בדגימה ביולוגית ברגע נתון, וכך לנתח את הטרנסקיפטום המשתנה מרגע לרגע.
ספציפית, ריצוף RNA מאפשר לצפות במקטעים שעברו שחבור חליפי, בעריכת רנ"א, באיחוי גנים, במוטציות/SNPs, ובשינויים בביטוי הגנים לאורך זמן, או הבדלים בביטוי הגנים בין קבוצות שונות או כתוצאה מטיפול שונה. בנוסף למולקולות mRNA, ריצוף RNA יכול לבחון את שכיחותן של מולקולות RNA מגדלים ומסוגים שונים, כגון RNA כולל ו-RNA קטן, שכולל microRNA ו-tRNA, וכן לאפשר Ribosome profiling. ריצוף RNA יכול גם לשמש לקביעת הגבולות בין אקסונים לאינטרונים, ולאמת או לתקן את האנוטציות של גבולות הגנים, קצה ה-5' וקצה ה-3'. הפיתוחים החדשים בריצוף RNA כוללים ריצוף של תא בודד, ריצוף של רקמה מקובעת באתרה, וריצוף של מולקולות RNA מקוריות באמצעות ריצוף מולקולות בודדות בזמן אמיתי. דוגמאות נוספות ליישומים שצצים בזכות התקדמות האלגוריתמים בתחום הביואינפורמטיקה הן גילוי שינויים במספר החזרות, זיהום חיידקים, טרנספוזונים, סוג התא (התמיינות), ובדיקה לנוכחות נאואנטיגנים (אנטיגנים שמייחדים תאים סרטניים).
לפני שפותח ריצוף ה-RNA, מחקרים על ביטוי גנים התבצעו בעזרת מערכי DNA. בטכנולוגיה הזאת היו מספר בעיות: תוצאות שגויות כתוצאה מצימוד שגוי של רצפים (cross-hybridization artifacts), מדידה לא מדויקת של רמת הביטוי של גנים בעלי רמת ביטוי גבוהה ונמוכה, והצורך לדעת את הרצף מראש. בגלל הבעיות הטכניות הללו, הטרנסקריפטומיקה עברה לשיטות מבוססות-ריצוף. שיטות אלה הלכו והתקדמו מריצוף בשיטת סנגר תוך שימוש בספריות של תת-רצפים של cDNA (Expressed sequence tags), לשיטות מבוססות תיוג כימי (לדוגמה, ניתוח סדרתי של ביטוי גנים (אנ')), ולבסוף לטכנולוגיה הנוכחית, טכנולוגיית ריצוף מתקדמת (הדור הבא) של DNA משלים (cDNA), הידועה כריצוף RNA.
שיטות
[עריכת קוד מקור | עריכה]הכנת ספריות
[עריכת קוד מקור | עריכה]השלבים הכלליים של הכנת ספריית DNA משלים (cDNA) לצורך ריצוף מתוארים להלן, אם כי לעיתים קרובות יש הבדלים בין פלטפורמות.
- בידוד ה-RNA – מבודדים את ה-RNA מרקמות ומערבבים אותו עם דאוקסירובונוקלאז (אנ') (DNase). DNase מפחית את כמות ה-DNA הגנומי. כמות ה-RNA שהתפרק נמדדת באמצעות אלקטרופורזה בג'ל ובנימיות (אנ'), ומשמשת לחישוב 'מספר שלמוּת ה-RNA' (אנ') של הדגימה. מדד איכות זה של ה-RNA והכמות ההתחלתית הכוללת של ה-RNA נלקחים בחשבון במהלך השלבים הבאים: הכנת הספרייה, הריצוף והניתוח.
- בחירה או הסרה של RNA – כדי לנתח את האותות שמעוניינים לבדוק, ניתן להשאיר את ה-RNA שבודַד כפי שהוא, לסנן מתוכו RNA בעל זנבות 3' שעברו פוליאדנילציה (poly(A)) כדי לקבל mRNA בלבד, עם כמה שפחות RNA ריבוזומלי (rRNA), ו/או לסנן מתוכו RNA שנקשר לרצפים ספציפיים (ראו את טבלת השיטות לבחירה והסרה של RNA, להלן). RNA עם זנבות poly(A) 3' כולל בעיקר רצפים בוגרים, מעובדים, מקודדים. בחירה של poly(A) מתבצעת על ידי ערבוב ה-RNA עם אוליגומרים של poly(T) המחוברים באופן קוולנטי למצע, בדרך כלל חרוזים מגנטיים. לבחירה של poly(A) יש מגבלות חשובות בזיהוי ביוטיפים של RNA. יש הרבה ביוטיפים של RNA שזנבותיהם לא עברו פוליאדנילציה, כולל הרבה תעתוקים של RNA שאינו מקודד ושל RNA שמקודד חלבוני ליבת היסטון, או שהבקרה שלהם היא באמצעות אורך זנב ה-poly(A) שלהם (למשל, ציטוקינים), ולכן הם עלולים לא להתגלות לאחר הבחירה של poly(A). יתר על כן, בחירה של poly(A) עלולה לגרום להטיה מוגברת כלפי 3', במיוחד עם RNA באיכות נמוכה יותר. ניתן להימנע ממגבלות אלו באמצעות הסרה של RNA ריבוזומלי (rRNA), המהווה בדרך כלל למעלה מ-90% מה-RNA בתא. הן השלב של העשרת ה-poly(A) והן השלב של הסרת ה-RNA הריבוזומלי הם עתירי עבודה ועלולים להכניס הטיות, ולכן פותחו גישות פשוטות יותר כדי להימנע מהשלבים הללו. כאשר מעוניינים לבדוק רצפי RNA קטנים, כגון miRNA, ניתן להמשיך ולבודד אותם על בסיס גודל בעזרת ג'לים לסינון (exclusion gels), חרוזים מגנטיים או ערכות מסחריות.
- סינתוז cDNA – מבצעים תעתוק לאחור של ה-RNA ל-cDNA, הן מכיוון ש-DNA הוא יציב יותר והן כדי לאפשר הגברה (תוך שימוש ב-DNA פולימראז) ולמנף טכנולוגיית ריצוף DNA בוגרת יותר. הגברה לאחר תעתוק לאחור גורמת לאובדן הגדיליוּת (strandedness) של הרצפים, כלומר אובדן המידע האם מקורה של מולקולת ה-cDNA הוא בגדיל הקָרִיא או בגדיל המוּל-קָרִיא של ה-DNA. ניתן להימנע מאובדן הגדיליות באמצעות תיוג כימי או באמצעות ריצוף מולקולה בודדת. מבצעים חלוקה למקטעים ובחירה לפי גודל כדי להגיע למצב שכל הרצפים הם באורך המתאים למכונת הריצוף. ה-RNA, ה-cDNA, או שניהם מחולקים למקטעים בעזרת אנזימים, סוניקציה (אנ') או נבולייזרים (nebulizers). חלוקת ה-RNA למקטעים מפחיתה את הטיית ה-5' של תעתוק לאחור באופן אקראי ואת ההשפעה של אתרי ההיקשרות של התחלים, אך יש לה חיסרון – קצוות ה-5' וה-3' מומרים ל-DNA בצורה פחות יעילה. לאחר החלוקה למקטעים מבצעים בחירה לפי גודל, שבה או שמסירים רצפים קטנים או שבוחרים טווח צר של אורכי מקטעים. מכיוון שמולקולות RNA קטנות כמו miRNA הולכות לאיבוד, מנתחים אותן באופן עצמאי. ניתן לאנדקס את ה-cDNA של כל ניסוי באמצעות הקסאמר או אוקטמר שישמש כברקוד, כדי שיהיה אפשר לאגד את הניסויים הללו לנתיב אחד של ריצוף מרובה (multiplexed sequencing).
אסטרטגיה | סוג ה-RNA הנפוץ ביותר | תכולת ה-RNA הריבוזומלי | תכולת RNA לא מעובד | שיטת בידוד |
---|---|---|---|---|
RNA כולל | כל הסוגים | גבוהה | גבוהה | אין |
בחירת PolyA | מקודד | נמוכה | נמוכה | היברידיזציה (אנ') עם אוליגומרים של poly(dT) |
הסרת rRNA | מקודד, לא מקודד | נמוכה | גבוהה | הסרת אוליגומרים משלימים ל-rRNA |
לכידת RNA | הסוג המבוקש | נמוכה | בינונית | היברידיזציה עם גלאים משלימים לתעתיקים המבוקשים |
ריצוף DNA משלים (ריצוף cDNA)
[עריכת קוד מקור | עריכה]- ערך מורחב – ריצוף DNA
בשלב זה מרצפים את ספריית ה-cDNA שנוצרה מביוטיפים של RNA ושומרים את המידע בפורמט קריא במחשב. קיימות טכנולוגיות ריצוף רבות בתפוקה גבוהה לריצוף cDNA, כולל פלטפורמות שפותחו על ידי אילומינה, תרמו פישר (אנ'), BGI/MGI (אנ'), פסיפיק ביוסיינסז (אנ') ואוקספורד ננופור טכנולוג'יז (אנ'). כדי להשתמש בטכנולוגיית הריצוף בקריאות קצרות של אילומינה – טכנולוגיה שמרבים להשתמש בה לריצוף cDNA – מדביקים ל-cDNA מתאמים, מחברים את ה-DNA לתא זרימה, יוצרים צבירים באמצעות בניית גדילים משלימים והפרדתם וחוזר חלילה, ולאחר מכן מבצעים ריצוף-באמצעות-סינתזה תוך מעבר לסירוגין בין בניית גדילים משלימים לבין עירור לייזר של בסיסים שהוצמדו להם חוסמי תיעתוק ניתנים להסרה (ראו ריצוף אילומינה). הבחירה בפלטפורמת ריצוף ובפרמטרים נעשית לפי מבנה הניסוי והעלות. השיקולים הנפוצים בתכנון הניסוי כוללים החלטה על אורך הריצוף, עומק הריצוף, שימוש בקריאה חד-כיוונית או דו-כיוונית (single-end or paired-end reads), מספר העותקים, ריבוי (multiplexing), רנדומיזציה ו-spike-ins.
ריצוף RNA קטן/לא מקודד
[עריכת קוד מקור | עריכה]כשמרצפים RNA שאינו mRNA, מכינים את הספרייה בצורה שונה. בוחרים את ה-RNA של התאים לפי טווח הגדלים הרצוי. כשרוצים לרצף RNA קטן, כגון miRNA, מבודדים את ה-RNA באמצעות בחירת גודל. ניתן לבצע זאת באמצעות ג'ל לסינון לפי גודל, באמצעות חרוזים מגנטיים לבחירת גודל, או בעזרת ערכה שפותחה באופן מסחרי. לאחר הבידוד, מוסיפים מקשרים (linkers) לקצות ה-3' וה-5' ואז מטהרים אותם. השלב האחרון הוא יצירת cDNA באמצעות תעתוק הפוך.
ריצוף ישיר של RNA
[עריכת קוד מקור | עריכה]מכיוון שהוכח שהמרה של RNA ל-cDNA, ליגציה, הגברה, ועיבודים נוספים של הדגימות מכניסים הטיות וממצאי שווא שעלולים להפריע הן לאפיון הנכון והן לכימות של התעתיקים, חברות שונות כגון Helicos (פשטה רגל), ו-Oxford Nanopore Technologies עסקו בפיתוח ריצוף ישיר של מולקולת RNA בודדת. טכנולוגיה זו מרצפת מולקולות RNA באופן ישיר בשיטת הריצוף המסיבי-המקביל.
ריצוף בזמן אמת של מולקולת RNA בודדת
[עריכת קוד מקור | עריכה]ריצוף ישיר של מולקולת RNA בודדת באופן מסיבי ומקביל נחקר כחלופה לריצוף ה-RNA המסורתי, שבו המרת ה-RNA ל-cDNA, הליגציה, ההגברה ושלבי עיבוד אחרים של הדגימות עלולים להכניס הטיות וממצאי שווא. פלטפורמות טכנולוגיות שמבצעות ריצוף של מולקולת RNA בודדת בזמן אמת כוללות את ריצוף Nanopore של חברת Oxford Nanopore Technologies (ONT), את ריצוף IsoSeq של חברת PacBio ואת חברת Helicos (פשטה רגל). ריצוף RNA בצורתו הטבעית משמר שינויים כמו מתילציה, ומאפשר לחקור אותם באופן ישיר ובו-זמני. יתרון נוסף של ריצוף מולקולת RNA בודדת הוא שניתן לכסות את התעתיקים באורך מלא, מה שמאפשר לזהות ולכמת איזופורמים בוודאות גבוהה יותר בהשוואה לריצוף בקריאות קצרות. בעבר, לשיטות ריצוף מולקולת RNA בודדת היו שיעורי שגיאה גבוהים יותר בהשוואה לריצוף בקריאות קצרות, אך שיטות חדשות יותר כמו שיטת ONT לריצוף ישיר של RNA מגבילות את כמות השגיאות בכך שהן נמנעות מחלוקה למקטעים ומהמרה ל-cDNA. השימוש שנעשה לאחרונה בשיטת ONT לבדיקת הביטוי הדיפרנציאלי באוכלוסיות תאים אנושיים הוכיח שהטכנולוגיה הזו יכולה להתגבר על מגבלות רבות של ריצוף cDNA קצר וארוך.
ריצוף RNA של תא בודד
[עריכת קוד מקור | עריכה]- ערך מורחב – ריצוף ברמת התא הבודד
שיטות סטנדרטיות כגון מיקרו-מערכים וניתוח סטנדרטי של RNA שרוצף בכמויות גדולות, מנתחות את ביטוי ה-RNA באוכלוסיות גדולות של תאים. באוכלוסיות מעורבות של תאים מסוגים שונים, המדידות הללו עלולות לטשטש הבדלים קריטיים בין תאים אינדיבידואליים בתוך האוכלוסיות.
ריצוף RNA של תא בודד (scRNA-Seq) מספק את פרופילי הביטוי של תאים בודדים. למרות שלא ניתן לקבל מידע מלא על כל RNA שמבוטא על ידי כל תא, בשל הכמות הקטנה של החומר הזמין, ניתן לזהות דפוסים של ביטוי גנים באמצעות ניתוח אשכולות של הגנים. זה יכול לחשוף את קיומם של סוגים נדירים של תאים שאולי לא נראו מעולם. לדוגמה, תאים מתמחים נדירים בריאות הנקראים יונוציטים ריאתיים המבטאים את מווסת ההולכה הטרנסממברנית של ציסטיק פיברוזיס זוהו בשנת 2018 על ידי שתי קבוצות שביצעו ריצוף RNA של תא בודד על תאי אפיתל של דרכי הנשימה בריאות.
יישומים
[עריכת קוד מקור | עריכה]ריצוף RNA של תא בודד נכנס לשימוש רחב במגוון דיסציפלינות ביולוגיות כגון התפתחות העובר והאורגניזם, נוירולוגיה, אונקולוגיה, מחלות אוטואימוניות, ומחלות זיהומיות.
הריצוף בדרך זו סיפק תובנות חשובות לגבי התפתחותם של עוברים ואורגניזמים, כולל התולעת Caenorhabditis elegans, והתולעת השטוחה שמסוגלת להתחדש Schmidtea mediterranea (אנ'). בעלי החוליות הראשונים שמופו בדרך זו היו דג הזברה והצפרדע האפריקאית Xenopus laevis (אנ'). בכל אחד מהמקרים נחקרו שלבים רבים של העובר, שאפשרו למפות את תהליך ההתפתחות במלואו על בסיס תא-אחר-תא. כתב העת Science הכיר בהישגים אלו כפריצת הדרך של השנה ב-2018.
שיקולים בעריכת ניסויים
[עריכת קוד מקור | עריכה]בתכנון ובביצוע ניסויי ריצוף RNA יש לקחת בחשבון מגוון פרמטרים:
- ספציפיות של רקמות – ביטוי הגנים משתנה בתוך כל רקמה ובין רקמות שונות, וריצוף RNA מודד תערובת של סוגי תאים. זה עלול להקשות על בידוד המנגנון הביולוגי שמעוניינים לבחון. ניתן להשתמש בריצוף תא בודד כדי לבחון כל תא בנפרד, וכך להתגבר על בעיה זו.
- תלות בזמן – ביטוי הגנים משתנה על ציר הזמן, וריצוף RNA רק מצלם תמונת מצב. ניתן לבצע סדרת בדיקות לאורך זמן כדי לצפות בשינויים בטרנסקריפטום.
- כיסוי (מכונה גם 'עומק') – RNA מכיל את אותן מוטציות שנצפו ב-DNA, וכדי לגלות אותן נדרש כיסוי עמוק יותר. אם הכיסוי גבוה מספיק, ניתן להשתמש בריצוף RNA כדי להעריך את הביטוי של כל אלל. זה יכול לספק תובנות לגבי תופעות כמו החתמה או השפעה של אזורי בקרה שצמודים לגנים (אנ'). את עומק הריצוף הנדרש עבור יישומים ספציפיים ניתן להסיק מניסויי פיילוט.
- ממצאי שווא בהפקת המידע (מכונים גם 'שונות טכנית') – הריאגנטים (למשל, ערכת הכנה לספרייה), אנשי הצוות שמבצעים את הניסוי, וסוג טכנולוגיית הריצוף (למשל, אילומינה, Pacific Biosciences) עלולים ליצור ממצאי שווא טכניים שעלולים להתפרש בטעות כתוצאות בעלות משמעות. כמו בכל ניסוי מדעי, רצוי לבצע ריצוף RNA בסביבה מבוקרת היטב. אם זה בלתי אפשרי או שהמחקר הוא מטא-אנליזה, פתרון אחר הוא לזהות ממצאי שווא טכניים על ידי הסקת משתנים חבויים (לרוב באמצעות ניתוח גורמים ראשיים או ניתוח גורמים) ולאחר מכן לשלוט במשתנים הללו.
- ניהול נתונים – ניסוי אחד של ריצוף RNA בבני אדם לרוב כולל 1–5 Gb של נתונים (לאחר דחיסה), ואפילו יותר אם כוללים גם את קובצי הביניים. נפח הנתונים הגדול יכול ליצור בעיות אחסון. פתרון אחד הוא לדחוס את הנתונים בשיטות דחיסה רב-תכליתיות (למשל, Gzip) או בשיטות דחיסה ספציפיות לגנומיקה. השיטות הספציפיות יכולות להיות מבוססות על רצף ייחוס או דה נובו. פתרון נוסף הוא לבצע ניסויי מיקרו-מערך, שעשויים להספיק למחקרים שעוסקים בבחינת השערות או למחקרי שכפול (בניגוד למחקרי גישוש (אנ')).
אנליזה
[עריכת קוד מקור | עריכה]הרכבת הטרנסקריפטום (Transcriptome assembly)
[עריכת קוד מקור | עריכה]ישנן שתי שיטות לשיוך קריאות רצף גולמיות לאזורים ספציפיים בגנום (כלומר, להרכבת הטרנסקיפטום):
- הרכבה מאפס (דה נובו) – גישה זו אינה דורשת גנום ייחוס כדי לשחזר את התעתיק, ולרוב משתמשים בה כשהגנום אינו ידוע, אינו שלם או כשהתעתיק עבר שינויים מהותיים בהשוואה לגנום הייחוס. בשימוש בקריאות קצרות לצורך הרכבה מאפס מתעוררים מספר קשיים: 1. כיצד לקבוע אילו קריאות יש לחבר יחד לרצפים בלתי מופסקים (Contigs); 2. כיצד להתגבר על שגיאות ריצוף וממצאי שווא אחרים; ו-3. יעילות חישובית. בעבר האלגוריתם העיקרי ששימש להרכבה מאפס היה גרף חפיפה, שמצריך לבדוק אם יש חפיפה בין כל שתי קריאות. כיום האלגוריתם העיקרי הוא גרף De Bruijn (אנ'), שמפרק את הקריאה לרצפים באורך k ומכווץ את כל ה-k-mers לתוך טבלת גיבוב. בעבר נהגו להשתמש בגרף חפיפה יחד עם ריצוף בשיטת סנגר, אך השימוש בגרף חפיפה אינו מתמודד היטב עם מיליוני קריאות שנוצרות בריצוף RNA. דוגמאות לתוכנות הרכבה שמשתמשות בגרף De Bruijn הן Trinity, Oases (שמקורה בתוכנת הרכבת הגנום Velvet (אנ')), Bridger, ו-rnaSPAdes. ריצוף של אותה דגימה בקריאות דו-כיווניות ובקריאות ארוכות יכול לשמש כתבנית או שלד ולהשלים חלק מהפערים בריצוף של קריאות קצרות. מדדים להערכת האיכות של הרכבה מאפס כוללים את האורך החציוני של הרצפים הבלתי מופסקים (Contigs), את מספרם, ו-N50 (אנ').
- הרכבה מונחית-גנום – גישה זו מסתמכת על אותן שיטות המשמשות לעימוד רצפי DNA, אך עליה להתמודד עם מורכבות נוספת: עימוד קריאות שמכסות חלקים לא רציפים של גנום הייחוס. הקריאות הלא רציפות הן תוצאה של ריצוף תעתיקים שעברו שחבור. בדרך כלל, לאלגוריתמים של עימוד יש שני שלבים: 1. עימוד חלקים קצרים מהקריאה (כלומר, זריעה של הגנום), ו-2. שימוש בתכנון דינמי כדי למצוא עימוד אופטימלי, לפעמים בשילוב עם אנוטציות ידועות. כלי תוכנה שמשתמשים בעימוד מונחה גנום כוללים את Bowtie, TopHat (המתבסס על התוצאות של BowTie לעימוד צומתי שחבור), Subread, STAR, HISAT2, ו-GMAP. לאחר השימוש בכלים לעימוד (מיפוי) מונחה גנום, ניתן להעביר את הפלט שלהם לכלים כגון Cufflinks או StringTie כדי לשחזר רצפי תעתיק בלתי מופסקים (כלומר, קובץ FASTA). ניתן למדוד את האיכות של הרכבה מונחית גנום באמצעות: 1. מדדי הרכבה מאפס (למשל, N50) ו-2. השוואה לתעתיק ידוע, צומת שחבור ידוע, גנום ידוע או חלבונים ידועים באמצעות האלגוריתמים Precision, Recall (אנ') או שילוב שלהם (למשל, ציון F1). בנוסף, ניתן לבצע הערכה ממוחשבת (in silico) תוך שימוש בקריאות מדומות.
הערה על איכות ההרכבה – הקונצנזוס הנוכחי הוא ש-1. איכות ההרכבה יכולה להשתנות בהתאם למדד שמשתמשים בו, 2. כלי הרכבה שקיבלו ציון טוב במין אחד של אורגניזמים אינם בהכרח מתפקדים היטב במינים אחרים, ו-3. ייתכן ששילוב של גישות שונות הוא הכי אמין.
כימות של ביטוי הגנים
[עריכת קוד מקור | עריכה]ביטוי הגנים מכומת כדי לחקור שינויים בתא בתגובה לגירויים חיצוניים, כדי לחקור הבדלים בין מצב בריא ומצב מחלה, ושאלות מחקר אחרות. רמת התעתוק משמשת לעיתים קרובות כפרוקסי לכמות החלבון, אך לעיתים קרובות הן אינן שקולות זו לזו עקב אירועים שלאחר התעתוק כגון הפרעות ל-RNA (RNAi) ו-Nonsense-mediated decay (NMD).
ניתן לכמת את רמת הביטוי על ידי ספירת מספר הקריאות שמופו לכל לוקוס בשלב הרכבת הטרנסקריפטום. ניתן לכמת את מידת הביטוי של אקסונים או גנים באמצעות קונטיגים או באמצעות אנוטציות של תעתיק ייחוס. השוואות שנערכו בין ספירת הקריאות במהלך ריצוף RNA ובין טכנולוגיות ישנות יותר, כולל מיקרו-מערכי ביטוי ו-PCR בזמן אמת, מצאו שספירת הקריאות אמינה מאוד. ישנם מספר כלים שמכמתים ספירות: HTSeq, FeatureCounts, Rcount, maxcounts, FIXSEQ ו-Cuffquant. כלים אלה מפיקים נתוני קריאות מנתוני ריצוף RNA מעומדים, אך ניתן גם להפיק נתוני קריאות ללא עימוד באמצעות Sailfish ו-Kallisto. לאחר מכן, ממירים את נתוני הקריאות למדדים מתאימים לצורך בדיקת השערות, עריכת רגרסיות, וניתוחים אחרים. הפרמטרים להמרה זו הם:
- העומק (או הכיסוי) של הריצוף – למרות שהעומק מוגדר מראש כשמבצעים ניסויי ריצוף RNA מרובים, הוא בכל זאת משתנה במידה רבה בין ניסויים. לכן, המספר הכולל של קריאות שנוצרו בניסוי בודד מנורמל בדרך כלל על ידי המרת מספר הקריאות למקטעים, קריאות או ספירות למיליון קריאות ממופות (FPM, RPM או CPM). היסטורית, ההבדל בין RPM ל-FPM נוצר במהלך ההתפתחות מריצוף יחיד של מקטעים לריצוף דו-כיווני. בריצוף יחיד, יש רק קריאה אחת לכל מקטע (כלומר, RPM = FPM). בריצוף דו-כיווני, יש שתי קריאות לכל מקטע (כלומר, RPM = 2 x FPM). עומק הרצף מכונה לפעמים 'גודל הספרייה' – מספר מולקולות הביניים מסוג cDNA שיש בניסוי.
- אורך הגן – לגנים ארוכים יותר יהיו יותר מקטעים/קריאות/ספירות מאשר לגנים קצרים יותר, אם מידת הביטוי של התעתיק היא זהה. לוקחים זאת בחשבון ידי חלוקת ה-FPM באורך התכונה (גן, תעתיק או אקסון), והתוצאה היא מקטעים מטריים ל-Kbp של התכונה למיליון קריאות ממופות (FPKM). כאשר מסתכלים על קבוצות של תכונות בדגימות שונות, ממירים את FPKM לתעתיקים למיליון (TPM) על ידי חלוקת כל FPKM במספר הכולל של ה-FPKM בתוך דגימה.
- הפלט הכולל של דגימת ה-RNA – מכיוון שאותה כמות של RNA מופקת מכל דגימה, בדגימות עם RNA כולל גבוה יותר יהיה פחות RNA לכל גן. הגנים האלה נראים כאילו יש ירידה בביטוי שלהם, וכתוצאה מכך עלולות להתקבל תוצאות חיוביות שגויות בניתוחי ההמשך. אסטרטגיות נורמליזציה הכוללות quantile, DESeq2, TMM ו-Median Ratio מנסות לתקן את ההבדל הזה על ידי השוואת קבוצה של גנים שאין הבדל במידת הביטוי שלהם בין הדגימות השונות, ושינוי קנה המידה בהתאם.
- שונות במידת הביטוי של כל גן – נלקחת בחשבון כדי לתקן שגיאות דגימה (זה חשוב עבור גנים בעלי מספר קריאות נמוך), כדי להגדיל את העוצמה, וכדי להפחית את התוצאות החיוביות השגויות. ניתן להעריך את השונות כהתפלגות נורמלית, כהתפלגות פואסון או כהתפלגות בינומית שלילית, והיא מפורקת לעיתים קרובות לשונות טכנית ולשונות ביולוגית.
שימוש ב-Spike-ins לכימות מוחלט ולזיהוי השפעות רוחביות על הגנום
[עריכת קוד מקור | עריכה]RNA Spike-ins (אנ') הם דגימות של RNA בריכוזים ידועים שיכולות לשמש כתקן זהב בתכנון ניסויים ובניתוח תוצאותיהם לשם כימות מוחלט וזיהוי של השפעות רוחביות על הגנום.
- כימות מוחלט – כימות מוחלט של ביטוי גנים אינו אפשרי ברוב ניסויי ריצוף ה-RNA, שמכמתים את הביטוי ביחס לכל התעתיקים. כימות מוחלט אפשרי על ידי ביצוע ריצוף RNA עם Spike-ins, דגימות של RNA בריכוזים ידועים. לאחר הריצוף, משתמשים בנתוני הקריאות של רצפי ה-Spike-in כדי לקבוע את הקשר בין נתוני הקריאות של כל גן לבין הכמות המוחלטת של מקטעים ביולוגיים. לדוגמה, טכניקה זו שימשה כדי לקבוע את הקינטיקה של התעתוק בעוברים של הצפרדע Xenopus tropicalis (אנ').
- זיהוי השפעות רוחביות על הגנום – שינויים במנגנוני בקרה גלובליים, כולל מעצבי כרומטין, גורמי תעתוק (למשל, Myc), קומפלקסים של אצטילטרנספראז (אנ'), ועמדת הנוקלאוזומים – אינם תואמים להנחות הנרמול, ושימוש ב-Spike-ins כביקורת יכול להציע פרשנות מדויקת לכך.
גישת המיקרו-אריי (Microarray)
[עריכת קוד מקור | עריכה]לפני המצאת ריצוף הרנ"א, דנ"א מיקרו-אריי (DNA microarrays) הייתה השיטה המחקרית השולטת לאנליזת הטרנסקריפטום על ידי יצירת פרופילים של רמות ביטוי גנים. למרות שגם כיום מחקרים לא מעטים משתמשים במיקרו-אריי ומייצרים תוצאות מלהיבות במעט זמן יחסית, מגבלות ניסויות פנימיות של שיטה זו גורמות לריצוף הרנ"א להיות השיטה המועדפת. מגבלה גדולה וחשובה ביותר של האריי היא העובדה שיש צורך לדעת איזה רצפים מחפשים, ולהכין לכל רצף נחקר גלאי מתאים על מנת לזהות ובסופו של דבר לכמת את התעתיקים, בעוד ששיטת הרנ"א- סק היא בעלת אופי של "שאלה פתוחה" אשר מניבה תוצאות גם ללא ידע מוקדם כלל על רצפי התעתיקים הנחקרים. ככל שהמחקר בתחום ריצוף הרנ"א גדל ומתרחב ומניב תוצאות מבטיחות וקבועות, נשאלת השאלה "האם זהו תחילתו של סוף עידן המיקרו-אריי?". אף על פי כן, עדיין ליישומים רבים, מיקרו-אריי היא השיטה המועדפת. לא רק ששיטה זו זולה פי 10–100 בהשוואה לאותה רזולוציית דיוק בריצוף רנ"א, אלה שגם פרוטוקולי העבודה של ריצוף הרנ"א עדיין לוקים בחסר בכל הקשור לשלבי הליגציה הנחוצים. מגבלה נוספת לכימות פרופיל ביטוי גנים באמצעות ריצוף רנ"א היא שתעתיקים שכיחים (כמו אלה של גנים "שומרי-בית") אחראים לעיקר האינפורמציה המרוצפת. כך למשל בדגימה טיפוסית, 5% מהגנים מהווים כ-75% מהקריאות המרוצפות. כתוצאה מכך קשה למדוד את שכיחות התעתיקים הנותרים בצורה אמינה ולכן רוב המדידות מושפעות מ"רעש" רב.
כיסוי כמדד לביטוי
[עריכת קוד מקור | עריכה]רמות ביטוי יכולות להיות מחולצות באמצעות ריצוף רנ"א רק בהתאם ליכולת שליפה של רצף נתון. מחקרי טרנסקריפטומיקה בשמרים למשל, הראו שנדרש כיסוי של פי-4 (Fourfold coverage) לאמפליקונים (amplicons) על מנת שאלו יהיו מאופיינים ומוגדרים כגן מבוטא. כאשר הטרנסקריפטום מקוטע לפני הפיכתו לדנ"א משלים, מספר הקריאות המיוחסות לאקסון מסוים, מנורמל לאורכו בחיה (in vivo), מניב רמות ביטוי לגן שהם בקורולציה לאלו המושגים באמצעות qPCR.
גילוי שונות ברמת הנוקליאוטיד הבודד
[עריכת קוד מקור | עריכה]- ערך מורחב – SNP
שונות ברמת הנוקליאוטיד הבודד בטרנסקריפטום נחקרה בתירס באמצעות פלטפורמת רוצ'ה 454 (Roche 454 sequencing). באמצעות טכנולוגיה זו חולצו בערך 7,000 פולימורפיזמים חד-בסיסיים (SNPs) שונים. לאחר אימות בעזרת שיטת סנגר, אושרו כמעט 5,000 פולימורפיזמים חד-בסיסיים שונים המשתרעים על פני למעלה מ-2,400 גנים בתירס.
כיסוי/עומק
[עריכת קוד מקור | עריכה]כיסוי ועומק יכולים להשפיע על המוטציות שמתגלות במהלך הריצוף. בהתחשב שדינמיקת התא היא תלוית ביטוי, אלל מסוים עשוי לא להתגלות הן מפני שאינו מצוי בגנום והן מפני שהגן אינו מבוטא בזמן המדידה. ריצוף רנ"א יכול להניב אינפורמציה נוספת אודות רמות הביטוי של כל אלל של גן מסוים וע"י כך לנסות ולכמת את אופי ההטרוזיגוטיות של גן נתון. במחקרים אסוציאתיבים, גנוטיפים מיוחסים למחלה, ורמות ביטוי עשויות להיות מיוחסות למחלה גם כן. באמצעות ריצוף רנ"א ניתן למדוד את הקשר בין שני משתנים מיוחסים אלה, כלומר מהו טיב הקשר לרמות ביטוי של אלל מסוים. עומק הריצוף הנחוץ לאפליקציה מסוימת יכול להיות מחולץ מניסוי מקדים קטן יותר (Pilot experiment).
השוואת רמות ביטוי אללים לתאי הרבייה
[עריכת קוד מקור | עריכה]הדרך היחידה להיות בטוח בוודאות במוטציות של פרט מסוים, היא על ידי השוואת רצפי הטרנסקיפטום של הפרט לרצפי הדנ"א הגנומי בתאי הרבייה של אותו פרט. תהליך זה מאפשר להבדיל בין גנים הומוזיגוטים לבין שונות בביטוי של אחד מהאללים. כמו גם, תהליך זה יכול לספק מידע אודות גנים שלא התבטאו כלל במהלך לקיחת הדגימה לניסוי.
אפיון שינויים שלאחר-שיעתוק
[עריכת קוד מקור | עריכה]באמצעות השוואת רצפי הטרנסקריפטום לגנום של פרט מסוים ניתן לזהות עריכות שלאחר-שיעתוק. כך למשל, במקרה שפרט מסוים הוא הומוזיגוט לגן מסוים, אך כל תעתיקי הרנ"א שהתגלו היו מטיפוס של אלל אחר שלא תואם לגרסה הגנומית, ניתן לקבוע שאכן התרחש אירוע עריכה שלאחר-שיעתוק.
באופן כללי וריאציות ברמת הבסיס הבודד ב-mRNA אינן נחשבות כמשפיעות על שונות פונקצינאלית בין תאים. הסיבה לכך היא מפני ששינויים אלה נעלמים עם דגרגציית מולקולת הרנ"א ואינם תמידיים, אולם הם בהחלט עשויים להשפיע על תהליכי התרגום והשיחבור של אותו תעתיק. כמו כן מכיוון שמנגנוני תיקון הדנ"א היעילים אינם פועלים על מולקולות רנ"א ניתן לזהות וריאציות כאלה בתדירות גבוה יחסית, ואף הוצע לקשור הליך זה למחלות פריון (חלקיק חלבוני זיהומי) כמו TSE) Transmissible Spongiform Encephalopathies).
גילוי איחוי גנים
[עריכת קוד מקור | עריכה]גנים מאוחים, הנוצרים בעקבות מודיפיקציות מבניות שונות בגנום, זכו לאחרונה להרבה תשומת לב עקב הקשרם לסרטן. היכולת של שיטת ריצוף הרנ"א לנתח טרנסקיפטום שלם מדגימה בצורה רנדומלית, הפכה את השיטה לכלי שימושי לגילוי אירועים שכיחים אלו בסרטן. הרעיון מתבסס על אותו הליך של יישור קריאות טרנסקריפטומיות קצרות לגנום מקור. רוב הקריאות הקצרות יותאמו לאזורי אקסונים או לצמתים בין אקסונים בלוקוס נתון, אך ייתכן מצב בו יהיו קריאות אשר יותאמו לקטעי אקסונים משני גנים שונים. מצב כזה יוכיח איחוי אפשרי בין גנים, אך עקב אורכן הקצר של הקריאות יהיה הרבה "רעש" במדידה. גישה אחרת היא שימוש בקריאות צמד-סוף (Paired end), כאשר מספר רב של קריאות כאלה יותאמו לקצוותם של שני אקסונים שונים, ברמת כיסוי גבוה, יהיה ניתן לגלות אירועי איחוי חדשים.
נושאים שיש להתחשב בהם
[עריכת קוד מקור | עריכה]איסוף מידע על ידי ריצוף הטרנסקריפטום, נתון לאותן המגבלות המשויכות לאנליזות ביטוי רנ"א אחרות:
- ביטוי תלוי-רקמה: ביטוי הגנים אינו אחיד בכל התאים של אורגניזם ותלוי רבות בסוג הרקמה ממנה נלקחו התאים הנחקרים.
- ביטוי תלוי-זמן: בזמן מחזור חייו של תא, פרופיל ביטוי הגנים משתנה בהתאם לזמן ביום, גירויים מהסביבה וכו'.
עקב כך, יש להיזהר מהסקת מסקנות מתוצאות מחקרי ריצוף שכן חלק מהמידע שנאסף אולי לא משקף את הפרט עצמו. דוגמה לכך היא גילוי וריאציות ברמת הבסיס הבודד ברנ"א שמתבטא, שלא בהכרח משקפות את הגנוטיפ של אותו הפרט. ייתכן ואלל המקור פשוט לא מתבטא באותה רקמה ו/או זמן, ומודיפיקציות תלויות רקמה/זמן שינו את התעתיק בדגימה הספציפית הנחקרת.
היסטוריה
[עריכת קוד מקור | עריכה]הופעתן של טכנולוגיות ריצוף מתקדמות בעלות תפוקה גבוהה פתחה אפשרויות חדשות בתחום ריצוף הדנ"א, וככל שהשימוש בכלים החדשים הפך נפוץ יותר, נוצרו גם שיטות חדשניות להשתמש בהם.
הדרישות הנמוכות של טכנולוגיות הריצוף בתפוקה גבוהה מרֶצֶף הנוקליאוטידים המשמש כקֶלֶט, יחד עם הכיסוי העמוק, והרזולוציה ברמת הבסיס הבודד – אפשרו לשימוש בטכנולוגיות האלה להתרחב לתחום הטרנסקריפטומיקה (Transcriptomics). טרנסקריפטומיקה היא תחום מחקר העוסק באפיון הרנ"א המתועתק מגנום מסוים שמעוניינים לחקור. אף על פי שהטרנסקריפטומים דינמיים יותר מדנ"א גנומי, הם מספקים גישה ישירה לבקרת גנים ומידע על חלבונים. ריצוף טרנסקריפטומים אינו רעיון חדש; פותחו בעבר שיטות שונות לפיענוח ישיר של רצפי דנ"א משלים (cDNA), רובן מבוססות על שיטת סנגר המסורתית (והיקרה יותר), ואחרות משתמשות במתודולוגיות כגון SAGE (Serial analysis of gene expression), CAGE (Cap analysis of gene expression) ו-MPSS (Massively parallel signature sequencing).
ריצוף טרנסקריפטום (ריצוף רנ"א) יכול להתבצע במגוון פלטפורמות כדי לבחון הרבה רעיונות והשערות. לדוגמה, פלטפורמת האנליזה הגנומית של אילומינה (Genome AnalyzerIllumina) שימשה בין היתר לריצוף טרנסקריפטומים של יונקים, ריצוף SOLiD של חברת ABI שימש לקבלת פרופיל ביטוי של תאי גזע, ו"ריצוף 454" של חברת Roche שימש לקבלת מפת הפולימורפיזמים החד-בסיסיים (SNPs) בתירס. למרות ההבדלים הטכניים בין פלטפורמה לפלטפורמה, האינפורמציה הנאספת מכל אחת מהן זהה במהותה.
ראו גם
[עריכת קוד מקור | עריכה]הערות שוליים
[עריכת קוד מקור | עריכה]- ^ Rohan Lowe, Neil Shirley, Mark Bleackley, Stephen Dolan, Transcriptomics technologies, PLoS computational biology 13, 2017-05, עמ' e1005457 doi: 10.1371/journal.pcbi.1005457