שיטה חדשה לניתוח מידע מריצוף DNA עתיק

שיטה חדשה לניתוח מידע מריצוף DNA עתיק

שיטה זו משפרת את יכולתנו לקבוע את מוצאן ההיסטורי של אוכלוסיות בנות-זמננו והקשר שלהן לאוכלוסיות עתיקות

באדיבות ד"ר לילי אגרנט-תמיר ופרופ' לירן כרמל מן המחלקה לגנטיקה במכון למדעי החיים.

כבר לפני עשורים אחדים החלו לרצף DNA עתיק בן מאות ואף אלפי שנים. בעשור האחרון חלו התפתחויות טכנולוגיות ביכולתנו להפיק ולרצף DNA משיניים ועצמות, בדרך כלל מעצם הפטרוס שבאוזן הפנימית, בה נשמר ה-DNA בצורה טובה יחסית גם בתנאי אקלים קשים. הודות להתפתחויות אלה מרוצף כיום DNA עתיק באופן תעשייתי כמעט, מה שהביא להתפתחותו של תחום מחקרי חדש – היסטוריה מולקולרית – בו משמש מידע המופק מ-DNA עתיק לחקר אוכלוסיות ופרטים של בני אדם ובעלי חיים שחיו בעבר, בדרך כלל באלפי השנים האחרונות.

למרות ההתפתחויות הטכנולוגיות, המידע המתקבל מ-DNA עתיק לוקה בחסר, מכיוון ששימור ה-DNA לאורך השנים אינו מושלם. באופן אופייני, בתהליך ריצוף ה-DNA העתיק מנסים להגיע לקריאה של מעל מיליון אתרים ב-DNA המראים שונות בין אוכלוסיות. בפועל, באתרים רבים לא מצליחים לקרוא את המידע כלל, ובאתרים רבים אחרים קיים מידע חלקי לגבי אלל אחד בלבד. לפיכך, בד בבד עם התפתחות הטכנולוגיות הגנטיות התפתחו גם שיטות חישוביות המותאמות במיוחד לניתוח מידע מ-DNA עתיק.

אחת השיטות המרכזיות בתחום, qpAdm, בודקת מודלים לפיהם כמה אוכלוסיות (להלן, אוכלוסיות מקור) מתערבבות (מתרבות ביניהן), ומהערבוב נוצרת אוכלוסיה חדשה (להלן, אוכלוסיית מטרה). שיטה זו מתאימה למקרים בהם גם אוכלוסיות המקור וגם אוכלוסית המטרה הן עתיקות. עם זאת, שיטה זו אינה מתאימה למקרה בו רוצים לבדוק אוכלוסית מטרה בת זמננו.

לשם כך פיתחנו שיטה חישובית חדשה – LINADMIX – שמטרתה לבחון מודלים של ערבוב, בהם אוכלוסית המטרה היא מודרנית, ואילו אוכלוסיות המקור הן עתיקות. LINADMIX אומדת את התרומה היחסית של כל אוכלוסית מקור לאוכלוסית המטרה המודרנית, ומעריכה עד כמה נתמך מודל הערבוב על ידי הנתונים.

במאמר שהתפרסם לאחרונה בכתב העת Bioinformatics, אנו מראים את ביצועי LINADMIX ואת השפעותיהם של פרמטרים שונים על השיטה. בעזרת סימולציות רבות, המדמות תרחישים רבים של ערבובי אוכלוסיות, הראינו ש-LINADMIX אומדת היטב את התרומות היחסיות של אוכלוסיות המקור לאוכלוסית המטרה. למשל, הראינו ש- LINADMIX יכולה למצוא את המקורות של אוכלוסיה שנוצרה מערבוב של אפילו ארבע אוכלוסיות מקור.

תוכנת LINDAMIX זמינה באמצעות קוד פייתון בקישור הבא: https://github.com/swidler/linadmix.

אנו מאמינים שבעזרת שיטה זו, והודות למגוון האוכלוסיות העתיקות עבורן רוצף DNA עתיק, נוכל להרחיב את ידיעותנו על המקור הגנטי של מגוון אוכלוסיות בנות-זמננו. דוגמה לכך הראינו במאמר קודם, בו הצגנו גירסה מוקדמת של LINADMIX. במחקר ההוא בחנו את המקור של אוכלוסיות מזרח תיכוניות בנות זמננו, והראינו שלרב האוכלוסיות הללו מקורות חזקים מאוד בלבנט הקדום של תקופת הברונזה, בשילוב תרומות נוספות מאירופה ומאפריקה.

קיראו את המאמר - https://academic.oup.com/.../bioinformatics/btab531/6322987