المعلوماتية والإحصاء في علم الوراثة

عودة للموسوعة

المعلوماتية والإحصاء في فهم الوراثة هومجال بحوث متعدد المجالات يستخدم أحدث التقنيات في فهم المورثات وفهم الوراثة الكمية والعلوم الحاسوبية والمعلوماتية الحيوية والإحصاء لتطوير وتطبيق طرق فعالة حسابياً وإحصائياً لتصنيف المخلوقات الحية المتنوعة من خلال التقنية الحيوية ذات النطاق الواسع والمتزايد باستمرار، حيث يتم تصنيفها من خلال المعلومات الوراثية للجينات أوالوظائف المشهجرة إلى مجموعات حسب: أنماطها الوراثية أووظائفها وتفاعلاتها الحيوية أومجموعة الأمراض والنمط الظاهري المشهجر بينها. وغالبًا ما يشار إلى هذا الفهم بـفهم الوراثة التقني وهوأحد فروع فهم التقنية الحيوية.

تحديد الأنماط الفردية

خلال العقدين الأخرين كان هنالك إقبال كبير لفهم الهجريب الوراثي وتشكل المورثات لمختلف الفصائل والأجناس من المخلوقات الحية بما في ذلك الهجريب الوراثي للإنسان، حيث ساعد بشكل كبير استخدام التقنيات المتعددة في تعقب ومتابعة السلاسل الوراثية للجينات وقرائتها والتي تتطور بدورها بشكل سريع وملحوظ، ولكن لا تزال هذه التقنيات محدودة، حيث تزيد الحاجة للطرق الحسابية والإحصائية للكشف عن الأخطاء في تلك التقنيات ومعالجتها وتجميع أجزاء من المعلومات الجزئية الوراثية من تقنيات متابعة وقراءة السلاسل الوراثية للجينات وفهم أنماطها الجينية.

يتم فهم النمط الفردي للمخلوقات الحية من خلال تسلسل النيوكليوتيدات (A ، G ، T ، C) على طول الكروموسوم الواحد فيها مثل الانسان لدية 23 زوجًا من الكروموسومات أوالذرة الصفراء التي تحتوي علىعشرة أزواج من الكروموسومات. ولكن باستخدام التكنولوجيا الحالية من الصعب الفصل بين زوجين من الكروموسوم ما ينتج عنه نمط فردي مركب يطلق على هذا النوع معلومات النمط الفردي الوراثي في جميع نيوكليوتيد، الهدف من تلك الدراسات هوالعثور على نمطين فرديين متنوعين في ضوء المعلومات الوراثية المدمجة. تعد فهم الأنواع الفردية مهمة للغاية وليس فقط لأنها تعطي صورة كاملة عن مورثات الأفراد فحسب، ولكنها تساعد أيضًا في العمليات الجينية المعلوماتية الأخرى مثل الفرضية حيث يعد من المحفزات البيولوجية الهامة.

بالنسبة للكائنات ثنائية الكروموسوم مثل الإنسان والذرة، وهوان لكل واحد منهما نسختين من الكروموسوم جميع نسخة حصل عليها من أحد الأبوين وهذة النسختين متشابهة للغاية من بعضها البعض. النمط الفردي هوتسلسل النيوكليوتيدات في الكروموسوم، احياناً تكون معضلة تحديد النمط الفردي في اختلاف النيوكليوتيدات في احد الكروموسومان المتماثلان. من الناحية التقنية، بالنسبة للجينات التي تحتوي على مواقع اختلاف للنيوكليوتيدات قد ينتج عنه نوعان مختلفان من الأنماط، لذلك هجرز معضلة تحديد النمط الفردي على إيجاد وتحديد الأنماط الفردية الأكثر احتمالية بفعالية من خلال النظر إلى النمط الوراثي المتسقط لها. ولمزيد من المعلومات، راجع النمط الفردي الموروث .

التنبؤ بالنيوكليدات الفردية في الأنماط الجينية من خلال الفرضيات

على الرغم من حتى مورثات المخلوقات الحية حقيقية النواة تحتوي على ملايين الأشكال المتعددة للنيوكليوتيدات (تشكل النيوكليدات الفردية single nucleotide polymorphisms) ، فإن مصفوفات النمط الجيني يتم تحديدها مسبقًا للكشف فقط عن شفرة جينية واحدة، حيث يتم تسقط المعلومات أوالشفرات الاخرى المفقودة باستخدام تحليل الفرضيات الوراثية، الآن أصبح ظهور العلامات غير الموروثة جزءًا أساسيًا من الدراسات الوراثية والجينية. يستخدم كيفية تحديد اختلال الارتباط المتوازن (linkage disequilibrium) لفهم الأنماط الفردية بالرجوع إلى منصات معهدية فهم مسبقاً مثل: HapMap و1000 Genomes Projects للتنبؤ بأنماط وراثية في الشفرات المفقودة أوالغير مورثه. أتاحت هذه الطرق للفهماء إجراء تحليل دقيق لكل من معلومات التشكل الوراثي المتعدد الأشكال والعلامات غير الموروثة التي يتم التنبؤ بها حسابيًا. لقد ثبت حتى دراسات التتبع للتشكيل الوراثي أوالاختلاف الوراثي مفيدة جداً في تحليل الفرضيات وفي تطوير الفهم في اكتشاف الجينات الحاملة للأمراض، ومن الجدير بالذكر حتى استخدام الفرضيات الجينية في التحليل الوراثي ساهم ايضاً في تسهيل جمع البيانات بين الدراسات الوراثية والجينات التي تستخدم كمنصات لفهم الأنماط الجينية المتنوعة في تجاربها، فمثلا على الرغم من وجود 415 مليون نوع من المتغيرات الوراثية الشائعة والنادرة في مورثات الإنسان، إلا حتى مصفوفات النمط الجيني المستخدمة حالياً مثل Affymetrix وIllumina مصفوفات صغيرة يمكنها فقط فحص ما يصل إلى 2.5 مليون تشكل من النيوكليدات الفردية single nucleotide polymorphisms. لذلك يعتبر تحليل الفرضيات الجينية اتجاهًا بحثيًا مهمًا، حيث تكمن أهميته في تحديد الأساليب والمنصات لإدخال بيانات النمط الجيني عالية الجودة باستخدام الأنماط الوراثية الموجودة والمنصات المرجعية من الموارد المتاحة للعامة مثل مشروع HapMap الدولي ومشروع 1000 Genomes. بالنسبة للانسان نجح تحليل الفرضيات الوراثية في تحديد أنماط وراثية متسقطة في الكثير من الأعراق بما في ذلك الأوروبيين والأميركيين الأفارقة، و بالنسبة للأنواع الأخرى مثل النباتات يعد تحليل الفرضيات الوراثية عملية مستمرة تستخدم منصات مرجعية مثل الذرة.

يوجد الكثير من الطرق المتنوعة المتبعة في تحليل فرضيات الهجريب الوراثي، هنالك ثلاث طرق منها هي الأكثر استخدامًا : Mach و Impute وBeagle ، تستخدم هذه الطرق الثلاث نماذج ماركوف اللوغارثمية المخفية كمحور أساسي لتقدير التوزيع المتواتر في النمط الفردي. تعد Mach وImpute2 من أكثر الطرق كثافة من الناحية الحسابية بالمقارنة مع Beagle. كما تعتمد جميع من Impute وMach على تطبيقات مختلفة لنواتج مشروطة أوباستخدام نموذج الـ Parent Adult Child ،حيث يعتمد Beagle على تجميع النماذج الفردية للمنصة المرجعية في المجموعات لكل تشكل في النيوكليوتيد الواحد لتكوين نموذج مجموعة النمط الفردي الذي يتيح لها تغيير عدد الكتل في جميع تشكل في النيوكليوتيد الواحد ديناميكيًا مما يجعلها أسرع حسابيًا من Mach وImpute2.

لمزيد من المعلومات، راجع الفرضيات (فهم الوراثة) .

التحليل الواسع لربط المورثات

على مدار السنوات القليلة الماضية أصبحت دراسات الارتباط على نطاق المورثات (Genome-wide Association Analysis) أداة قوية لاستكشاف الأساس الوراثي للأمراض الشائعة، حيث حسّنت فهمنا للأساس الجيني للعديد من الصفات المعقدة . single-nucleotide polymorphism التقليدي وهوتعدد الأشكال أحادي النوكليوتيدات في دراسة ارتباط المورثات وهي الطريقة الأكثر شيوعًا للعثور على متغيرات تسلسل الحمض النووي المرتبطة بالسمات، حيث يتم التحقق من الارتباطات بين المتغيرات الواحدة أوأكثر من الأنماط الظاهرية المثيرة للاهتمام من خلال دراسة الأفراد الذين لديهم أنماط ظاهرية مختلفة وفحص الأنماط الوراثية الخاصة بهم في موضع محدد لكل (تشكل أحادي النيوكليدات single nucleotide polymorphisms) للفرد الواحد، من ثم يتم الإبلاغ عن التكرار المتعدد في (تشكل النيوكليدات الفردية) والذي يعد أحد المتغيرات الخاصة وهوالأكثر شيوعًا إحصائيًا في تحليل الأفراد الذين ينتمون إلى مجموعة ظاهرية واحدة وهذا التحليل مرتبط بالنمط الظاهري. ومع ذلك فإن معظم الأمراض الشائعة المعقدة تنطوي على مساهمات صغيرة على مستوى الفصيلة من مواقع الجينات المتعددة. لدراسة وتحديد تأثير الاختلافات الطفيفة في ارتباط المورثات على نطاق واسع تعتمد الدراسات التقليدية منها على زيادة حجم العينة فمثلاً لاكتشاف التأثير الذي يمثله 0.1٪ من التباين الكلي في النمط الظاهري للفرد بحاجة هذه الدراسات التقليدية إلى أخذ عينات من حوالي 30,000 فرد. بالرغم من حتى تطوير تقنيات النمط الجيني ذات الإنتاجية العالية أدى إلى خفض التكلفة وتحسين كفاءة النمط الجيني ولكن للقيام بمثل هذه الدراسة الواسعة النطاق لا يزال عالي التكلفة المادية ويحتاج المزيد من الوقت. في الآونة الأخيرة تم اقتراح طرق تحليل ارتباط المورثات باستخدام الاختبارات القائمة على الجينات والتي تستند إلى حقيقة حتى الاختلافات في ترميز البروتين والمناطق التنظيمية المجاورة لها على الأرجح ذات صلة وظيفية. تتمتع هذه الطرق بميزة أنها تستطيع حساب المتغيرات الوظيفية المستقلة المتعددة داخل الجين، مع إمكانية زيادة القدرة على تحديد الجينات المرتبطة بالأمراض أوالسمات. أيضا فإن تسقط علامات اختلاف غير نمطية باستخدام المنصات المرجعية المعروفة (مثل HapMap ومشروع 1000 Genomes) يتنبأ بأنماط وراثية في علامات مفقودة أوغير نمطية مما يسمح للمرء بإجراء تقييم دقيق للأدلة المتعلقة بالارتباط عند علامات وراثية ليست مباشرة (بمضاف لها علامات جينية دالة ) وقد ثبت انها تحسن من نتائج الدراسات لارتباط المورثات للكشف عن المحفزات الجينية المرتبطة بالسقم.

لمزيد من المعلومات، راجع دراسة الارتباط المورثات على نطاق واسع

الأمراض الإحصائية ذات العلاقة بالتحليل الافتراضي

في هذا العصر الذي يحتوي على كمية كبيرة من البيانات الجينية والمورثات، يمثل التمثيل الدقيق والتفاعل الإحصائي في البيانات الحيوية والجينية أوالمورثات بشكل عام، أساسًا حيويًا في تصميم التدخلات والحلول العلاجية للعديد من الأمراض المعقدة. من المعروف حتى الخلل الجيني الطفيف قد يجعلنا عرضة للعديد من الأمراض. نحن نتجه نحوعصر التحليل الوراثي الشخصي والطب الوراثي الشخصي الذي يحتاج تنبؤات دقيقة لمخاطر الأمراض التي تسببها العوامل الوراثية التي يحملها هذا الفرد. تعتبر الطرق الحسابية والإحصائية لتحديد الاختلافات الوراثية من بناء نماذج ذكية لدراسة وتحليل الارتباط المورثات واسع النطاق ضرورة ملحة لعلاج الكثير من الأمراض. والتحديات الرئيسية التي تقابلها هذه الدراسات هي : (1) تتضمن معظم الأمراض المعقدة إسهامات صغيرة أوضئيلة من عدة عوامل وراثية توضح فقط جزءًا ضئيلًا من التباين الجيني العام الذي يعزى إلى العوامل الوراثية. (2) البيانات الوراثية معقدة للغاية بطبيعتها لذا فإن التعقيدات الأساسية للنظم الحيوي (مثل اختلال الترابط وعدم التجانس الوراثي) بحاجة إلى إدراجها في النماذج الإحصائية لدراسة المحفزات المسببة للسقم. تنطوي فرص الإصابة بالكثير من الأمراض الشائعة مثل السرطان وأمراض المناعة الذاتية وأمراض القلب والأوعية الدموية على تفاعلات معقدة بين جينات متعددة والكثير من العوامل البيئية الداخلية والخارجية. لا يمكن حتى تؤدي الدراسات السابقة لارتباط محفزات السقم الوراثية إلى نتائج مهمة بسبب عدم وجود تفاعلات إحصائية في النماذج الرياضية التي توضح مسببات السقم، وبالتالي فإن المخاطر الكامنة وراء الكثير من الأمراض والاضطرابات الوراثية لا تزال مجهولة. تظهر الطرق الحسابية مثل لنمذجة وتحديد الاختلافات الجينية والجينات الكامنة وراء ظهور السقم إمكانية عالية وواعدة لتحسين طرق العلاج وتحسين حالة المريض، وفهم التفاعلات واستخدام أساليب علاجية أفضل بناءً عليها.

المراجع

  1. ^ Hao, Ke; Chudin, Eugene; McElwee, Joshua; Schadt, Eric E (2009). "Accuracy of genome-wide imputation of untyped markers and impacts on statistical power for association studies". BMC Genetics. 10: 27. doi:10.1186/1471-2156-10-27. PMID 19531258.
  2. ^ Nothnagel, M; Ellinghaus, D; Schreiber, S; Krawczak, M; Franke, A (2009). "A comprehensive evaluation of SNP genotype imputation". Human Genetics. 125 (2): 163–71. doi:10.1007/s00439-008-0606-5. PMID 19089453.
  3. ^ Chanda, P; Yuhki, N; Li, M; Bader, JS; Hartz, A; Boerwinkle, E; Kao, WH; Arking, DE (2012). "Comprehensive evaluation of imputation performance in African Americans". Journal of Human Genetics. 57 (7): 411–21. doi:10.1038/jhg.2012.43. PMID 22648186.
  4. ^ Hickey, John M.; Crossa, Jose; Babu, Raman; De Los Campos, Gustavo (2012). "Factors Affecting the Accuracy of Genotype Imputation in Populations from Several Maize Breeding Programs". Crop Science. 52 (2): 654. doi:10.2135/cropsci2011.07.0358.
  5. ^ "Mach". مؤرشف من الأصل في 22 سبتمبر 2014.
  6. ^ "Impute2". مؤرشف من الأصل في 27 سبتمبر 2018.
  7. ^ "Beagle". مؤرشف من الأصل في 22 يونيو2019.
  8. ^ McCarthy, MI; Abecasis, GR; Cardon, LR; Goldstein, DB; Little, J; Ioannidis, JP; Hirschhorn, JN (2008). "Genome-wide association studies for complex traits: Consensus, uncertainty and challenges". Nature Reviews Genetics. 9 (5): 356–69. doi:10.1038/nrg2344. PMID 18398418.
  9. ^ Chanda, Pritam; Huang, Hailiang; Arking, Dan E.; Bader, Joel S. (2013). Veitia, Reiner Albert (المحرر). "Fast Association Tests for Genes with FAST". PLoS ONE. 8 (7): e68585. doi:10.1371/journal.pone.0068585. PMID 23935874.
  10. ^ Chanda, P; Zhang, A; Brazeau, D; Sucheston, L; Freudenheim, JL; Ambrosone, C; Ramanathan, M (2007). "Information-theoretic metrics for visualizing gene-environment interactions". American Journal of Human Genetics. 81 (5): 939–63. doi:10.1086/521878. PMID 17924337.
  11. ^ Chanda, Pritam; Sucheston, Lara; Liu, Song; Zhang, Aidong; Ramanathan, Murali (2009). "Information-theoretic gene-gene and gene-environment interaction analysis of quantitative traits". BMC Genomics. 10: 509. doi:10.1186/1471-2164-10-509. PMID 19889230.
  12. ^ Chanda, P.; Sucheston, L.; Zhang, A.; Brazeau, D.; Freudenheim, J. L.; Ambrosone, C.; Ramanathan, M. (2008). "AMBIENCE: A Novel Approach and Efficient Algorithm for Identifying Informative Genetic and Environmental Associations with Complex Phenotypes". Genetics. 180 (2): 1191–210. doi:10.1534/genetics.108.088542. PMID 18780753.
  13. ^ "MDR". مؤرشف من الأصل في 29 أغسطس 2019.
  14. ^ Shang, Junliang; Zhang, Junying; Sun, Yan; Zhang, Yuanke (2013). "EpiMiner: A three-stage co-information based method for detecting and visualizing epistatic interactions". Digital Signal Processing. 24: 1–13. doi:10.1016/j.dsp.2013.08.007.
  15. ^ "BOOST". مؤرشف من الأصل في 29 أغسطس 2019.
تاريخ النشر: 2020-06-01 18:57:41
التصنيفات: علم الأحياء الحاسوبي, علم الجينوم, معلوماتية حيوية, مقالات يتيمة منذ سبتمبر 2019, جميع المقالات اليتيمة, جميع المقالات التي بحاجة لصيانة, بوابة علم الوراثة/مقالات متعلقة, جميع المقالات التي تستخدم شريط بوابات

مقالات أخرى من الموسوعة

سحابة الكلمات المفتاحية، مما يبحث عنه الزوار في كشاف:

آخر الأخبار حول العالم

النفوذ الفرنسي يتراجع بشكل كبير في افريقيا وفرنسا أصبحت منبوذة

المصدر: موقع الدار - المغرب التصنيف: مجتمع
تاريخ الخبر: 2023-03-06 15:26:33
مستوى الصحة: 48% الأهمية: 63%

السلطة الفلسطينية تحذّر من عواقب هدم منازل خلال شهر رمضان

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-03-06 15:25:51
مستوى الصحة: 82% الأهمية: 92%

رئيس الحكومة يصدر منشور تنزيل برنامج “أوراش 2”

المصدر: موقع الدار - المغرب التصنيف: مجتمع
تاريخ الخبر: 2023-03-06 15:26:30
مستوى الصحة: 47% الأهمية: 68%

إيران: النساء اللواتي ينتهكن «قواعد الزي» سيعاقَبن

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-03-06 15:25:42
مستوى الصحة: 95% الأهمية: 99%

مفاجأة اللحظات الأخيرة: أكشينار قد تعود لطاولة المعارضة التركية

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-03-06 15:25:48
مستوى الصحة: 93% الأهمية: 93%

لبنان: حاكم «المركزي» يمثل أمام القضاء في 15 مارس

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-03-06 15:25:49
مستوى الصحة: 78% الأهمية: 85%

الأخضر الشاب يخسر من الصين - أخبار السعودية

المصدر: صحيفة عكاظ - السعودية التصنيف: مجتمع
تاريخ الخبر: 2023-03-06 15:26:07
مستوى الصحة: 47% الأهمية: 66%

شهر على زلزال تركيا... نحو 46 ألف قتيل وبلد في حالة صدمة

المصدر: ألشرق الأوسط - السعودية التصنيف: سياسة
تاريخ الخبر: 2023-03-06 15:25:40
مستوى الصحة: 79% الأهمية: 100%

تحميل تطبيق المنصة العربية