نموذج ذكاء اصطناعي جديد ينشئ بروتينات غير موجودة بالطبيعة
أعلن العلماء عن تطوير نموذج ذكاء اصطناعي جديد يسمى ESM3، والذي يستطيع تصميم بروتينات جديدة من الصفر بطريقة مشابهة لتنبؤ ChatGPT بالكلمات التالية في النص.
في دراسة نُشرت في 2 يوليو على قاعدة بيانات bioRxiv، كشف الباحثون أن النموذج أنشأ بروتين فلوري جديد، يشترك في 58% فقط من تسلسله مع البروتينات الفلورية الطبيعية.
تعريف البروتين الفلوري وأهميته
البروتين الفلوري هو نوع من البروتينات ينبعث منه ضوء فلوري عند تعرضه لأشعة معينة، مثل الأشعة فوق البنفسجية. يُستخدم البروتين الفلوري، مثل البروتين الأخضر الفلوري (GFP)، بشكل واسع في الأبحاث البيولوجية لمراقبة وتتبع العمليات الخلوية، بفضل قدرته على إصدار ضوء عند تعرضه لأشعة معينة، يسهل دراسة وظائف البروتينات وتفاعلاتها داخل الخلايا الحية.
تطوير نموذج ESM3 والابتكارات الجديدة
تم تطوير ESM3 بواسطة شركة EvolutionaryScale، التي أسسها باحثون سابقون في شركة Meta.
أوضح ممثلو الشركة في بيان صادر في 25 يونيو أن النموذج الصغير متاح بموجب ترخيص غير تجاري، بينما سيكون النموذج الأكبر متاحًا للباحثين التجاريين.
بحسب EvolutionaryScale، يمكن أن تسهم هذه التقنية في مجالات متعددة، من اكتشاف الأدوية إلى تصميم مواد كيميائية لتحلل البلاستيك.
كيفية عمل نموذج ESM3
ESM3 هو نموذج لغوي كبير (LLM) يشبه GPT-4 من OpenAI، ويعتمد على قاعدة بيانات تحتوي على 2.78 مليار بروتين. استخلص العلماء معلومات حول تسلسل البروتينات (ترتيب الأحماض الأمينية)، وبنيتها (الشكل المطوي ثلاثي الأبعاد)، ووظيفتها (دورها البيولوجي). قاموا بإخفاء أجزاء من هذه المعلومات عشوائيًا ليتنبأ ESM3 بالقطع المفقودة.
تقدم الأبحاث السابقة وتحديات التحقق
استند تطوير ESM3 إلى الأبحاث التي أجراها الفريق أثناء عملهم في Meta، حيث أعلنوا في عام 2022 عن نموذج EMSFold الذي تنبأ بهياكل البروتين الميكروبي. في نفس العام، أعلنت DeepMind من Alphabet عن تنبؤات بهياكل 200 مليون بروتين.
أشار العلماء إلى وجود قيود على تنبؤات هذه النماذج الذكاء الاصطناعي، وأنه يجب التحقق من دقة تنبؤات البروتينات.
رغم ذلك، يمكن لهذه الأساليب أن تسرع بشكل كبير من البحث عن هياكل البروتين، بدلًا من استخدام الأشعة السينية لرسم خريطة هياكل البروتين بشكل فردي، وهو أمر بطيء ومكلف.
استخدام الذكاء الاصطناعي في هذا المجال يعزز القدرة على ابتكار بروتينات جديدة وتحسين فهمنا للهياكل البيولوجية بطرق أسرع وأكثر كفاءة.