Yapay Zeka ile Yeni Proteinler Tasarlanıyor!

Proteinler, insan vücudunun ve diğer yaşam formlarının temel yapı taşlarıdır ve kas gelişimi başta olmak üzere birçok önemli işlevi yerine getirir. Bu doğrultuda, EsmGFP adı verilen yeni bir modellenmiş protein ortaya çıkmıştır. Şu an için yalnızca bir bilgisayar kodu olarak mevcut olan bu protein, daha önce keşfedilmemiş bir yeşil floresan protein türünün detaylarını içermektedir. Doğada yeşil floresan proteinler, özellikle denizanası ve mercanlar gibi canlılar tarafından parlaklık kazanmak için kullanılır.
Technologijos’tan edinilen bilgiye göre, EsmGFP’nin yapımına yönelik talimatları içeren harf dizisinin yalnızca %58’i tamamlanmıştır. Bu protein, bilinen en yakın floresan protein ile benzerlik gösteriyor ve kabarcık deniz anemonları (Entacmaea quadricolor) gibi deniz canlılarının dokunaçlarının uçlarında etkileşimde bulunduğu süzgeçli bir protein arasındaki insan tarafından değiştirilmiş bir versiyondur. Ancak, dizinin geri kalan kısmı tamamen benzersizdir ve bu evrimsel değişikliklerin doğada meydana gelmesi için yaklaşık 500 milyon yılın geçmesi gerekmektedir.
EvolutionaryScale’deki araştırmacılar, geçtiğimiz yıl yaptıkları bir ön çalışmada EsmGFP’yi ve bu protein için kullanılan yapay zeka modeli ESM3’ü tanıttılar. 16 Ocak 2023’te yayımlanan bulgular, şu anda bağımsız araştırmacılar tarafından incelenmektedir ve Science dergisinde yayımlanmıştır.
Boşlukları doldurmasının sağlanması
ESM3, evrimin geleneksel kısıtlamalarının ötesinde yeni proteinler tasarlama yeteneğine sahiptir. Bu model, bilim insanlarının sağladığı eksik protein kodundaki boşlukları doldurarak, potansiyel evrimsel yolları dikkate alıp var olabilecek protein formlarını tasarlamaktadır. Çalışmanın ortak yazarlarından ve EvolutionaryScale’in kurucu ortağı olan baş bilim insanı Alex Rives, “ESM3’ün temel biyolojiyi öğrendiğini ve evrimsel süreçlerin dışında fonksiyonel proteinler üretebildiğini keşfettik,” ifadelerini kullanmıştır.
Yeni araştırma, Rives ve meslektaşlarının 2024 yılı öncesinde Meta’da başlattığı çalışmalara dayanmaktadır ve ESM3, OpenAI’nin ürettiği GPT-4 modeli ile benzer bir şekilde çalışmakta fakat biyolojiye odaklanmaktadır.
Proteinler, amino asit adı verilen ve dizilimi genler tarafından belirlenen moleküler zincirlerden oluşmaktadır. Her proteinin kendine özel amino asit dizileri ve yapısal özellikleri bulunmaktadır. Nature Education’a göre, her protein, işlevlerini icra etmesine imkan tanıyan benzersiz bir şekle katlanır. ESM3’ün proteinleri anlaması için, araştırmacılar model verilerine, proteinin temel özellikleri olan amino asit dizisi, yapısı ve işlevi hakkında bir dizi harf girmek suretiyle bilgi yüklemesi gerçekleştirmiştir.
ESM3 Takımı, doğada mevcut olan proteinlerin verileri için 2,78 milyar dolardan daha az bir maliyet ödemiştir. Araştırmacılar, proteinin belirli kısımlarını rastgele gizleyerek, ESM3’e mevcut bilgi birikimi ile kodu tamamlaması için gereken boşlukları doldurmasını istemiştir.
Rives, durumu şöyle açıklamaktadır: “Tıpkı birinin ‘Hamlet’in monologunda’ eksik kelimeleri tamamlayabilmesi gibi, biz de proteinlerdeki boşlukları doldurmak için bir dil modeli eğitebiliriz.” Rives, araştırmalarının bu basit problemin çözümü ile protein biyolojisinin derin yapısı hakkında önemli veriler sağladığını belirtiyor.
Protein mühendisliğinde devrim
Bilim insanları, doğal proteinleri çeşitli amaçlarla değiştirme ve yeni proteinler yaratma konusunda önemli adımlar atmaktadır. Örneğin, yeş