Canlı biliminde devrim- Uzay Sezen

Yapay zeka protein katlanması sorununu çözmede devrimsel bir atılım gerçekleştirdi.

  • Haber
  • |
  • Basın derleme
  • |
  • 13 Ağustos 2021
  • 12:40

İnsan türünün başına dert olan hastalıkların neredeyse üçte biri proteinlerin yetersiz veya yanlış katlanması nedeniyle ortaya çıkmakta. Temmuz ayında, aynı gün yayınlanan iki çalışma yapay zeka yaklaşımlarının protein katlanması sorununu çözmede devrimsel bir başarıyı yakaladığını dünyaya duyurdu. İlk çalışma Seattle’daki Washington Üniversitesi araştırmacıları Minkyung Baek ve David Baker'ın geliştirdiği RoseTTAFold adlı bilgisayar yazılımının ürettiği sonuçları belgelemekteydi. İkinci çalışma ise Google'ın yapay zeka uygulamalarına odaklı alt kuruluşu DeepMind’ın (DerinAkıl) geliştirdiği AlphaFOLD yazılımının ürettiği insan türünü de kapsayan 20 canlının proteinlerinin üç boyutlu katlanmış biçimlerinin devasa bir veritabanı üzerine idi.

AlphaGO bilgisayar yazılımının 2016’da Koreli GO oyunu ustası Lee Sedol’ü yenmesi tüm dünyayı heyecana boğmuştu. AlphaGO bu karmaşık oyunu “sinirsel ağ” adı verilen bir yapay zeka yöntemiyle kendi kendine milyonlarca kere oynayarak öğrenmişti. Şaşırtıcı başarının ardından DeepMind, yapay zeka uygulamasını varolan bir soruna odaklama kararı aldı. Canlı bilimiyle uğraşan bilim insanlarının 50 yılı aşan bir süredir kafalarında bir bulut gibi dönen protein katlanması (proteinin üç boyutlu yapı kazanması) sorununu çözmek için başlatılan yeni girişime AlphaFOLD adı verildi.

AlphaFOLD’un CASP yarışması başarısı

Protein katlanması yapısal biyologlar için çözüm bekleyen çok temel bir sorun. Bir proteinin yapısını belirleyebilmek için yıllar süren laboratuvar çalışması ve ardından yoğun bilgisayar çözümlemeleri gerekmekte. Bu nedenle proteinlerin üç boyutlu biçimini yalnızca genlerinin DNA dizilimine bakarak öngörebilmek, olağanüstü bir atılıma yol açacak bir gelişme. Sorunu bilgisayar ortamında çözebilmek için iki yılda bir “protein yapısı öngörülerinin kapsamlı değerlendirmesi” kelimelerinin baş harflerinden oluşan CASP (Critical Assessment of protein Structure Prediction) adlı bir yarışma düzenlenmekte. Yarışma, elektron mikroskobu ve nükleer manyetik rezonans gibi oldukça ileri teknoloji ürünü aygıtlarla yapısı belirlenmiş ama yarışmacılardan gizli tutulan onlarca proteinin katlanmasını öngörmeye dayanıyor. 2018 yılında 13'üncüsü düzenlenen CASP yarışmasında birinciliği AlphaFOLD ele geçirmişti. 2020 yılındaki CASP14 yarışmasında ise AphaFOLD’un gerçekleştirdiği başarı tüm katılımcıların ve yapısal biyoloji topluluğunun nefesini kesti. AlphaFOLD sır gibi saklanan proteinlerin üç boyutlu katlanmış yapılarını atom düzeyinde bir gerçeklikle çözümleyerek 100 üzerinden 92.4 puan aldı. Bu derecede yüksek bir değere daha önce ulaşılamamıştı. AlphaFOLD eşi görülmemiş tarihi bir başarıya imza attı.

Evrimsel geçmiş yapay zekanın bilgi dağarcığını fersahlarca ileriye taşımakta

AlphaFOLD’un başarısı öğrenme sürecinde kullandığı bilgi kaynaklarının zenginliğine dayanmakta. 1912 yılından bu yana 28’i aşkın Nobel ödülünün alınmasını sağlayan ve 1954’te DNA yapısının belirlenmesinin yolunu açan X-ışını kırılımı (X-ray diffraction) yöntemi bugün çok daha kapsamlı ve çözünürlüklü veriler üreten görüntüleme teknolojilerine temel oluşturdu. Araştırmacılar yüzbinlerce biyolojik bileşiğin yapısını bu teknolojilerle deneysel olarak belirleyerek devasa veritabanları oluşturdular. AlphaFOLD tıpkı Go oyununu öğrenirken yaptığı gibi veri tabanlarına yüklenmiş proteinlerin yapılarını inceleyerek katlanma ve bükülmeyi etkileyen fiziksel ilkeleri kendi kendine öğrendi. Yalnızca bununla da kalmadı. Evrimsel biyologlar yapısal çalışmalarla eş güdümlü olarak pek çok proteinin evrimsel geçmişini ortaya çıkararak soy ağacına dönüştürmüş durumda. AlphaFOLD soyoluş (phylogeny) adı verilen bu incelemeleri de bilgi dağarcığına kattı ve ortaya eşi benzeri görülmemiş derecede nefes kesici bir çözümleme algoritması çıktı. Yıllar süren deneysel yapı belirleme çalışmalarının vardığı bir sonuca AlphaGO dakikalar içinde varabilmekte.

İnsan proteinlerinin katlanma çözümlemeleri herkesin erişimine açık

Bugüne dek insan proteinlerin ancak yüzde 17’sinin yapısı ortaya çıkarılabilmişti. AlphaFOLD baş döndürücü bir hızla geri kalan proteinlerin yapılarını çözümledi. Yapılar Avrupa Bileşiksel Biyoloji Laboratuvarı (EMBL) sunucularında herkesin erişimine açık bir veritabanı haline getirildi. Çalışmanın ayrıntıları derlenerek Nature Bilim Dergisi’nde 15 Temmuz’da önbasım olarak yayınlandı. AlphaFOLD ek olarak 20 değişik canlının da protein yapılarını çözümledi. AlphaFOLD böylece yapısal biyologların üzerindeki çok ağır bir yükü kaldırdı. Artık biyologlar çabalarını düzensiz proteinlerin yapılarına odaklayabilirler. Düzensiz proteinler, yapıları tıpkı bir ahtapotun kolları gibi sürekli değişen, katlanma kurallarının kısıtlamalarından göreceli olarak bağımsız bir devinim içindeki işlevsel olarak çok ilginç bileşiklerdir.

RoseTTAFold yazılımının açık bilime katkısı

Her ne kadar AlphaFOLD araştırma takımı bulgularını erişime açık tutsa da, derin öğrenmenin temelindeki sinirsel ağ yönteminin işleyişi konusundaki bilgileri gizli tutmaktalar. Buna karşın RoseTTAFold çalışma takımı tüm yapay zeka yöntemlerini açıkça paylaşarak alandaki gelişmeleri hızlandırıcı bir etkide bulunmayı umuyorlar.

RoseTTAFold, çözümleme stratejisini G protein almaçlarına kenetli proteinlerin (GPCR) yapılarını belirlemeye yönelik özelleşmiş bir yapay zeka yazılımı olarak tasarlandı. Bu algılayıcı almaç proteinleri hücre zarı içine gömülü olduklarından yüksek teknoloji ürünü görüntüleme aygıtlarının biçimlerini belirlemekte zorlandığı yapılar. RoseTTAFold binlerce üyesi bulunan bu zengin protein ailesinin kapsamlı bir çözümlemesini yapabildigini göstererek yapısal biyoloji alanına büyük katkıda bulundu. Bir örnek vermek gerekirse, bu almaç protein ailesinin bir üyesi beynin hipotalamus bölgesinde yer alan MC4R (melanokortin 4 almaç proteini) adlı GPCR proteinidir. MC4R üzerindeki değişinimler (mutasyonlar) insan metabolizmasının düzenlenmesinde ve erken yaşta aşırı şişmanlık sorunu yaşayan kişilerin iştahlarını denetim altında tutamamalarının temel nedeni olarak saptanmış durumda. MC4R’nin katlanmasının açıklığa kavuşturulması bu kalıtımsal bozukluğun giderilmesinde büyük etki yaratabilir.

RoseTTAFold aynı zamanda bu örnekteki gibi proteinlerin birbirleriyle bağlanma/kenetlenme devinimlerini de çözümleyebileceğini gösterdi. Bu yeti, proteinleri tek başına yalıtılmış durumda çözümleyen AlphaFOLD yazılımının çok üstünde bir beceri. RoseTTAFold araştırmacıları, geliştirdikleri yapay zeka yazılımının diğer araştırma takımlarına örnek oluşturarak başka protein ailelerine de uyarlanabileceğini ummaktalar.

Doygunluk hissinin beyinde algılanmasında kilit işlev üstlenen MC4R almaç proteininin üzerindeki değişinimlerin (mutasyonlar) sadeleştirilmiş iki boyutlu gösterimi. Proteinin hücre zarına gömülü bölümü kesintili çizgilerle gösterilmekte. Bazı değişinimler tam islev kaybına yol açarken (kırmızı) bazıları yarım işlev yitimine neden olmakta (sarı). Bazı değişinimler ise proteinin işlevinde etki yaratmıyor (yeşil). MC4R almaç proteininin G-proteini ile kenetli durumdayken elektron mikroskobuyla belirlenmiş biçimi (sağ üstte). MC4R proteininin AlphaFOLD ile çözümlenmiş tekil yapısı (sağ altta). RoseTTAFold MC4R gibi diğer proteinlere kenetlenebilen proteinlerin yapılarını başarıyla çözümleyebilmekte.

Marcello Malpighi’nin yüzyıllar önceki öngörüsü

İtalyan doğa bilimci Marcello Malpighi (1628-1694) mikroskop kullanımını tıbba kazandıran ilk kişilerdendir. Malpighi, karşılaştırmalı fizyoloji biliminin kurucusu sayılır. Özellikle gelişen civciv dölütlerini (embryo) incelerken kan dolaşım düzeneği üzerinde ayrıntılı gözlemler yaptı. Kurbağa akciğerlerinin mikrokobik yapısı onu çok etkiledi. “İç Yapılar Üzerine” (De Viscerum Structura) başlıklı 1666 yılı basımı eserinde “Doğanın işleyişi o kadar üretkendir ki, şu anda bilinmeyen ve aklımızın bile alamayacağı iç yapılar ve makineler eninde sonunda bulunacaktır” diyerek canlılığı sağlayan bileşiklerin tıpkı ‘aletler ve makinalar’ gibi işleyen yapılar olabileceğine dair bir varsayımda bulunur. Gerçekten de yüzyıllar sonra yapısal biyologların yapay zeka ile desteklenen bulguları Malpighi'nin yakıştırmasını doğruluyor.

Kaynaklar:

RoseTTAFOLD’un Science’da yayınlanan bilimsel makalesi:

Accurate prediction of protein structures and interactions using a three-track neural network. Science (2021).

https://science.sciencemag.org/content/early/2021/07/19/science.abj8754

AlphaFOLD’un Nature’da yayınlanan bilimsel makalesi:

Jumper, J et al. Highly accurate protein structure prediction with AlphaFold. Nature (2021).

https://www.nature.com/articles/s41586-021-03819-2

AlphaFOLD’un ürettiği katlanmış protein veri tabanı:

https://alphafold.ebi.ac.uk/

İnsan MC4R proteininin AlphaFOLD bilgisayar çözümlemesi

https://alphafold.ebi.ac.uk/entry/P32245

İnsan MC4R proteininin deneysel olarak belirlenmiş kenetli yapısı:

https://www.rcsb.org/3d-view/7AUE/1

MC4R genine özel çevrimiçi sitesi

https://www.mc4r.org.uk/

soL / 13.08.21