آوردن ابزارهای طراحی پروتئین مبتنی بر هوش مصنوعی برای زیست شناسان در همه جا

هوش مصنوعی در حال حاضر ثابت کرده است که می تواند توسعه دارو را تسریع کند و درک ما از بیماری را بهبود بخشد. اما برای تبدیل هوش مصنوعی به درمانهای جدید، باید جدیدترین و قدرتمندترین مدلها را در اختیار دانشمندان قرار دهیم.
مشکل این است که بیشتر دانشمندان متخصص یادگیری ماشینی نیستند. اکنون شرکت OpenProtein.AI با یک پلتفرم بدون کد به دانشمندان کمک می کند تا در لبه هوش مصنوعی باقی بمانند که به آنها امکان دسترسی به مدل های پایه قدرتمند و مجموعه ای از ابزارها برای طراحی پروتئین ها، پیش بینی ساختار و عملکرد پروتئین و مدل های آموزشی را می دهد.
این شرکت که توسط Tristan Bepler PhD ’20 و دانشیار سابق MIT Tim Lu PhD ’07 تأسیس شده است، در حال حاضر محققان در شرکت های دارویی و بیوتکنولوژی در همه اندازه ها را با ابزارهای خود، از جمله مدل های پایه توسعه یافته داخلی برای مهندسی پروتئین، مجهز می کند. OpenProtein.AI همچنین پلتفرم خود را به صورت رایگان در اختیار دانشمندان دانشگاهی قرار می دهد.
بپلر میگوید: «در حال حاضر زمان بسیار هیجانانگیزی است زیرا این مدلها نه تنها میتوانند مهندسی پروتئین را کارآمدتر کنند – که چرخههای توسعه را برای مصارف درمانی و صنعتی کوتاه میکند – بلکه میتوانند توانایی ما را برای طراحی پروتئینهای جدید با ویژگیهای خاص افزایش دهند. ما همچنین در مورد اعمال این رویکردها در روشهای غیر پروتئینی فکر میکنیم. تصویر بزرگ این است که ما در حال ایجاد زبانی برای توصیف سیستمهای بیولوژیکی هستیم.
پیشرفت زیست شناسی با هوش مصنوعی
بپلر در سال 2014 به عنوان بخشی از برنامه دکتری زیست شناسی سیستمی و محاسباتی به MIT آمد و زیر نظر بانی برگر، استاد ریاضیات کاربردی سیمونز MIT تحصیل کرد. آنجا بود که او متوجه شد که ما چقدر در مورد مولکول هایی که اجزای سازنده زیست شناسی را تشکیل می دهند، درک می کنیم.
بپلر یادآوری میکند: «ما به اندازه کافی مولکولهای زیستی و پروتئینها را مشخص نکرده بودیم تا بتوانیم مدلهای پیشبینیکننده خوبی از آنچه، مثلاً، یک مدار ژنوم کامل انجام میدهد، یا نحوه رفتار یک شبکه تعامل پروتئینی ایجاد کنیم.» “این من را به درک پروتئین ها در سطح دقیق تری علاقه مند کرد.”
Bepler با تجزیه و تحلیل داده های تکاملی شروع به کاوش در راه هایی برای پیش بینی زنجیره های آمینو اسیدهای سازنده پروتئین ها کرد. این قبل از انتشار آلفا فولد، یک مدل قدرتمند برای پیشبینی ساختار پروتئین توسط گوگل بود. این کار منجر به یکی از اولین مدلهای هوش مصنوعی مولد برای درک و طراحی پروتئینها شد – چیزی که تیم آن را مدل زبان پروتئین مینامد.
Bepler می گوید: “من واقعاً در مورد چارچوب کلاسیک پروتئین ها و روابط بین توالی، ساختار و عملکرد آنها هیجان زده بودم. ما این پیوندها را به خوبی درک نمی کنیم.” پس چگونه میتوانیم از این مدلهای پایه برای رد شدن از مؤلفه «ساختار» و رفتن مستقیم از دنبالهای به عملکرد دیگر استفاده کنیم؟»
بپلر پس از اخذ دکترای خود در سال 2020، به عنوان فوق دکترا وارد آزمایشگاه لو در بخش مهندسی بیولوژیک MIT شد.
لو به یاد می آورد: «این تقریباً زمانی بود که ایده ادغام هوش مصنوعی با زیست شناسی شروع شد. “Tristan به ما کمک کرد تا مدلهای محاسباتی بهتری برای طراحی بیولوژیکی بسازیم. ما همچنین متوجه شدیم که بین پیشرفتهترین ابزارهای موجود و زیستشناسانی که دوست دارند از این چیزها استفاده کنند اما نحوه کدنویسی را نمیدانند، یک گسست وجود دارد. OpenProtein از ایده گسترش دسترسی به این ابزارها ناشی شده است.”
بپلر به عنوان بخشی از دکترای خود در خط مقدم هوش مصنوعی کار کرده بود. او می دانست که این فناوری می تواند به دانشمندان کمک کند تا کار خود را تسریع کنند.
Bepler میگوید: «ما با ایده ساختن یک پلتفرم همه منظوره برای انجام مهندسی پروتئین یادگیری ماشینی در حلقه شروع کردیم. ما میخواستیم چیزی بسازیم که کاربر پسند باشد، زیرا ایدههای یادگیری ماشینی نوعی باطنی هستند. آنها به پیادهسازی، GPU، تنظیم دقیق، طراحی کتابخانههای توالی نیاز دارند. به خصوص در آن زمان، یادگیری برای زیستشناسان بسیار بود.»
در مقابل، پلت فرم OpenProtein دارای یک رابط وب بصری برای زیست شناسان است تا داده ها را آپلود کنند و کار مهندسی پروتئین را با یادگیری ماشین انجام دهند. دارای طیف وسیعی از مدلهای منبع باز، از جمله PoET، مدل زبان پروتئینی پرچمدار OpenProtein است.
PoET، مخفف Protein Evolutionary Transformer، بر روی گروه های پروتئینی برای تولید مجموعه ای از پروتئین های مرتبط آموزش دیده بود. Bepler و همکارانش نشان دادند که میتواند محدودیتهای تکاملی روی پروتئینها را تعمیم دهد و اطلاعات جدیدی را در مورد توالیهای پروتئینی بدون آموزش مجدد بگنجاند و به دیگر محققان اجازه دهد دادههای تجربی را برای بهبود مدل اضافه کنند.
Bepler میگوید: «محققان میتوانند از دادههای خود برای آموزش مدلها و بهینهسازی توالی پروتئینها استفاده کنند و سپس میتوانند از ابزارهای دیگر ما برای تجزیه و تحلیل آن پروتئینها استفاده کنند». مردم در حال تولید کتابخانه هایی از توالی پروتئین در سیلیکو هستند [on computers] و سپس آنها را از طریق مدل های پیش بینی اجرا کنید تا اعتبار و پیش بینی های ساختاری را بدست آورید. این اساساً یک فرانتاند بدون کد است، اما ما همچنین برای افرادی که میخواهند با کد به آن دسترسی داشته باشند، API داریم.
این مدلها به محققان کمک میکنند پروتئینها را سریعتر طراحی کنند، سپس تصمیم بگیرند که کدام یک به اندازه کافی برای آزمایشهای آزمایشگاهی امیدوارکننده هستند. محققان همچنین میتوانند پروتئینهای مورد علاقه را وارد کنند و مدلها میتوانند پروتئینهای جدیدی با خواص مشابه تولید کنند.
از زمان تأسیس، تیم OpenProtein به افزودن ابزارهایی به پلتفرم خود برای محققان بدون توجه به اندازه آزمایشگاه یا منابع آنها ادامه داده است.
Bepler میگوید: «ما بسیار تلاش کردهایم تا پلتفرم را به یک جعبه ابزار با پایان باز تبدیل کنیم. این مدل گردش کار خاصی دارد، اما به طور خاص به یک عملکرد پروتئینی یا دسته ای از پروتئین ها مرتبط نیست. یکی از چیزهای مهم در مورد این مدل ها این است که آنها در درک گسترده پروتئین ها بسیار خوب هستند. آنها در مورد کل فضای پروتئین های ممکن می آموزند.
توانمندسازی نسل بعدی درمان ها
شرکت بزرگ داروسازی Boehringer Ingelheim استفاده از پلتفرم OpenProtein را در اوایل سال 2025 آغاز کرد. اخیراً، این شرکتها همکاری گستردهای را اعلام کردند که پلتفرم و مدلهای OpenProtein را در کار Boehringer Ingelheim تعبیه میکند، زیرا پروتئینهایی را برای درمان بیماریهایی مانند سرطان و بیماریهای خودایمنی یا التهابی مهندسی میکند.
سال گذشته، OpenProtein نسخه جدیدی از مدل زبان پروتئینی خود به نام PoET-2 را نیز منتشر کرد که در عین استفاده از بخش کوچکی از منابع محاسباتی و داده های تجربی، از مدل های بسیار بزرگتر بهتر عمل می کند.
Bepler می گوید: «ما واقعاً می خواهیم این سؤال را حل کنیم که چگونه پروتئین ها را توصیف می کنیم. “زبان معنی دار و دامنه خاص محدودیت های پروتئینی که هنگام تولید آنها استفاده می کنیم چیست؟ چگونه می توانیم محدودیت های تکاملی بیشتری وارد کنیم؟ چگونه میتوانیم یک واکنش آنزیمی را که یک پروتئین انجام میدهد توصیف کنیم تا یک مدل بتواند توالیهایی را برای انجام آن واکنش تولید کند؟»
حرکت رو به جلو، بنیانگذاران امیدوارند مدل هایی بسازند که در تغییر ماهیت بهم پیوسته عملکرد پروتئین نقش داشته باشد.
لو، که در حال حاضر در نقش مشاوره ای برای شرکت خدمت می کند، می گوید: “منطقه ای که من در مورد آن هیجان زده هستم فراتر از رویدادهای اتصال پروتئین است تا از این مدل ها برای پیش بینی و طراحی ویژگی های پویا استفاده کنم، جایی که پروتئین باید همزمان با دو، سه یا چهار مکانیسم بیولوژیکی درگیر شود یا عملکرد خود را پس از اتصال تغییر دهد.”
با پیشرفت در زمینه هوش مصنوعی، OpenProtein همچنان ماموریت خود را ارائه بهترین ابزارها برای توسعه سریعتر درمان های جدید به دانشمندان می داند.
لو میگوید: «با پیچیدهتر شدن کار، با رویکردهایی مانند منطق پروتئین و درمانهای پویا، مجموعه ابزارهای تجربی موجود محدود میشوند. ایجاد اکوسیستمهای باز پیرامون هوش مصنوعی و زیستشناسی بسیار مهم است. این خطر وجود دارد که منابع هوش مصنوعی آنقدر متمرکز شوند که محقق معمولی نتواند از آنها استفاده کند. دسترسی آزاد برای پیشرفت در زمینه علمی بسیار مهم است.

