کار آفرینی و استارتاپ

آوردن ابزارهای طراحی پروتئین مبتنی بر هوش مصنوعی برای زیست شناسان در همه جا



هوش مصنوعی در حال حاضر ثابت کرده است که می تواند توسعه دارو را تسریع کند و درک ما از بیماری را بهبود بخشد. اما برای تبدیل هوش مصنوعی به درمان‌های جدید، باید جدیدترین و قدرتمندترین مدل‌ها را در اختیار دانشمندان قرار دهیم.

مشکل این است که بیشتر دانشمندان متخصص یادگیری ماشینی نیستند. اکنون شرکت OpenProtein.AI با یک پلتفرم بدون کد به دانشمندان کمک می کند تا در لبه هوش مصنوعی باقی بمانند که به آنها امکان دسترسی به مدل های پایه قدرتمند و مجموعه ای از ابزارها برای طراحی پروتئین ها، پیش بینی ساختار و عملکرد پروتئین و مدل های آموزشی را می دهد.

این شرکت که توسط Tristan Bepler PhD ’20 و دانشیار سابق MIT Tim Lu PhD ’07 تأسیس شده است، در حال حاضر محققان در شرکت های دارویی و بیوتکنولوژی در همه اندازه ها را با ابزارهای خود، از جمله مدل های پایه توسعه یافته داخلی برای مهندسی پروتئین، مجهز می کند. OpenProtein.AI همچنین پلتفرم خود را به صورت رایگان در اختیار دانشمندان دانشگاهی قرار می دهد.

بپلر می‌گوید: «در حال حاضر زمان بسیار هیجان‌انگیزی است زیرا این مدل‌ها نه تنها می‌توانند مهندسی پروتئین را کارآمدتر کنند – که چرخه‌های توسعه را برای مصارف درمانی و صنعتی کوتاه می‌کند – بلکه می‌توانند توانایی ما را برای طراحی پروتئین‌های جدید با ویژگی‌های خاص افزایش دهند. ما همچنین در مورد اعمال این رویکردها در روش‌های غیر پروتئینی فکر می‌کنیم. تصویر بزرگ این است که ما در حال ایجاد زبانی برای توصیف سیستم‌های بیولوژیکی هستیم.

پیشرفت زیست شناسی با هوش مصنوعی

بپلر در سال 2014 به عنوان بخشی از برنامه دکتری زیست شناسی سیستمی و محاسباتی به MIT آمد و زیر نظر بانی برگر، استاد ریاضیات کاربردی سیمونز MIT تحصیل کرد. آنجا بود که او متوجه شد که ما چقدر در مورد مولکول هایی که اجزای سازنده زیست شناسی را تشکیل می دهند، درک می کنیم.

بپلر یادآوری می‌کند: «ما به اندازه کافی مولکول‌های زیستی و پروتئین‌ها را مشخص نکرده بودیم تا بتوانیم مدل‌های پیش‌بینی‌کننده خوبی از آنچه، مثلاً، یک مدار ژنوم کامل انجام می‌دهد، یا نحوه رفتار یک شبکه تعامل پروتئینی ایجاد کنیم.» “این من را به درک پروتئین ها در سطح دقیق تری علاقه مند کرد.”

Bepler با تجزیه و تحلیل داده های تکاملی شروع به کاوش در راه هایی برای پیش بینی زنجیره های آمینو اسیدهای سازنده پروتئین ها کرد. این قبل از انتشار آلفا فولد، یک مدل قدرتمند برای پیش‌بینی ساختار پروتئین توسط گوگل بود. این کار منجر به یکی از اولین مدل‌های هوش مصنوعی مولد برای درک و طراحی پروتئین‌ها شد – چیزی که تیم آن را مدل زبان پروتئین می‌نامد.

Bepler می گوید: “من واقعاً در مورد چارچوب کلاسیک پروتئین ها و روابط بین توالی، ساختار و عملکرد آنها هیجان زده بودم. ما این پیوندها را به خوبی درک نمی کنیم.” پس چگونه می‌توانیم از این مدل‌های پایه برای رد شدن از مؤلفه «ساختار» و رفتن مستقیم از دنباله‌ای به عملکرد دیگر استفاده کنیم؟»

بپلر پس از اخذ دکترای خود در سال 2020، به عنوان فوق دکترا وارد آزمایشگاه لو در بخش مهندسی بیولوژیک MIT شد.

لو به یاد می آورد: «این تقریباً زمانی بود که ایده ادغام هوش مصنوعی با زیست شناسی شروع شد. “Tristan به ما کمک کرد تا مدل‌های محاسباتی بهتری برای طراحی بیولوژیکی بسازیم. ما همچنین متوجه شدیم که بین پیشرفته‌ترین ابزارهای موجود و زیست‌شناسانی که دوست دارند از این چیزها استفاده کنند اما نحوه کدنویسی را نمی‌دانند، یک گسست وجود دارد. OpenProtein از ایده گسترش دسترسی به این ابزارها ناشی شده است.”

بپلر به عنوان بخشی از دکترای خود در خط مقدم هوش مصنوعی کار کرده بود. او می دانست که این فناوری می تواند به دانشمندان کمک کند تا کار خود را تسریع کنند.

Bepler می‌گوید: «ما با ایده ساختن یک پلتفرم همه منظوره برای انجام مهندسی پروتئین یادگیری ماشینی در حلقه شروع کردیم. ما می‌خواستیم چیزی بسازیم که کاربر پسند باشد، زیرا ایده‌های یادگیری ماشینی نوعی باطنی هستند. آنها به پیاده‌سازی، GPU، تنظیم دقیق، طراحی کتابخانه‌های توالی نیاز دارند. به خصوص در آن زمان، یادگیری برای زیست‌شناسان بسیار بود.»

در مقابل، پلت فرم OpenProtein دارای یک رابط وب بصری برای زیست شناسان است تا داده ها را آپلود کنند و کار مهندسی پروتئین را با یادگیری ماشین انجام دهند. دارای طیف وسیعی از مدل‌های منبع باز، از جمله PoET، مدل زبان پروتئینی پرچم‌دار OpenProtein است.

PoET، مخفف Protein Evolutionary Transformer، بر روی گروه های پروتئینی برای تولید مجموعه ای از پروتئین های مرتبط آموزش دیده بود. Bepler و همکارانش نشان دادند که می‌تواند محدودیت‌های تکاملی روی پروتئین‌ها را تعمیم دهد و اطلاعات جدیدی را در مورد توالی‌های پروتئینی بدون آموزش مجدد بگنجاند و به دیگر محققان اجازه دهد داده‌های تجربی را برای بهبود مدل اضافه کنند.

Bepler می‌گوید: «محققان می‌توانند از داده‌های خود برای آموزش مدل‌ها و بهینه‌سازی توالی پروتئین‌ها استفاده کنند و سپس می‌توانند از ابزارهای دیگر ما برای تجزیه و تحلیل آن پروتئین‌ها استفاده کنند». مردم در حال تولید کتابخانه هایی از توالی پروتئین در سیلیکو هستند [on computers] و سپس آنها را از طریق مدل های پیش بینی اجرا کنید تا اعتبار و پیش بینی های ساختاری را بدست آورید. این اساساً یک فرانت‌اند بدون کد است، اما ما همچنین برای افرادی که می‌خواهند با کد به آن دسترسی داشته باشند، API داریم.

این مدل‌ها به محققان کمک می‌کنند پروتئین‌ها را سریع‌تر طراحی کنند، سپس تصمیم بگیرند که کدام یک به اندازه کافی برای آزمایش‌های آزمایشگاهی امیدوارکننده هستند. محققان همچنین می‌توانند پروتئین‌های مورد علاقه را وارد کنند و مدل‌ها می‌توانند پروتئین‌های جدیدی با خواص مشابه تولید کنند.

از زمان تأسیس، تیم OpenProtein به افزودن ابزارهایی به پلتفرم خود برای محققان بدون توجه به اندازه آزمایشگاه یا منابع آنها ادامه داده است.

Bepler می‌گوید: «ما بسیار تلاش کرده‌ایم تا پلتفرم را به یک جعبه ابزار با پایان باز تبدیل کنیم. این مدل گردش کار خاصی دارد، اما به طور خاص به یک عملکرد پروتئینی یا دسته ای از پروتئین ها مرتبط نیست. یکی از چیزهای مهم در مورد این مدل ها این است که آنها در درک گسترده پروتئین ها بسیار خوب هستند. آنها در مورد کل فضای پروتئین های ممکن می آموزند.

توانمندسازی نسل بعدی درمان ها

شرکت بزرگ داروسازی Boehringer Ingelheim استفاده از پلتفرم OpenProtein را در اوایل سال 2025 آغاز کرد. اخیراً، این شرکت‌ها همکاری گسترده‌ای را اعلام کردند که پلتفرم و مدل‌های OpenProtein را در کار Boehringer Ingelheim تعبیه می‌کند، زیرا پروتئین‌هایی را برای درمان بیماری‌هایی مانند سرطان و بیماری‌های خودایمنی یا التهابی مهندسی می‌کند.

سال گذشته، OpenProtein نسخه جدیدی از مدل زبان پروتئینی خود به نام PoET-2 را نیز منتشر کرد که در عین استفاده از بخش کوچکی از منابع محاسباتی و داده های تجربی، از مدل های بسیار بزرگتر بهتر عمل می کند.

Bepler می گوید: «ما واقعاً می خواهیم این سؤال را حل کنیم که چگونه پروتئین ها را توصیف می کنیم. “زبان معنی دار و دامنه خاص محدودیت های پروتئینی که هنگام تولید آنها استفاده می کنیم چیست؟ چگونه می توانیم محدودیت های تکاملی بیشتری وارد کنیم؟ چگونه می‌توانیم یک واکنش آنزیمی را که یک پروتئین انجام می‌دهد توصیف کنیم تا یک مدل بتواند توالی‌هایی را برای انجام آن واکنش تولید کند؟»

حرکت رو به جلو، بنیانگذاران امیدوارند مدل هایی بسازند که در تغییر ماهیت بهم پیوسته عملکرد پروتئین نقش داشته باشد.

لو، که در حال حاضر در نقش مشاوره ای برای شرکت خدمت می کند، می گوید: “منطقه ای که من در مورد آن هیجان زده هستم فراتر از رویدادهای اتصال پروتئین است تا از این مدل ها برای پیش بینی و طراحی ویژگی های پویا استفاده کنم، جایی که پروتئین باید همزمان با دو، سه یا چهار مکانیسم بیولوژیکی درگیر شود یا عملکرد خود را پس از اتصال تغییر دهد.”

با پیشرفت در زمینه هوش مصنوعی، OpenProtein همچنان ماموریت خود را ارائه بهترین ابزارها برای توسعه سریعتر درمان های جدید به دانشمندان می داند.

لو می‌گوید: «با پیچیده‌تر شدن کار، با رویکردهایی مانند منطق پروتئین و درمان‌های پویا، مجموعه ابزارهای تجربی موجود محدود می‌شوند. ایجاد اکوسیستم‌های باز پیرامون هوش مصنوعی و زیست‌شناسی بسیار مهم است. این خطر وجود دارد که منابع هوش مصنوعی آنقدر متمرکز شوند که محقق معمولی نتواند از آنها استفاده کند. دسترسی آزاد برای پیشرفت در زمینه علمی بسیار مهم است.



منبع

دیدگاهتان را بنویسید

دکمه بازگشت به بالا