کمک به دانشمندان برای اجرای تجزیه و تحلیل داده های پیچیده بدون نوشتن کد | اخبار MIT

از آنجا که هزینه های فن آوری های تشخیصی و توالی در سالهای اخیر کاهش یافته است ، محققان مقدار بی سابقه ای از داده های مربوط به بیماری و زیست شناسی را جمع آوری کرده اند. متأسفانه ، دانشمندانی که امیدوارند از داده ها به درمان های جدید بروند ، اغلب نیاز به کمک شخصی با تجربه در مهندسی نرم افزار دارند.
اکنون ، آبخیزداری بیوگرافی به دانشمندان و بیوانفورماتیک ها کمک می کند تا آزمایشاتی را انجام دهند و با سکویی که به کاربران امکان می دهد بدون توجه به مهارت های محاسباتی خود ، مجموعه داده های پیچیده را تجزیه و تحلیل کنند. پلت فرم مبتنی بر ابر الگوهای گردش کار و یک رابط قابل تنظیم را برای کمک به کاربران در کشف و به اشتراک گذاری داده ها از انواع مختلف ، از جمله توالی ژنوم ، رونوشت ، پروتئومیک ، متابولیک ، تصویربرداری با محتوای بالا ، تاشو پروتئین و موارد دیگر فراهم می کند.
Jonathan Wang ’13 ، بنیانگذار و مدیر عامل شرکت ، می گوید: “دانشمندان می خواهند در مورد نرم افزار و بخش های علوم داده در این زمینه بیاموزند ، اما آنها نمی خواهند مهندسین نرم افزار شوند که فقط برای درک داده های خود در حال نوشتن کد هستند.” “با آبخیزداری ، آنها مجبور نیستند.”
آبخیزداری توسط تیم های تحقیقاتی بزرگ و کوچک در سراسر صنعت و دانشگاه برای هدایت کشف و تصمیم گیری مورد استفاده قرار می گیرد. هنگامی که تکنیک های تحلیلی پیشرفته جدید در مجلات علمی شرح داده می شود ، می توان آنها را بلافاصله به عنوان الگوها به پلت فرم آبخیزداری اضافه کرد و ابزارهای برش را در دسترس تر و مشترک تر برای محققان با همه پیشینه ها قرار داد.
وانگ می گوید: “داده های زیست شناسی به صورت تصاعدی در حال رشد است و فن آوری های توالی تولید کننده این داده ها فقط بهتر و ارزان تر می شوند.” “با آمدن از MIT ، این مسئله درست در ویلچر من بود: این یک مشکل فنی سخت است. این یک مشکل معنی دار است زیرا این افراد در حال تلاش برای معالجه بیماری ها هستند. آنها می دانند که این داده ها دارای ارزش هستند ، اما آنها برای استفاده از آن تلاش می کنند. ما می خواهیم به آنها کمک کنیم تا بینش بیشتری را سریعتر باز کنند.”
بدون کشف کد
انتظار داشت که وانگ در MIT در زمینه زیست شناسی مهم باشد ، اما او به سرعت از امکانات راه حل های ساختمانی که برای میلیون ها نفر از افراد مبتلا به علوم کامپیوتر مقیاس پذیر بود ، هیجان زده شد. او در پایان به کسب مدرک لیسانس و کارشناسی ارشد خود از گروه مهندسی برق و علوم کامپیوتر (EEC) درآمد. وانگ همچنین در یک آزمایشگاه زیست شناسی در MIT کارآموزی کرد ، جایی که او تعجب کرد که آزمایش های کند و فشرده کار چقدر بود.
“من تفاوت بین زیست شناسی و علوم کامپیوتر را دیدم ، جایی که شما این محیط های پویا را داشتید [in computer science] وانگ می گوید: “این به شما اجازه می دهد تا بلافاصله بازخورد دریافت کنید.”
وانگ در حالی که روی یادگیری ماشین و محاسبات با کارایی بالا در MIT کار می کرد ، با برخی از همکلاسی ها یک شرکت تجاری با فرکانس بالا را تأسیس کرد. تیم وی محققان را با پیشینه دکترا در مناطقی مانند ریاضی و فیزیک استخدام کرد تا استراتژی های جدید تجارت را تدوین کند ، اما آنها به سرعت در روند کار خود یک تنگنا را دیدند.
وانگ می گوید: “همه چیز به آرامی در حال حرکت بود زیرا محققان برای ساخت نمونه های اولیه استفاده می شدند.” وی گفت: “اینها تقریب های کوچکی از مدل هایی بودند که می توانستند به صورت محلی روی ماشین های خود کار کنند. برای قرار دادن این رویکردها ، آنها به مهندسان نیاز داشتند تا آنها را به روش بالایی بر روی یک خوشه محاسباتی کار کنند. اما مهندسان ماهیت تحقیق را درک نکردند ، بنابراین عقب و جلو وجود داشت. این به معنای ایده هایی است که فکر می کنید می توانستید در یک روز به طول انجامید.”
برای حل این مشکل ، تیم وانگ یک لایه نرم افزاری ایجاد کرد که باعث ساخت مدل های آماده سازی ساخت و ساز به آسانی به عنوان ساخت نمونه های اولیه در لپ تاپ شد. سپس ، چند سال پس از فارغ التحصیلی MIT ، وانگ متوجه شد فناوری هایی مانند توالی DNA ارزان و همه گیر شده است.
وانگ به یاد می آورد: “تنگنا دیگر توالی نبود ، بنابراین مردم گفتند ،” بیایید همه چیز را ترتیب دهیم. ” “عامل محدود کننده محاسبه شد. مردم نمی دانستند با تمام داده های تولید شده چه کاری باید انجام دهند. زیست شناسان منتظر دانشمندان داده و بیوانفورماتیک بودند تا به آنها کمک کنند ، اما این افراد همیشه زیست شناسی را در سطح کافی درک نمی کردند.”
اوضاع برای وانگ آشنا به نظر می رسید.
وانگ می گوید: “این دقیقاً مانند چیزی بود که ما در امور مالی دیدیم ، جایی که محققان در تلاش بودند با مهندسین همکاری کنند ، اما مهندسان هرگز کاملاً درک نکردند ، و شما این همه ناکارآمدی را با افرادی که منتظر مهندسین بودند ، داشتید.” “در همین حال ، من یاد گرفتم که زیست شناسان گرسنه هستند تا این آزمایشات را اجرا کنند ، اما چنین شکاف بزرگی وجود دارد که احساس می کردند باید مهندس نرم افزار شوند یا فقط روی علم تمرکز کنند.”
وانگ رسماً در سال 2019 با پزشک مارک کالینیچ ’13 ، یک همکلاسی سابق در MIT که دیگر درگیر عملیات روزانه این شرکت نیست ، به طور رسمی آبخیزداری را تأسیس کرد.
وانگ از آن زمان از بیوتکنولوژی و مدیران دارویی در مورد پیچیدگی رو به رشد تحقیقات زیست شناسی شنیده است. باز کردن بینش های جدید به طور فزاینده ای شامل تجزیه و تحلیل داده های کل ژنوم ، مطالعات جمعیت ، توالی RNA ، طیف سنجی جرمی و موارد دیگر است. توسعه درمانهای شخصی یا انتخاب جمعیت بیمار برای یک مطالعه بالینی نیز می تواند به مجموعه داده های عظیمی نیاز داشته باشد ، و روش های جدیدی برای تجزیه و تحلیل داده ها در مجلات علمی همیشه وجود دارد.
امروز ، شرکت ها می توانند بدون نیاز به راه اندازی سرورهای خود یا حساب های محاسباتی ابری ، تجزیه و تحلیل های گسترده ای را در آبخیزداری انجام دهند. محققان می توانند از الگوهای آماده استفاده کنند که با همه رایج ترین انواع داده ها برای تسریع کار خود کار می کنند. ابزارهای محبوب مبتنی بر هوش مصنوعی مانند Alphafold و Geneformer نیز در دسترس هستند ، و پلت فرم WaterShed باعث می شود که به اشتراک گذاری گردش کار و حفر عمیق تر در نتایج آسان شود.
وانگ می گوید: “این سکو به یک نقطه شیرین از قابلیت استفاده و قابل تنظیم برای افراد با همه زمینه ها برخورد می کند.” “هیچ علمی به طور واقعی یکسان نیست. من از کلمه محصول خودداری می کنم زیرا این بدان معنی است که شما چیزی را مستقر می کنید و سپس شما آن را برای همیشه در مقیاس اجرا می کنید. تحقیقات مانند این نیست.
زیست شناسی تسریع
وانگ معتقد است که آبخیزداری به زیست شناسان کمک می کند تا از آخرین پیشرفت های زیست شناسی و تسریع در کشف علمی در این روند استفاده کنند.
وانگ می گوید: “اگر می توانید به دانشمندان کمک کنید تا کمی سریعتر بینش را باز کنند ، اما 10 یا 20 برابر سریعتر ، واقعاً می تواند تغییر کند.”
حوضه آبخیزداری توسط محققان در آکادمی و در شرکتهای مختلف مورد استفاده قرار می گیرد. مدیران شرکتهای بیوتکنولوژی و داروسازی نیز از آبخیزداری برای تصمیم گیری در مورد آزمایشات جدید و نامزدهای مواد مخدر استفاده می کنند.
وانگ می گوید: “ما در همه این زمینه ها موفقیت شاهد بوده ایم و موضوع مشترک این است که افراد در حال درک تحقیقات اما متخصص در علوم کامپیوتر یا مهندسی نرم افزار نیستند.” “دیدن این صنعت بسیار هیجان انگیز است. برای من ، این بسیار خوب است که از MIT و اکنون بازگشت به میدان کندال که در آن آبخیزداری مستقر است. این جایی است که بسیاری از پیشرفت های پیشرفته در حال وقوع است. ما در تلاش هستیم تا نقش خود را انجام دهیم تا آینده زیست شناسی را فعال کنیم.”