تسریع در کشف علمی با AI | اخبار MIT

چندین محقق طی 50 سال گذشته دیدگاه گسترده ای از پیشرفت علمی داشته و به همان نتیجه گیری نگران کننده رسیده اند: بهره وری علمی رو به کاهش است. این زمان بیشتر ، بودجه بیشتر و تیم های بزرگتر را برای کشف اکتشافاتی که یک بار سریعتر و ارزان تر می شدند ، می گیرد. اگرچه توضیحات مختلفی برای کاهش سرعت ارائه شده است ، یکی این است که ، با توجه به اینکه تحقیقات پیچیده تر و تخصصی تر می شود ، دانشمندان باید زمان بیشتری را برای بررسی نشریات ، طراحی آزمایش های پیشرفته و تجزیه و تحلیل داده ها صرف کنند.
اکنون ، آزمایشگاه تحقیقاتی با بودجه بشردوستانه FutureHouse به دنبال تسریع در تحقیقات علمی با یک پلت فرم هوش مصنوعی است که برای اتوماسیون بسیاری از مراحل مهم در مسیر پیشرفت علمی طراحی شده است. این پلتفرم از یک سری از عوامل هوش مصنوعی تخصصی برای وظایف از جمله بازیابی اطلاعات ، سنتز اطلاعات ، طراحی سنتز شیمیایی و تجزیه و تحلیل داده ها تشکیل شده است.
بنیانگذاران FutureHouse سام Rodriques PhD ’19 و اندرو وایت بر این باورند که با دسترسی به هر دانشمند به مأمورین هوش مصنوعی خود ، می توانند بزرگترین تنگناهای علم را از بین ببرند و به حل برخی از مشکلات مهم بشریت کمک کنند.
رودریکس می گوید: “زبان طبیعی زبان واقعی علم است.” “افراد دیگر در حال ساخت مدل های پایه ای برای زیست شناسی هستند ، جایی که مدل های یادگیری ماشین به زبان DNA یا پروتئین ها صحبت می کنند ، و این قدرتمند است.
پیدا کردن مشکلات بزرگ
برای تحقیقات دکتری خود در MIT ، رودریکس به دنبال درک عملکرد درونی مغز در آزمایشگاه پروفسور اد بویدن بود.
رودریك توضیح می دهد: “تمام ایده پشت آینده خانه از این تصور كه در طول دکتری خود در MIT به دست آوردم الهام گرفته است كه حتی اگر تمام اطلاعاتی را كه باید در مورد چگونگی عملکرد مغز بدانیم ، می دانستیم ، ما آن را نمی دانیم زیرا هیچ كس وقت ندارد كه تمام ادبیات را بخواند.” “حتی اگر آنها بتوانند این همه را بخوانند ، آنها نمی توانند آن را در یک تئوری جامع جمع کنند. این یک قطعه اساسی از معمای آینده بود.”
رودریکس در مورد نیاز به انواع جدید همکاری های تحقیقاتی بزرگ به عنوان آخرین فصل پایان نامه دکتری خود در سال 2019 نوشت ، و گرچه او مدتی را در موسسه آزمایشگاه در لندن در لندن پس از فارغ التحصیلی گذراند ، اما خود را به سمت مشکلات گسترده ای در علم که هیچ آزمایشگاهی واحد نمی تواند انجام دهد ، گرفت.
رودریكس می گوید: “من علاقه مند به نحوه اتوماسیون یا مقیاس علمی هستم و چه نوع ساختارها یا فناوری های سازمانی جدید می توانند بهره وری علمی بالاتری را باز كنند.”
هنگامی که Chat-GPT 3.5 در نوامبر 2022 منتشر شد ، رودریکس مسیری را به سمت مدلهای قدرتمندتر دید که می تواند بینش علمی به تنهایی ایجاد کند. در همین زمان ، او همچنین با اندرو وایت ، شیمیدان محاسباتی در دانشگاه روچستر ملاقات کرد که دسترسی زودهنگام به چت-GPT 4 را به دست آورد. وایت اولین عامل بزرگ زبان را برای علوم ساخته بود و محققان برای شروع Futurehouse به نیروهای پیوستند.
بنیانگذاران شروع به ایجاد ابزارهای هوش مصنوعی متمایز برای کارهایی مانند جستجوی ادبیات ، تجزیه و تحلیل داده ها و تولید فرضیه کردند. آنها با جمع آوری داده ها شروع به کار کردند و سرانجام PaperQA را در سپتامبر 2024 منتشر کردند ، که رودریکس برای بازیابی و خلاصه کردن اطلاعات در ادبیات علمی ، بهترین عامل هوش مصنوعی جهان را می نامد. در همین زمان ، آنها هر کسی را منتشر کردند ، ابزاری که به دانشمندان اجازه می دهد تعیین کنند که آیا کسی آزمایش های خاصی را انجام داده است یا فرضیه های خاص را بررسی کرده است.
رودریكس به یاد می آورد: “ما فقط در اطراف نشسته بودیم كه می پرسیدیم ،” انواع سؤالاتی كه ما به عنوان دانشمندان همیشه می پرسیم چیست؟ “
هنگامی که FutureHouse به طور رسمی سکوی خود را در اول ماه مه سال جاری راه اندازی کرد ، برخی از ابزارهای خود را دوباره معرفی کرد. کاغذ QA اکنون کلاغ است ، و آیا اکنون کسی به آن Owl گفته می شود. Falcon یک عامل است که قادر به تهیه و بررسی منابع بیشتر از Crow است. یکی دیگر از عوامل جدید ، ققنوس ، می تواند از ابزارهای تخصصی برای کمک به محققان در برنامه های شیمی استفاده کند. و Finch یک عامل طراحی شده برای خودکار سازی کشف داده های محور در زیست شناسی است.
در تاریخ 20 ماه مه ، این شرکت یک گردش کار علمی چند عامل را برای خودکار سازی مراحل کلیدی فرایند علمی و شناسایی یک کاندیدای درمانی جدید برای دژنراسیون ماکولا مرتبط با سن خشک (DAMD) نشان داد ، که عامل اصلی کوری برگشت ناپذیر در سراسر جهان است. در ماه ژوئن ، FutureHouse Ether0 ، یک مدل استدلال با وزن 24B باز برای شیمی را منتشر کرد.
رودریکس می گوید: “شما واقعاً باید به عنوان بخشی از یک سیستم بزرگتر از این عوامل فکر کنید.” “به زودی ، نمایندگان جستجوی ادبیات با عامل تجزیه و تحلیل داده ها ، عامل تولید فرضیه ، یک عامل برنامه ریزی آزمایش ادغام می شوند و همه آنها مهندسی می شوند تا یکپارچه با هم همکاری کنند.”
نمایندگان برای همه
امروز هر کسی می تواند به نمایندگان آینده خانه در platform.futurehouse.org دسترسی پیدا کند. راه اندازی پلت فرم این شرکت باعث ایجاد هیجان در صنعت شد و داستانها در مورد دانشمندان با استفاده از نمایندگان برای تسریع در تحقیقات آغاز شده است.
یکی از دانشمندان Futurehouse از عوامل برای شناسایی ژن هایی که می تواند با سندرم تخمدان پلی کیستیک همراه باشد و فرضیه درمانی جدیدی برای این بیماری ارائه داد ، استفاده کرد. محقق دیگری در آزمایشگاه ملی لارنس برکلی از کلاغ برای ایجاد یک دستیار هوش مصنوعی قادر به جستجوی پایگاه داده تحقیقاتی PubMed برای اطلاعات مربوط به بیماری آلزایمر استفاده کرد.
دانشمندان در یک موسسه تحقیقاتی دیگر از مأمورین برای انجام بررسی های سیستماتیک ژنهای مرتبط با بیماری پارکینسون استفاده کرده اند ، و پیدا کردن عوامل Futurehouse بهتر از عوامل عمومی است.
رودریک می گوید دانشمندانی که به نمایندگان کمتر مانند Google Scholar فکر می کنند و بیشتر شبیه دستیار دانشمند هوشمند بیشترین استفاده را از این سکو کسب می کنند.
رودریك توضیح می دهد: “افرادی كه به دنبال گمانه زنی ها هستند ، تمایل دارند مسافت پیموده شده بیشتری را از تحقیقات عمیق چت GPT O3 بدست آورند ، در حالی كه افرادی كه به دنبال بررسی ادبیات واقعاً وفادار هستند ، تمایل دارند كه بیشتر از عوامل ما خارج شوند.”
Rodriques همچنین فکر می کند FutureHouse به زودی به جایی خواهد رسید که نمایندگان آن می توانند از داده های خام از مقالات تحقیقاتی برای آزمایش تکرارپذیری نتایج خود استفاده کنند و نتیجه گیری را تأیید کنند.
در طولانی مدت ، برای ادامه پیشرفت علمی ، رودریک می گوید FutureHouse در تلاش است تا عوامل خود را با دانش ضمنی جاسازی کند تا بتواند تجزیه و تحلیل های پیشرفته تری انجام دهد و در عین حال امکان استفاده از ابزارهای محاسباتی را برای کشف فرضیه ها نیز فراهم می کند.
رودریکس می گوید: “پیشرفت های زیادی در مورد مدل های بنیاد برای علم و مدل های زبان برای پروتئین ها و DNA وجود داشته است ، که اکنون باید به نمایندگان خود دسترسی پیدا کنیم به آن مدل ها و سایر ابزارهایی که معمولاً مردم برای انجام علم استفاده می کنند.” “ساختن زیرساخت ها برای اینکه نمایندگان بتوانند از ابزارهای تخصصی تری برای علم استفاده کنند بسیار مهم است.”