استفاده از تصویربرداری عمیق برای وضوح بالاتر | اخبار MIT

اتوماسیون از زمان یونان باستان وجود داشته است. شکل آن تغییر می کند، اما هدف از این که فناوری وظایف تکراری را به عهده بگیرد، ثابت مانده است، و یک عنصر اساسی برای موفقیت، توانایی تصویرسازی بوده است. آخرین تکرار، روباتها هستند، و مشکل اکثر آنها در اتوماسیون صنعتی این است که در محیطهای مبتنی بر وسایل که بهطور خاص برای آنها طراحی شدهاند، کار میکنند. اگر چیزی تغییر نکند خوب است، اما همه چیز به ناچار تغییر می کند. چیزی که روباتها باید توانایی داشته باشند، این است که سریع تطبیق داده شوند، اجسام را دقیقا ببینند و سپس آنها را در جهت صحیح قرار دهند تا عملیاتهایی مانند مونتاژ و بستهبندی مستقل را فعال کنند.
آکاشا ایمیجینگ در حال تلاش برای تغییر آن است. استارتآپ کالیفرنیایی با ریشههای MIT از تصویربرداری غیرفعال، مدالیتهها و طیفهای متنوع همراه با یادگیری عمیق استفاده میکند تا تشخیص، ردیابی و جهتگیری ژست با وضوح بالاتر را به روشی کارآمدتر و مقرونبهصرفهتر ارائه دهد. ربات ها برنامه اصلی و تمرکز فعلی هستند. در آینده، می تواند برای بسته بندی و سیستم های ناوبری باشد. Kartik Venkataraman، مدیر عامل آکاشا، میگوید این موارد ثانویه هستند، اما از آنجایی که انطباق حداقل خواهد بود، از پتانسیل کلی آنچه شرکت در حال توسعه است صحبت میکند. او می گوید: «این بخش هیجان انگیز توانایی این فناوری است.
خارج از آزمایشگاه
ونکاتارامن که در سال 2019 شروع به کار کرد، این شرکت را با استادیار دانشگاه MIT رامش راسکار و Achuta Kadambi PhD ’18 تاسیس کرد. راسکار یکی از اعضای هیئت علمی آزمایشگاه رسانه MIT است، در حالی که کادامبی یک دانشجوی سابق فارغ التحصیل آزمایشگاه رسانه است، که تحقیقات او در حین کار بر روی مدرک دکتری خود پایه و اساس فناوری آکاشا خواهد بود.
شرکا فرصتی را با اتوماسیون صنعتی دیدند که به نوبه خود به نام شرکت کمک کرد. ونکاتارامان میگوید آکاشا به معنای «اساس و جوهر همه چیز در دنیای مادی» است، و این بیمحدودیت است که الهامبخش نوع جدیدی از تصویربرداری و یادگیری عمیق است. این به طور خاص به تخمین جهت گیری و مکان یابی اشیاء مربوط می شود. سیستمهای بینایی سنتی لیدار و لیزر، طولموجهای مختلف نور را بر روی یک سطح پخش میکنند و مدت زمانی را که طول میکشد تا نور به سطح برخورد کند و برگردد تا مکان آن را تعیین کند، تشخیص میدهند.
محدودیت هایی با این روش ها وجود داشته است. هر چه یک سیستم باید بیشتر باشد، قدرت بیشتری برای روشنایی مورد نیاز است. برای وضوح بالاتر، نور تابیده شده بیشتر است. علاوه بر این، دقت سنجش زمان سپری شده به سرعت مدارهای الکترونیکی بستگی دارد و یک محدودیت مبتنی بر فیزیک در این مورد وجود دارد. مدیران شرکت به طور مداوم مجبور به تصمیم گیری در مورد آنچه که بین وضوح، هزینه و قدرت بسیار مهم است، هستند. او می گوید: «این همیشه یک مبادله است.
و نور تابیده شده خود چالش هایی را ایجاد می کند. با اشیاء پلاستیکی یا فلزی براق، نور به عقب باز می گردد و بازتابش در روشنایی و دقت خواندن اختلال ایجاد می کند. با اشیاء شفاف و بسته بندی شفاف، نور از آن عبور می کند و سیستم تصویری از آنچه در پشت هدف مورد نظر است ارائه می دهد. و در مورد اجسام تاریک، انعکاس کمی وجود دارد که تشخیص را دشوار می کند، چه رسد به ارائه جزئیات.
استفاده از آن
یکی از تمرکزهای این شرکت بهبود رباتیک است. همانطور که در انبارها وجود دارد، ربات ها در تولید کمک می کنند، اما مواد چالش های نوری ذکر شده را نشان می دهند. اجسام همچنین می توانند کوچک باشند، به عنوان مثال، یک فنر به طول 5-6 میلی متر باید برداشته شود و در شفتی به عرض 2 میلی متر رزوه شود. اپراتورهای انسانی می توانند نادرستی ها را جبران کنند زیرا می توانند اشیا را لمس کنند، اما از آنجایی که روبات ها فاقد بازخورد لمسی هستند، دید آنها باید دقیق باشد. اگر اینطور نیست، هر انحراف جزئی می تواند منجر به انسداد شود که در آن فرد باید مداخله کند. او میگوید بهعلاوه، اگر بیش از 90 درصد مواقع سیستم تصویربرداری قابل اعتماد و دقیق نباشد، یک شرکت بیشتر از اینکه حل کند و پولش را از دست بدهد، مشکلاتی ایجاد میکند.
پتانسیل دیگر بهبود سیستم های ناوبری خودرو است. لیدار، یک فناوری فعلی، میتواند تشخیص دهد که یک شی در جاده وجود دارد، اما لزوما نمیتواند تشخیص دهد که شی چیست، و ونکاتارامن میگوید که این اطلاعات اغلب مفید و «در برخی موارد حیاتی» هستند.
در هر دو حوزه، فناوری آکاشا بیشتر فراهم می کند. در یک جاده یا بزرگراه، سیستم می تواند بافت یک ماده را تشخیص دهد و بتواند تشخیص دهد که آیا چیزی که در راه است چاله، حیوان یا مانع کار در جاده است. در محیط بدون ساختار یک کارخانه یا انبار، می تواند به یک ربات کمک کند تا آن فنر را بردارد و در شفت قرار دهد یا بتواند اشیا را از یک ظرف شفاف به ظرف دیگر منتقل کند. در نهایت به معنای افزایش بسیج آنهاست.
با روباتها در اتوماسیون مونتاژ، یک مانع آزاردهنده این بوده است که اکثر آنها هیچ سیستم بصری ندارند. آنها فقط می توانند یک شی را پیدا کنند زیرا ثابت است و برنامه ریزی شده اند که کجا بروند. او می گوید: “این کار می کند، اما بسیار غیر قابل انعطاف است.” هنگامی که محصولات جدید وارد می شوند یا فرآیندی تغییر می کند، وسایل نیز باید تغییر کنند. این نیاز به زمان، پول و مداخله انسانی دارد و منجر به از دست دادن کلی در بهره وری می شود.
ربات ها علاوه بر نداشتن توانایی دیدن و درک اساسا، هماهنگی ذاتی دست و چشم را که انسان ها دارند، ندارند. ونکاتارامن میگوید: «آنها نمیتوانند بینظمی دنیا را بهصورت روزمره بفهمند، اما، او میافزاید، «فکر میکنم با فناوری ما این اتفاق میافتد.»
او میگوید، مانند بسیاری از شرکتهای جدید، گام بعدی آزمایش استحکام و قابلیت اطمینان در محیطهای واقعی تا «سطح زیر میلیمتری» دقت است. پس از آن، پنج سال آینده باید شاهد گسترش کاربردهای مختلف صنعتی باشیم. پیش بینی اینکه کدام یک تقریبا غیرممکن است، اما دیدن مزایای جهانی آسان تر است. ونکاتارامن میگوید: «در درازمدت، این دید بهبود یافته را بهعنوان توانمندی برای بهبود هوش و یادگیری خواهیم دید». “به نوبه خود، پس از آن اتوماسیون وظایف پیچیده تر از آنچه تاکنون امکان پذیر بوده است را امکان پذیر می کند.”