با ابداع محققان سابق OpenAI
یادگیری روباتها به سبک انسان ممکن شد
تاریخ انتشار
سه شنبه ۲۲ اسفند ۱۴۰۲ ساعت ۰۹:۵۸
آیتیمن- این محققان سیستمی را رونمایی کردهاند که مهارتهای استدلال مدلهای زبانی بزرگ را با مهارتهای فیزیکی یک روبات پیشرفته ترکیب میکند.
مدل جدید که RFM-1 نام دارد، با استفاده از دادههای چندین ساله جمعآوریشده از ناوگان کوچک روباتهای جمعآوری اقلام Covariant که مشتریانی مانند Crate & Barrel و Bonprix از آنها استفاده میکنند، و همچنین کلمات و ویدیوهای موجود در اینترنت آموزش دیده است. در ماههای آینده، این مدل به مشتریان Covariant ارائه خواهد شد. این شرکت امیدوار است که این سیستم با استقرار در دنیای واقعی، کارآمدتر و توانمندتر شود.
پیتر چن و پیتر ابیل، بنیانگذاران Covariantنشان دادند که چگونه کاربران میتوانند با استفاده از پنج نوع ورودی مختلف، از جمله متن، تصاویر، ویدئو، دستورالعملهای روبات و اندازهگیریها، به مدل فرمان بدهند.
به عنوان مثال، میتوانید تصویری از یک سطل پر از تجهیزات ورزشی را به مدل هوش مصنوعی نشان دهید و به آن بگویید که بسته توپهای تنیس را بردارد. سپس روبات میتواند شیء را بردارد، تصویری از سطل بعد از برداشتن توپهای تنیس ایجاد کند یا ویدیویی از نمای بالا از نحوه انجام کار روبات را نمایش دهد.
اگر مدل پیشبینی کند که نمیتواند شیء را به درستی بگیرد، ممکن است حتی این جمله را تایپ کند: «من نمیتوانم آن را به خوبی بردارم. آیا پیشنهادی دارید؟» در پاسخ، میتوان به آن توصیه کرد که از تعداد مشخصی از فنجانهای مکنده روی بازوهای خود برای گرفتن بهتر استفاده کند.
به گفته چن، این یک گام رو به جلو در زمینه آموزش روباتهایی است که میتوانند به جای استفاده از کدهای پیچیده و خاص برای هر کار، با استفاده از دادههای آموزشی با محیط خود سازگار شوند. این همچنین گامی به سوی محیطهای کاری است که در آن مدیران میتوانند بدون نگرانی در مورد محدودیتهای نیروی انسانی، دستورالعملها را به زبان انسانی صادر کنند.
لورل پینتو، محققی که آزمایشگاه روباتیک و هوش مصنوعی عمومی را در دانشگاه نیویورک اداره میکند و هیچ ارتباطی با Covariant ندارد، میگوید اگرچه قبلاً روباتهای چندوجهی اولیه ساخته شده و از آنها در محیطهای آزمایشگاهی استفاده شده است؛ اما استقرار یک روبات در مقیاس بزرگ که قادر به برقراری ارتباط در این تعداد حالت مختلف باشد، یک شاهکار چشمگیر برای این شرکت است.
پینتو گفت:Covariant برای پیشی گرفتن از رقبای خود، باید دادههای کافی را برای کاربردی بودن روبات در دنیای واقعی جمعآوری کند. انبارها و اسکلههای بارگیری جایی هستند که این روبات به طور مداوم با دستورالعملها، افراد، اشیاء و محیطهای جدید تعامل خواهد داشت و در آنجا آزمایش خواهد شد.
به گفتهی وی، گروههایی که قرار است مدلهای مناسب را آموزش دهند، یا باید به حجم زیادی از دادههای روباتیک دسترسی داشته باشند یا توانایی تولید آن دادهها را داشته باشند.
مدل جدید این شرکت نشاندهنده یک تغییر اساسی در دنیای روباتیک است. به جای اینکه به صورت دستی نحوه عملکرد جهان را با دستورالعملهایی مانند معادلات فیزیک و کد به روبات آموزش دهند، محققان آن را به همان روشی که انسانها یاد میگیرند آموزش میدهند؛ یعنی از طریق میلیونها مشاهده.
چن گفت: نتیجه این کار میتواند به عنوان یک مغز انعطافپذیر بسیار مؤثر برای حل وظایف دلخواه روبات عمل کند.
احتمالاً امسال شرکتهایی که از هوش مصنوعی برای قدرت بخشیدن به سیستمهای روباتیک چابکتر استفاده میکنند، بیشتر مطرح خواهند شد. اوایل این ماه، استارتآپ روباتیک انساننمای Figure AI اعلام کرد که با OpenAI همکاری خواهد کرد و ۶۷۵ میلیون دلار از غولهای فناوری مانند Nvidia و مایکروسافت جمعآوری کرده است. مارک رابرت، بنیانگذار Boston Dynamics نیز اخیراً ابتکاری را برای ادغام بهتر هوش مصنوعی در روباتیک آغاز کرده است.
این بدان معناست که پیشرفتهای یادگیری ماشینی به احتمال زیاد به پیشرفتهای روباتیک منجر خواهد شد. با این حال، برخی مسائل همچنان حل نشده باقی مانده است. اگر مدلهای زبان بزرگ همچنان با میلیونها کلمه بدون جبران خسارت به نویسندگان آن کلمات آموزش داده شوند، شاید انتظار رود که مدلهای روباتیک نیز بدون پرداخت به سازندگان آنها با ویدیوها آموزش داده شوند. و اگر مدلهای زبان توهم ایجاد کنند و تعصبات را دائمی کنند، چه معادلهایی در روباتیک ظاهر خواهند شد؟
در همین حال هدف محققان Covariant این است که روبات را روی ویدیوهایی که خود مدل ایجاد میکند آموزش دهند.