۰
با ابداع محققان سابق OpenAI

یادگیری روبات‌ها به سبک انسان ممکن شد

تاریخ انتشار
سه شنبه ۲۲ اسفند ۱۴۰۲ ساعت ۰۹:۵۸
یادگیری روبات‌ها به سبک انسان ممکن شد
یادگیری روبات‌ها به سبک انسان ممکن شد

آی‌تی‌من- این محققان سیستمی را رونمایی کرده‌اند که مهارت‌های استدلال مدل‌های زبانی بزرگ را با مهارت‌های فیزیکی یک روبات پیشرفته ترکیب می‌کند.

مدل جدید که RFM-1 نام دارد، با استفاده از داده‌های چندین ساله جمع‌آوری‌شده از ناوگان کوچک روبات‌های جمع‌آوری اقلام Covariant که مشتریانی مانند Crate & Barrel و Bonprix از آن‌ها استفاده می‌کنند، و همچنین کلمات و ویدیوهای موجود در اینترنت آموزش دیده است. در ماه‌های آینده، این مدل به مشتریان Covariant ارائه خواهد شد. این شرکت امیدوار است که این سیستم با استقرار در دنیای واقعی، کارآمدتر و توانمندتر شود.

پیتر چن و پیتر ابیل، بنیانگذاران  Covariantنشان دادند که چگونه کاربران می‌توانند با استفاده از پنج نوع ورودی مختلف، از جمله متن، تصاویر، ویدئو، دستورالعمل‌های روبات و اندازه‌گیری‌ها، به مدل فرمان بدهند.
به عنوان مثال، می‌توانید تصویری از یک سطل پر از تجهیزات ورزشی را به مدل هوش مصنوعی نشان دهید و به آن بگویید که بسته توپ‌های تنیس را بردارد. سپس روبات می‌تواند شیء را بردارد، تصویری از سطل بعد از برداشتن توپ‌های تنیس ایجاد کند یا ویدیویی از نمای بالا از نحوه انجام کار روبات را نمایش دهد.

اگر مدل پیش‌بینی کند که نمی‌تواند شیء را به درستی بگیرد، ممکن است حتی این جمله را تایپ کند: «من نمی‌توانم آن را به خوبی بردارم. آیا پیشنهادی دارید؟» در پاسخ، می‌توان به آن توصیه کرد که از تعداد مشخصی از فنجان‌های مکنده روی بازوهای خود برای گرفتن بهتر استفاده کند.

به گفته چن، این یک گام رو به جلو در زمینه آموزش روبات‌هایی است که می‌توانند به جای استفاده از کدهای پیچیده و خاص برای هر کار، با استفاده از داده‌های آموزشی با محیط خود سازگار شوند. این همچنین گامی به سوی محیط‌های کاری است که در آن مدیران می‌توانند بدون نگرانی در مورد محدودیت‌های نیروی انسانی، دستورالعمل‌ها را به زبان انسانی صادر کنند.

لورل پینتو، محققی که آزمایشگاه روباتیک و هوش مصنوعی عمومی را در دانشگاه نیویورک اداره می‌کند و هیچ ارتباطی با Covariant ندارد، می‌گوید اگرچه قبلاً روبات‌های چندوجهی اولیه ساخته‌ شده و از آن‌ها در محیط‌های آزمایشگاهی استفاده شده است؛ اما استقرار یک روبات در مقیاس بزرگ که قادر به برقراری ارتباط در این تعداد حالت مختلف باشد، یک شاهکار چشمگیر برای این شرکت است.

پینتو گفت:Covariant  برای پیشی گرفتن از رقبای خود، باید داده‌های کافی را برای کاربردی بودن روبات در دنیای واقعی جمع‌آوری کند. انبارها و اسکله‌های بارگیری جایی هستند که این روبات به طور مداوم با دستورالعمل‌ها، افراد، اشیاء و محیط‌های جدید تعامل خواهد داشت و در آنجا آزمایش خواهد شد.

به گفته‌ی وی، گروه‌هایی که قرار است مدل‌های مناسب را آموزش دهند، یا باید به حجم زیادی از داده‌های روباتیک دسترسی داشته باشند یا توانایی تولید آن داده‌ها را داشته باشند.
مدل جدید این شرکت نشان‌دهنده‌ یک تغییر اساسی در دنیای روباتیک است. به جای اینکه به صورت دستی نحوه‌ عملکرد جهان را با دستورالعمل‌هایی مانند معادلات فیزیک و کد به روبات آموزش دهند، محققان آن را به همان روشی که انسان‌ها یاد می‌گیرند آموزش می‌دهند؛ یعنی از طریق میلیون‌ها مشاهده.

چن گفت: نتیجه‌ این کار می‌تواند به عنوان یک مغز انعطاف‌پذیر بسیار مؤثر برای حل وظایف دلخواه روبات عمل کند.

احتمالاً امسال شرکت‌هایی که از هوش مصنوعی برای قدرت بخشیدن به سیستم‌های روباتیک چابک‌تر استفاده می‌کنند، بیشتر مطرح خواهند شد. اوایل این ماه، استارت‌آپ روباتیک انسان‌نمای Figure AI اعلام کرد که با OpenAI همکاری خواهد کرد و ۶۷۵ میلیون دلار از غول‌های فناوری مانند Nvidia و مایکروسافت جمع‌آوری کرده است. مارک رابرت، بنیانگذار Boston Dynamics نیز اخیراً ابتکاری را برای ادغام بهتر هوش مصنوعی در روباتیک آغاز کرده است.

این بدان معناست که پیشرفت‌های یادگیری ماشینی به احتمال زیاد به پیشرفت‌های روباتیک منجر خواهد شد. با این حال، برخی مسائل همچنان حل نشده باقی مانده است. اگر مدل‌های زبان بزرگ همچنان با میلیون‌ها کلمه بدون جبران خسارت به نویسندگان آن کلمات آموزش داده شوند، شاید انتظار رود که مدل‌های روباتیک نیز بدون پرداخت به سازندگان آن‌ها با ویدیوها آموزش داده شوند. و اگر مدل‌های زبان توهم ایجاد کنند و تعصبات را دائمی کنند، چه معادل‌هایی در روباتیک ظاهر خواهند شد؟

در همین حال هدف محققان Covariant این است که روبات را روی ویدیوهایی که خود مدل ایجاد می‌کند آموزش دهند.
 
 
برچسب ها :
کد مطلب : ۲۸۲۸۹۱
ارسال نظر
نام شما

آدرس ايميل شما