حرکت شبه انسانی روبات ها با کمک یک مدل یادگیری ماشینی
تاریخ انتشار
دوشنبه ۱۶ مهر ۱۳۹۷ ساعت ۱۲:۰۵
انسان ها می توانند الگوهای رفتاری و یا دوری از موانع را از دیگران یاد بگیرند اما روبات ها از درک چنین مفاهیمی عاجز هستند.
پژوهشگران دانشگاه MIT روش جدیدی ابداع کرده اند که به روبات ها در تقلید رفتار انسان ها کمک کنند. این مدل برنامه ریزی حرکتی، به روبات ها امکان می دهد چگونگی رسیدن به هدف را با بررسی محیط و عوامل دیگر حاضر در آن تعیین کنند.
الگوریتم های طراحی حرکتی معمولی، برای انتخاب راه های مناسب حرکت، تصمیم های احتمالی را ارائه می دهند. برای مثال، روباتی که باید برای رسیدن به در، داخل اتاق حرکت کند، ابتدا یک برنامه جستجوی گام به گام برای حرکات احتمالی شکل می دهد و سپس، با در نظر گرفتن محدودیت ها، بهترین راه را برای رسیدن به در انتخاب می کند. در هر حال، روبات نمی تواند از اطلاعات مربوط به عوامل موثر در محیط های مشابه استفاده کند.
آندری باربو (Andrei Barbu)، پژوهشگر آزمایشگاه علوم رایانه و هوش مصنوعی دانشگاه ام.آی.تی و از نویسندگان این پژوهش گفت: کار روبات ها با این سیستم، مانند بازی شطرنج است اما آنها برخلاف بازیکنان شطرنج، بدون یادگیری بیشتر درباره محیط و عوامل حاضر در آن، رخدادهای آینده را پیش بینی می کنند.
این گروه پژوهشی، مدلی ابداع کردند که یک الگوریتم برنامه ریزی را با یک شبکه عصبی ترکیب می کند. این شبکه عصبی، چگونگی شناسایی مسیرهایی که به مقصد می رسند یاد می گیرد و از این دانش، برای راهنمایی حرکات روبات در محیط استفاده می کند.
پژوهشگران در مقاله این پروژه، مزایای مدل خود را به دو دسته تقسیم کردند: حرکت در میان اتاق های چالش برانگیز و مسیرهای باریک و حرکت در مسیر بدون برخورد با عوامل حاضر در آن.
یکی از کاربردهای امیدوارکننده این مدل، کمک به حرکت خودروهای خودران در تقاطع خیابان هاست. با استفاده از این مدل، خودروها می توانند پیش از رسیدن به ترافیک، عملکرد خودروهای دیگر را ارزیابی کنند.
ین لینگ کو (Yen–Ling Kuo)، دانشجوی دکترای دانشگاه ام.آی.تی و نویسنده ارشد این پژوهش گفت: هنگامی که انسان ها در تعامل با جهان قرار می گیرند، عواملی را می بینند که پیشتر با آنها در تعامل بوده اند و یا آنها را دیده اند،؛ در نتیجه می دانند چگونه رفتار کنند. ایده ما، قرار دادن یک مدل یادگیری ماشینی، در فضای جست وجو است که تجربه ای از چنین تعاملاتی در آن وجود دارد تا به این شکل، کارآیی سیستم افزایش یابد.
پژوهشگران دانشگاه MIT روش جدیدی ابداع کرده اند که به روبات ها در تقلید رفتار انسان ها کمک کنند. این مدل برنامه ریزی حرکتی، به روبات ها امکان می دهد چگونگی رسیدن به هدف را با بررسی محیط و عوامل دیگر حاضر در آن تعیین کنند.
الگوریتم های طراحی حرکتی معمولی، برای انتخاب راه های مناسب حرکت، تصمیم های احتمالی را ارائه می دهند. برای مثال، روباتی که باید برای رسیدن به در، داخل اتاق حرکت کند، ابتدا یک برنامه جستجوی گام به گام برای حرکات احتمالی شکل می دهد و سپس، با در نظر گرفتن محدودیت ها، بهترین راه را برای رسیدن به در انتخاب می کند. در هر حال، روبات نمی تواند از اطلاعات مربوط به عوامل موثر در محیط های مشابه استفاده کند.
آندری باربو (Andrei Barbu)، پژوهشگر آزمایشگاه علوم رایانه و هوش مصنوعی دانشگاه ام.آی.تی و از نویسندگان این پژوهش گفت: کار روبات ها با این سیستم، مانند بازی شطرنج است اما آنها برخلاف بازیکنان شطرنج، بدون یادگیری بیشتر درباره محیط و عوامل حاضر در آن، رخدادهای آینده را پیش بینی می کنند.
این گروه پژوهشی، مدلی ابداع کردند که یک الگوریتم برنامه ریزی را با یک شبکه عصبی ترکیب می کند. این شبکه عصبی، چگونگی شناسایی مسیرهایی که به مقصد می رسند یاد می گیرد و از این دانش، برای راهنمایی حرکات روبات در محیط استفاده می کند.
پژوهشگران در مقاله این پروژه، مزایای مدل خود را به دو دسته تقسیم کردند: حرکت در میان اتاق های چالش برانگیز و مسیرهای باریک و حرکت در مسیر بدون برخورد با عوامل حاضر در آن.
یکی از کاربردهای امیدوارکننده این مدل، کمک به حرکت خودروهای خودران در تقاطع خیابان هاست. با استفاده از این مدل، خودروها می توانند پیش از رسیدن به ترافیک، عملکرد خودروهای دیگر را ارزیابی کنند.
ین لینگ کو (Yen–Ling Kuo)، دانشجوی دکترای دانشگاه ام.آی.تی و نویسنده ارشد این پژوهش گفت: هنگامی که انسان ها در تعامل با جهان قرار می گیرند، عواملی را می بینند که پیشتر با آنها در تعامل بوده اند و یا آنها را دیده اند،؛ در نتیجه می دانند چگونه رفتار کنند. ایده ما، قرار دادن یک مدل یادگیری ماشینی، در فضای جست وجو است که تجربه ای از چنین تعاملاتی در آن وجود دارد تا به این شکل، کارآیی سیستم افزایش یابد.
مرجع : ايسنا