ربات، ترکیبی از بینش و لمس

ربات، ترکیبی از بینش و لمس برای یادگیری بازی Jenga

یادگیری ماشین روشی است که می‌­تواند به ربات کمک کند تا تلفن‌های همراه و دیگر قطعات کوچک را در یک خط تولید، تولید کند.

در زیرزمین ساختمان 3MIT، یک ربات با دقت به‌دنبال حرکت بعدی خود است، آن را به آرامی از برج بلوک با نوک انگشت فشار داده، و به دنبال بهترین بلوک برای قراردادن آن بدون سرازیر کردن برج است. این یک بازی انفرادی، با حرکاتی آرام، و در عین حال چابک و تعجب برانگیز جنگاست.

این ربات که توسط مهندسان MIT توسعه و طراحی شده است، شامل یک گیره نرم و یک دوربین خارجی برای دیدن و حس کردن برج و بلوک های تکی، و مچ دست با قابلیت نیرو سنجی، می‌­باشد.همان‌­طور­که ربات با دقت در برابر یک بلوک قرار می‌گیرد، یک کامپیوتر بازخورد بصری و لمسی را از دوربین و دست ربات گرفته و این اندازه گیری‌ها را با حرکاتی که در ربات قبلا تعریف شده است، مقایسه می‌کند. و همچنین نتایج حاصل از این حرکات را نیز به‌طور دقیق خواهد سنجید.

آیا یک بلوک، در یک ترتیب خاص که با مقدار مشخصی از نیرو تحت فشار خواهدگرفت، با موفقیت استخراج خواهد شد یا خیر؟. در آن هنگام ربات “یاد می­‌گیرد” که چگونه بلوک را فشار داده و به مکانی جدید حرکت دهد بی آنکه برج سقوط کند.

 اطلاعات مربوط به ربات Jenga در مجله Science Robotics منتشر شده است. آلبرتو رودریگز، استادیار توسعه حرفه ای والتر هنری­گیل در بخش مهندسی مکانیک درMIT­ می‌گوید که ربات مواردی که در سیستم های قبلی برای دستیابی به اهداف مورد نیاز به مشکل رسیده بود را نشان می‌دهد که می‌توان نتیجه گرفت که توانایی یادگیری سریع، بهترین راه برای انجام یک کار است البته نه فقط از راه نشانه های بصری که امروزه مورد مطالعه قرار می‌گیرد، بلکه باید تعاملات لمسی، فیزیکی را نیز شامل شود. برخلاف کارهای صرفا برپایه شناخت و یا بازی هایی مانند شطرنج، بازی Jenga مستلزم تسلط بر مهارت‌های فیزیکی مانند ترسیم کردن در ذهن، هل دادن، کشیدن،  قرار دادن و تراز کردن قطعات است.

این بازی نیاز به ادراک و مهارت تعامل دارد جایی که شما باید برج را ببینید و لمس کنید تا یاد بگیرید که چگونه و چه زمانی بلوک ها را حرکت دهید، رودریگز می‌گوید: این بازی برای شبیه‌سازی بسیار دشوار است، بنابراین ربات باید در دنیای واقعی بر اثر تعامل با برج واقعی  Jenga  برنامه ریزی شود.

چالش کلیدی این است که در تعداد کمی از آزمایش‌ها از حس مشترک اشیاء و فیزیک بهره برداری کنیم و همچنین بیاموزیم. او می‌گوید سیستم یادگیری لمسی که توسط محققان توسعه داده شده است می‌تواند در برنامه‌های فراتر از جنگا مورد استفاده قرار بگیرند، به‌ویژه در کارهایی که نیاز به تعامل جسمی دقیق دارند از جمله جدا کردن اشیاء قابل بازیافت از زباله‌ها و جمع آوری محصولات مصرفی. در یک خط مونتاژ تلفن همراه، تقریبا در هر مرحله، به جای تحلیل و بینش از نیرو و لمس جهت احساس یک ضربه محکم و ناگهانی استفاده می‌شود از جمله این نوع مدل‌های یادگیری می‌توان از مشاوران املاکی که از این نوع تکنولوزی استفاده می‌کنند نام برد.

فشار و کشش

در بازی جنگا از 54 بلوک مستطیلی در 18 لایه که در هر لایه سه بلوک وجود دارد استفاده شده است که بلوک‌ها در هر لایه به صورت عمودی به بلوک های زیر،  انباشته شده‌اند. هدف بازی این است که با دقت یک بلوک را استخراج کنید و آن را در بالای برج بگذارید، در نتیجه یک سطر جدید ایجاد می‌کنید بی آنکه کل ساختار را از بین ببرید.

جهت توسعه و برنامه ریزی یک ربات برای بازی Jenga، طرح‌های یادگیری ماشین‌های سنتی ممکن است به  تمام احتمالاتی که دربین یک بلوک، ربات و برج اتفاق می‌افتد نیاز داشته باشد که به تلاش هزاران و بلکه ده‌ها هزار نفر برای استخراج اطلاعات بلوک‌ها نیاز است. درمقابل، رودریگوس و همکارانش به دنبال روشی برای یافتن اطلاعات بیشتر، نشأت گرفته از شناخت انسان و روش های انسان ها برای حل و یادگیری بازی Jenga توسط ربات بوده است،

این تیم یک بازوی روباتیک استاندارد ABB IRB 120 را تعبیه کرد و سپس یک برج Jenga را قرارداد و یک دوره آموزشی آغاز کرد که در آن ربات برای اولین بار یک بلوک تصادفی را برداشته و مکان آن را بر روی بلوک انتخاب می‌کند سپس یک مقدار کمی از نیرو را برای فشار دادن بلوک خارج از برج اعمال کرد همزمان برای هر تلاش بلوکی، یک رایانه، اندازه گیری‌های بصری و نیروی مرتبط را ثبت و برچسب گذاری می‌کند تا بسنجد که آیا هر تلاش موفقیت آمیز بود یا خیر.

به جای تلاش ده ها‌هزار نفر (که شامل تقریبا چندین بار بازسازی برج می‌باشد) برای انجام این کار ربات به جای 300 نفر آموزش دیده است و با تلاش برای اندازه گیری‌ها و نتایج مشابه که در ردیف‌ها دسته بندی شده‌اند رفتارهای بلوکی خاصی را تشکیل می‌­دهند. به­عنوان مثال، یک ردیف ممکن است نشان‌دهنده تلاش‌هایی برای یک بلوک باشد که آیا حرکت سخت بود و یا حرکت آسان تر بود و یا این‌که برج در هنگام حرکت سقوط کرده است یا خیر، برای هر دسته از داده‌ها، ربات مدل ساده ای برای پیش بینی رفتار بلوک با توجه به اندازه گیری‌های بصری و لمسی فعلی آن ارائه کرده است.

این تکنیک دسته سازی به‌­طور قابل توجهی باعث افزایش کارآیی ربات می‌شود که در آن هرکدام از ربات‌­ها می‌­توانند بازی کردن را دسته بندی کرده و ردیف‌ها را ایجاد کنند و سپس، به جای یادگیری یک مدل، مدل‌­های هر یک از این ردیف‌­ها را یاد می‌گیرد تا همه چیز را که ممکن است اتفاق بیفتد را تصور کند.”

جمع‌­بندی

محققان روش خود را در برابر دیگر الگوریتم­‌های یادگیری ماشین‌های پیشرفته آزمایش کردند، در یک شبیه‌سازی کامپیوتری بازی با استفاده از شبیه ساز  MuJoCo، شبیه سازی، در زمینه نحوه رفتار ربات در دنیای واقعی تجربه‌هایی کسب می‌­کنند،ما به این الگوریتم‌ها همان اطلاعاتی را که سیستم ما می‌دهد، ارائه می‌کنیم تا ببینیم چگونه آنها متوجه می‌شوند که در یک سطح مشابه بازی Jenga بازی کنند، الیر می‌گوید: “در مقایسه با روش ما، این الگوریتم‌ها نیاز به این مهم دارند که برای یادگیری بازی برج‌های بیشتری را کشف کنند. “

چگونگی روش‌های یادگیری ماشینی دربرابر بازیکنان واقعی انسانی تعجب آور است، این تیم چندین مسابقه با چندین داوطلب تشکیل داد .اورلر می‌گوید:ما دیدیم که چگونه چندین بلوک یک داوطلب (انسان) خارج شد بی آنکه برج سقوط کند و تفاوت چندانی با عملکرد ربات نداشت اما اگر پژوهشگران قصد رقابت با ربات خود را در برابر یک بازیکن انسانی داشته باشند، راه دیگری وجود دارد علاوه بر تعاملات فیزیکی، Jenga به استراتژی نیاز دارد، مانند استخراج فقط بلوک راست که باعث می‌شود حریف برای قراردادن بلوک بعدی بدون سرازیر کردن برج، به مشکل برسد. در حال حاضر، تیم کمتر علاقه‌­مند به توسعه یک قهرمان رباتیک جنگا است، و بیشتر بر استفاده از مهارت‌های جدید ربات در دامنه‌های کاربردی دیگر نیز تمرکز کرده است.