ربات، ترکیبی از بینش و لمس
ربات، ترکیبی از بینش و لمس برای یادگیری بازی Jenga
یادگیری ماشین روشی است که میتواند به ربات کمک کند تا تلفنهای همراه و دیگر قطعات کوچک را در یک خط تولید، تولید کند.
در زیرزمین ساختمان 3MIT، یک ربات با دقت بهدنبال حرکت بعدی خود است، آن را به آرامی از برج بلوک با نوک انگشت فشار داده، و به دنبال بهترین بلوک برای قراردادن آن بدون سرازیر کردن برج است. این یک بازی انفرادی، با حرکاتی آرام، و در عین حال چابک و تعجب برانگیز جنگاست.
این ربات که توسط مهندسان MIT توسعه و طراحی شده است، شامل یک گیره نرم و یک دوربین خارجی برای دیدن و حس کردن برج و بلوک های تکی، و مچ دست با قابلیت نیرو سنجی، میباشد.همانطورکه ربات با دقت در برابر یک بلوک قرار میگیرد، یک کامپیوتر بازخورد بصری و لمسی را از دوربین و دست ربات گرفته و این اندازه گیریها را با حرکاتی که در ربات قبلا تعریف شده است، مقایسه میکند. و همچنین نتایج حاصل از این حرکات را نیز بهطور دقیق خواهد سنجید.
آیا یک بلوک، در یک ترتیب خاص که با مقدار مشخصی از نیرو تحت فشار خواهدگرفت، با موفقیت استخراج خواهد شد یا خیر؟. در آن هنگام ربات “یاد میگیرد” که چگونه بلوک را فشار داده و به مکانی جدید حرکت دهد بی آنکه برج سقوط کند.
اطلاعات مربوط به ربات Jenga در مجله Science Robotics منتشر شده است. آلبرتو رودریگز، استادیار توسعه حرفه ای والتر هنریگیل در بخش مهندسی مکانیک درMIT میگوید که ربات مواردی که در سیستم های قبلی برای دستیابی به اهداف مورد نیاز به مشکل رسیده بود را نشان میدهد که میتوان نتیجه گرفت که توانایی یادگیری سریع، بهترین راه برای انجام یک کار است البته نه فقط از راه نشانه های بصری که امروزه مورد مطالعه قرار میگیرد، بلکه باید تعاملات لمسی، فیزیکی را نیز شامل شود. برخلاف کارهای صرفا برپایه شناخت و یا بازی هایی مانند شطرنج، بازی Jenga مستلزم تسلط بر مهارتهای فیزیکی مانند ترسیم کردن در ذهن، هل دادن، کشیدن، قرار دادن و تراز کردن قطعات است.
این بازی نیاز به ادراک و مهارت تعامل دارد جایی که شما باید برج را ببینید و لمس کنید تا یاد بگیرید که چگونه و چه زمانی بلوک ها را حرکت دهید، رودریگز میگوید: این بازی برای شبیهسازی بسیار دشوار است، بنابراین ربات باید در دنیای واقعی بر اثر تعامل با برج واقعی Jenga برنامه ریزی شود.
چالش کلیدی این است که در تعداد کمی از آزمایشها از حس مشترک اشیاء و فیزیک بهره برداری کنیم و همچنین بیاموزیم. او میگوید سیستم یادگیری لمسی که توسط محققان توسعه داده شده است میتواند در برنامههای فراتر از جنگا مورد استفاده قرار بگیرند، بهویژه در کارهایی که نیاز به تعامل جسمی دقیق دارند از جمله جدا کردن اشیاء قابل بازیافت از زبالهها و جمع آوری محصولات مصرفی. در یک خط مونتاژ تلفن همراه، تقریبا در هر مرحله، به جای تحلیل و بینش از نیرو و لمس جهت احساس یک ضربه محکم و ناگهانی استفاده میشود از جمله این نوع مدلهای یادگیری میتوان از مشاوران املاکی که از این نوع تکنولوزی استفاده میکنند نام برد.
فشار و کشش
در بازی جنگا از 54 بلوک مستطیلی در 18 لایه که در هر لایه سه بلوک وجود دارد استفاده شده است که بلوکها در هر لایه به صورت عمودی به بلوک های زیر، انباشته شدهاند. هدف بازی این است که با دقت یک بلوک را استخراج کنید و آن را در بالای برج بگذارید، در نتیجه یک سطر جدید ایجاد میکنید بی آنکه کل ساختار را از بین ببرید.
جهت توسعه و برنامه ریزی یک ربات برای بازی Jenga، طرحهای یادگیری ماشینهای سنتی ممکن است به تمام احتمالاتی که دربین یک بلوک، ربات و برج اتفاق میافتد نیاز داشته باشد که به تلاش هزاران و بلکه دهها هزار نفر برای استخراج اطلاعات بلوکها نیاز است. درمقابل، رودریگوس و همکارانش به دنبال روشی برای یافتن اطلاعات بیشتر، نشأت گرفته از شناخت انسان و روش های انسان ها برای حل و یادگیری بازی Jenga توسط ربات بوده است،
این تیم یک بازوی روباتیک استاندارد ABB IRB 120 را تعبیه کرد و سپس یک برج Jenga را قرارداد و یک دوره آموزشی آغاز کرد که در آن ربات برای اولین بار یک بلوک تصادفی را برداشته و مکان آن را بر روی بلوک انتخاب میکند سپس یک مقدار کمی از نیرو را برای فشار دادن بلوک خارج از برج اعمال کرد همزمان برای هر تلاش بلوکی، یک رایانه، اندازه گیریهای بصری و نیروی مرتبط را ثبت و برچسب گذاری میکند تا بسنجد که آیا هر تلاش موفقیت آمیز بود یا خیر.
به جای تلاش ده هاهزار نفر (که شامل تقریبا چندین بار بازسازی برج میباشد) برای انجام این کار ربات به جای 300 نفر آموزش دیده است و با تلاش برای اندازه گیریها و نتایج مشابه که در ردیفها دسته بندی شدهاند رفتارهای بلوکی خاصی را تشکیل میدهند. بهعنوان مثال، یک ردیف ممکن است نشاندهنده تلاشهایی برای یک بلوک باشد که آیا حرکت سخت بود و یا حرکت آسان تر بود و یا اینکه برج در هنگام حرکت سقوط کرده است یا خیر، برای هر دسته از دادهها، ربات مدل ساده ای برای پیش بینی رفتار بلوک با توجه به اندازه گیریهای بصری و لمسی فعلی آن ارائه کرده است.
این تکنیک دسته سازی بهطور قابل توجهی باعث افزایش کارآیی ربات میشود که در آن هرکدام از رباتها میتوانند بازی کردن را دسته بندی کرده و ردیفها را ایجاد کنند و سپس، به جای یادگیری یک مدل، مدلهای هر یک از این ردیفها را یاد میگیرد تا همه چیز را که ممکن است اتفاق بیفتد را تصور کند.”
جمعبندی
محققان روش خود را در برابر دیگر الگوریتمهای یادگیری ماشینهای پیشرفته آزمایش کردند، در یک شبیهسازی کامپیوتری بازی با استفاده از شبیه ساز MuJoCo، شبیه سازی، در زمینه نحوه رفتار ربات در دنیای واقعی تجربههایی کسب میکنند،ما به این الگوریتمها همان اطلاعاتی را که سیستم ما میدهد، ارائه میکنیم تا ببینیم چگونه آنها متوجه میشوند که در یک سطح مشابه بازی Jenga بازی کنند، الیر میگوید: “در مقایسه با روش ما، این الگوریتمها نیاز به این مهم دارند که برای یادگیری بازی برجهای بیشتری را کشف کنند. “
چگونگی روشهای یادگیری ماشینی دربرابر بازیکنان واقعی انسانی تعجب آور است، این تیم چندین مسابقه با چندین داوطلب تشکیل داد .اورلر میگوید:ما دیدیم که چگونه چندین بلوک یک داوطلب (انسان) خارج شد بی آنکه برج سقوط کند و تفاوت چندانی با عملکرد ربات نداشت اما اگر پژوهشگران قصد رقابت با ربات خود را در برابر یک بازیکن انسانی داشته باشند، راه دیگری وجود دارد علاوه بر تعاملات فیزیکی، Jenga به استراتژی نیاز دارد، مانند استخراج فقط بلوک راست که باعث میشود حریف برای قراردادن بلوک بعدی بدون سرازیر کردن برج، به مشکل برسد. در حال حاضر، تیم کمتر علاقهمند به توسعه یک قهرمان رباتیک جنگا است، و بیشتر بر استفاده از مهارتهای جدید ربات در دامنههای کاربردی دیگر نیز تمرکز کرده است.