یادگیری عمیق و پیشرفت در پردازش تصویر
با توجه به افزایش روز افزون تعداد دوربینهای نظارت تصویری و همینطور داده های تولید شده توسط این دوربینها، عملیات نظارت، انجام جستجوها و همچنین دستیابی به خروجیهای مد نظر از داده های ارزشمندی که توسط زیرساختهای نظارت تصویری ایجاد شده، برای سازمانها دشوارتر می گردد.
پردازش تصویر مدتهاست که به عنوان یک راه حل فناورانه به منظور کمک به شناسایی فعالیت ها و استفاده بهینه از داده های ویدیویی شناخته شده است.
یادگیری عمیق در حوزه پردازش تصویر بسیار تاثیرگذار بوده و احتمالا” روندها را تغییر خواهد داد. اما یادگیری عمیق چیست و چگونه می تواند تکنیکهای معمول را بهبود بخشد؟
تکنیک های یادگیری ماشین و پردازش تصویر
بیشتر تکنیکهای پردارش تصویر که تا به امروز توسعه یافته اند، بر اساس تکنیکهای سنتی و الگوریتمیک یادگیری ماشین بنا نهاده شده اند.
یادگیری عمیق تحولی پیشرفته تر از یادگیری ماشین، با استفاده از شبکه های عصبی پیچیده و مصنوعی می باشد.
در زمینه پردازش تصویر، یادگیری ماشین و یادگیری عمیق، هر دو، به نرم افزار فرمانی را مبنی بر توسعه مدلی مبتنی بر اشیاء، بر اساس ویژگیهای مختلفی که نرم افزار در خصوص آن اشیاء آموزش دیده است صادر می کنند.
این مدل به نرم افزار کمک میکند که در آینده اشیاء را در فیدهای ویدیویی بر اساس ویزگیهایی که آموخته است، شناسایی و دسته بندی نماید.
به عنوان مثال، فرض کنید یک جسم در حال حرکت در محدوده تحت پوشش دوربین دارای طول بلندتری نسبت به عرض خود بوده و بر خلاف آن جسمی دیگر دارای عرض بیشتر نسبت به بلندا باشد. نرم افزار پردازش تصویر، ممکن است بر اساس خصوصیات هر شیء، اولی را به عنوان شخص و دومی را به عنوان یک وسیله نقلیه طبقه بندی نماید.
در واقعیت، بسیاری از داده ها به منظور دسته بندی اشیاء مورد استفاده قرار می گیرند، در حالیکه برخی از مشخصات اشیاء اهمیت بیشتری نسبت به سایر مشخصات دارند. نرم افزار پردازش تصویر، از معیارهای مختلفی جهت طبقه بندی اشیاء، به منظور تعیین این احتمال که یک شیء، شخص، وسیله نقلیه و یا چیز دیگریست استفاده می کند.
با ورود یک شیء به صحنه، آن شیء آنالیز شده، مشخصه ها و خصوصیات آن مورد ارزیابی قرار می گیرد. جهت تعیین نوع این شیء ، نرم افزار ممکن است ابعاد آبجکت، تفاوت های رنگی و الگوهای حرکتی آن را مورد بررسی قرار دهد. به عنوان مثال نرم افزار، ابعاد جسم، رنگ آن و نیز میزان سرعت آن را در یک جهت واحد تعیین می کند. بر اساس این مشاهدات، این مشخصات استخراج شده با مدلهای موجود مقایسه شده و این ویژگیها تعیین می کند که این شیء، وسیله نقلیه، انسان و یا هر جسم دیگریست.
بر اساس مقایسه مدلهای موجود، در نرم افزار پردازش تصویر، احتمال اینکه این شیء وسیله نقلیه باشد 88 درصد، شخص باشد 7 درصد و احتمال اینکه شیئی دیگر باشد 22 درصد است. لذا این آبجکت به عنوان وسیله نقلیه شناخته شده و داده های استخراج شده از ویدیو، می تواند به کاربر این امکان را دهد که بعدا” با یک جستجوی ساده تمام خودروهای با رنگ مشخص که از چپ به راست صحنه تحت پوشش حرکت می کنند را شناسایی و استخراج نماید.
محدودیت های پردازش با استفاده از یادگیری ماشین
یادگیری ماشین، مدلی از یک شیء را بر اساس داده هایی که به برنامه توسط برنامه نویسان ارائه می شود، می سازد. این داده ها توسط افراد گردآوری شده، بنابراین ذاتا” به مجموعه ای از خصوصیات که یک توسعه دهنده جمع آوری کرده و به برنامه داده است، محدود خواهد بود.
در مثال ذکر شده، ” شخص در مقایسه با وسیله نقلیه” اگر ارتفاع شیء نسبت به عرض آن بیشتر باشد، ممکن است این آبجکت به عنوان یک شخص دسته بندی گردد و برعکس بیشتر بودن عرض از ارتفاع یک آبجکت، ممکن است آن آبجکت را در دسته وسائل نقلیه قرار دهد.
با توجه به این معیارها، ممکن است طبقه بندی انجام شده در نرم افزار پردازش تصویر در صورت خزیدن یک شخص در صحنه و یا در مورد یک شخص حال حمل جعبه ای بزرگ، اشتباه باشد. در هر دو مثال، این الگوریتم فرض می کند که شخص به صورت ایستاده حرکت نموده و نیز توسط هیچ شیء دیگری نظیر جعبه، ابعاد آن تغییر نخواهد کرد.
چنین چالشهایی، یکی از مواردیست که محبوبیت پردازش تصویر در صنعت سیستمهای حفاظتی را در این سالها تحت تاثیر قرار داده است.
پیشرفت ها در استفاده از یادگیری عمیق
با استفاده از یادگیری عمیق، نرم افزار در برگیرنده تصاویر نمونه زیادی خواهد بود. بسیاری از خصوصیات تصاویر از قبیل شناخت شخص، وسیله نقلیه، زن مسن و یا هرگونه دسته بندی خاص اشیاء، قابل طبقه بندی خواهد بود.
پیشرفت عمده یادگیری عمیق در این موضوع مهم است که این نرم افزار است که تعیین می نماید چه ویژگیهایی جهت طبقه بندی اشیاء استفاده می گردد و نیروی انسانی و برنامه نویسان هیچ گونه دخالتی در آن نخواهند داشت.
تصاویر نمونه می توانند دهها هزار عدد و یا بیشتر باشند، همچنین این تصاویر ممکن است نشان دهنده یک شیء از زوایای مختلف، با شرایط نوری متفاوت و از مناطق مختلف جهان باشند. ار آنجاکه یادگیری عمیق، به نرم افزار اجازه می دهد که مشخصات یک آبجکت را بر اساس تصاویر واقعی تعیین نماید، هیچگونه پیش فرضی در خصوص تعریف شیء وجود ندارد.
داده های تصویری که تغذیه کننده نرم افزار هستند، دارای تنوع کافی میباشند، لذا هیچگونه ذهنیت قبلی در خصوص اینکه کدام ویژگیها برای یک شیء باید تعریف شود وجود ندارد. همچنین هیچگونه محدودیتی در تعداد مشخصه هایی از اشیاء که می توان بر اساس آنها طبقه بندی را انجام داد نیز وجود ندارد.
آینده در برگیرنده چه چیزهایی خواهد بود؟
یادگیری عمیق هنوز یک فناوری نسبتا” جدید است. با این حال، برخی می گویند این تکنیک ممکن است در آینده باعث شناسایی بهتر اشیاء با استفاده از داده های ورودی کمتر توسط کامپیوترها در مقایسه با انسان شود.
در حال حاضر، تکنولوژی طبقه بندی آبجکت، به میزان یادگیری برنامه های پردازش تصویر، تنوع نمونه های استفاده شده جهت یادگیری این برنامه ها و نیز میزان قدرت پردازش جهت انجام دقیق تشخیص و دسته بندی اشیاء در ویدیویی زنده محدود است.
پیشرفت های حاصل شده در الگوریتمهای یادگیری، بر اساس روشهایی است که از ویدیو به جای تصویر ثابت در پروسه یادگیری استفاده می کنند.
نرم افزاری که بر اساس کلیپهای ویدئویی آموزش دیده، عملیات طبقه بندی را بر اساس ویژگیهای چند وجهی انجام می دهد.
پردازش تصویر، امکان مشاهده خودروهای در حال سفر در جاده، در قیاس با افراد در حال قدم زدن در پیاده رو ها را فراهم می کند. مشخصاتی از قبیل سرعت، الگوهای حرکتی، محل آبجکت در تصویر، گیت عبور و مرور و دیگر فاکتورها می توانند به منظور شناسایی بهتر در پردازش تصویر مورد استفاده قرار گیرند.
آموزش، پیشرفت در تشخیص اشیاء و قدرت پردازش بالاتر به همراه تکنیک های یادگیری عمیق می تواند میزان دقت در پردازش تصویر را در آینده به میزان قابل ملاحظه ای افزایش دهد.