ناشر منبع

null روشی برای بهبود تشخیص تصاویر ویدیویی
محققی از مدرسه عالی اقتصاد روسیه، روشی ایجاد کرده است که به وسیله آن می‌توان تشخیص تصاویر ویدیویی را با استفاده از هوش مصنوعی به راحتی انجام داد. 17:39

روشی برای بهبود تشخیص تصاویر ویدیویی

به گزارش روابط عمومی صندوق نوآوری و شکوفایی ریاست جمهوری، این محقق روسی، با به‌کارگیری الگوریتمی جدید، شبکه‌ای عصبی تشکیل داد که می‌تواند تصاویر را ۱۰ برابر سریع‌تر از گذشته، شناسایی و طبقه‌بندی کند.

از مدت‌ها قبل شبکه‌های عصبی به‌گونه‌ای آموزش داده شدند تا تصاویر ویدیویی انسان‌ها و حیوانات را شناسایی کنند.

عصب‌های مصنوعی این شبکه‌ها می‌توانند با به خاطر سپردن اینکه هر جسم موجود در تصویر چه شکلی دارد،  شناسایی تصاویر را بیاموزند و با مشاهده آن تصاویر، آنها را شناسایی و طبقه‌بندی کنند.

محققان برای انجام این کار، معمولا پایگاه داده‌ای از تصاویر (مانند ImageNet، Places و غیره) ایجاد می‌کنند و با استفاده از آن، شبکه‌های عصبی را آموزش می‌دهند.

آنها برای افزایش سرعت فرآیند تصمیم‌گیری شبکه عصبی در زمینه انتخاب نوع تصویر، الگوریتمی ساخته‌اند که فقط نمونه برخی از تصاویر را انتخاب می‌کند یا روی یکسری از ویژگی‌های خاص متمرکز می‌شود، اما مشکلات این شناسایی، زمانی آغاز می‌شود که چند شیء از طبقه‌های مختلف، همزمان در یک تصویر قرار دارند و به دلیل اینکه از هر طبقه، فقط شناسایی چند شیء به شبکه عصبی آموزش داده شده است، این شبکه دچار اشکال در شناسایی تصاویر می‌شود.

اکنون این محقق روسی و تیم تحقیقاتی‌اش، الگوریتم جدیدی ساخته‌اند که می‌تواند با استفاده از روش تصمیم‌گیری سه طرفه، تصاویر را تقریبا بدون خطا، شناسایی کند. در این روش، یک شبکه عصبی می‌تواند تصاویر ساده را ابتدا تحلیل و شناسایی کند و سپس به بررسی مفصل‌تر اجسامی بپردازد که شناسایی آنها سخت است.

این محقق روسی می‌گوید، هر تصویر را می‌توان از روی هزاران ویژگی‌اش، توصیف کرد. بنابراین نمی‌توان با مقایسه تمام ویژگی‌های هر تصویر با استفاده از نمونه‌ تصویر آموزشی اصلی که برای آموزش شبکه عصبی از آن استفاده شده است، اجسام را شناسایی کرد، زیرا تمام ویژگی‌های هر تصویر ممکن است با ویژگی‌های تصویر اولیه تحلیل شده، مشابه نباشد.

بنابراین محققان روسی، ابتدا چند ویژگی مهم را مقایسه کردند و به شبکه عصبی آموزش دادند. در نتیجه نمونه‌های آموزشی کمتر و در حد فقط چند مورد کاهش یافتند.

در مرحله بعدی، تعداد ویژگی‌های تصاویر باقیمانده اضافه شد و همان فرآیند آموزشی تکرار شد تا وقتی که فقط یک طبقه از تصاویر باقی ماند.

این روش، سرعت شناسایی تصاویر را نسبت به طبقه‌بندی معمول ۱,۵ تا ۱۰ برابر افزایش می‌دهد.

محققان می‌گویند از این فناوری می‌توان در ابزارهای همراه و دیگر گجت‌ها استفاده کرد.

ارسال ایمیل