ناشر منبع

null دستیارهای صوتی ارتقا می‌یابند
09:59

دستیارهای صوتی ارتقا می‌یابند

کارشناسان آمازون، روش جدیدی برای به کار انداختن دستیار صوتی الکسای خود پیشنهاد داده‌اند که در صورت بهبود آن، این دستیار دیگر به واژه بیداری (wake word) و فعالسازی نیاز نخواهد داشت.

به گزارش روابط عمومی صندوق نوآوری و شکوفایی ریاست جمهوری، واژه بیداری مورد استفاده در دستیارهای صوتی آمازون، «الکسا» است. در حال حاضر بیشتر دستیارهای صوتی، با استفاده از واژه بیداری و فعالسازی، شروع به کار می‌کنند. این ابزارها، به واژه خاصی واکنش نشان داده و شروع به کار می‌کنند، اما اکنون کارشناسان آمازون، روشی پیشنهاد کرده‌اند که حتی بدون گفتن واژه فعالسازی، دستگاه شروع به کار می‌کند.

آمازون روشی به ثبت رسانده است که به وسیله آن دستیار صوتی الکسا، بدون استفاده از واژه بیداری، شروع به ضبط می‌کند. این روش باعث می‌شود که افراد به روش طبیعی‌تری با ابزارها، ارتباط برقرار کنند. به طور مثال، به جای اینکه هنگام گفتگو با ابزار، ابتدا واژه بیداری را به کار ببرند، بدون هیچ مشکلی به ابزار بگویند، «برایم موسیقی پخش کن».

با روش فوق کاربران ابزارهای الکسا مجبور نیستند، هر بار که قصد استفاده از ابزاری را دارند، آن را ابتدا بیدار و فعال کنند.

کارشناسان آمازون نام این روش را «فرآیند گفتاری پیش از واژه بیداری» نامیده‌اند. آنها سیستمی طراحی کرده‌اند که بخش‌هایی از کلمات بیان شده قبل از بیان واژه بیداری، ابزار را فعال و مشغول به ضبط و پردازش می‌کند. سپس این سیستم، اصوات دریافتی را تقویت و بخش‌هایی را هم که گفتار دچار تغییر می‌شود مشخص می‌کند، مثل بخش‌هایی که سخنی گفته نمی‌شود و مکثی نسبتا طولانی وجود دارد. وقتی سیستم، واژه بیداری را درون گفتار خاصی شناسایی می‌کند، می‌تواند موقعیت آن گفتار را زودتر از واژه بیداری تشخیص دهد و علامتی صوتی از آن مکان به سرویس‌دهنده برای پردازش بیشتر گفتار بفرستد. بدین ترتیب ابزارهای مجهز به سیستم الکسا، می‌توانند هر کلمه‌ای را که قبل از گفتن واژه بیداری به کار می‌رود، شناسایی و ضبط کنند.

نقصی که دستیارهای صوتی الکسا داشتند این بود که اگر کاربری هنگام دادن یک فرمان صوتی، به جای به کار بردن واژه بیداری در ابتدای جمله، آن را در ابتدا یا انتهای جمله به کار می‌برد، ابزار نمی‌توانست متوجه فرمان صوتی شود.

اگرچه اینگونه صحبت کردن برای کاربران طبیعی است اما سیستم‌های پردازش گفتار نمی‌توانند آن دسته از فرمان‌های صوتی را که با واژه بیداری شروع نمی‌شوند را به خوبی تشخیص دهند، اما سیستم جدید آمازون می‌تواند واژه‌های بیداری را در هر مکانی از گفتار که وجود دارد به خوبی تشخیص دهد و متوجه فرمان صوتی شود.

در حال حاضر ابزارهای الکسا، هر عبارت صوتی را که حاوی واژه بیداری باشد، شناسایی و ضبط کرده و به سرویس‌دهنده آمازون برای تشخیص صوت و اجرای فرمان ارائه شده، می‌فرستد. اما با استفاده از این سیستم جدید ساخت کارشناسان آمازون، به زودی دستیارهای صوتی چنان ارتقاء می‌یابند که دیگر به واژه بیداری هم نیازی نخواهند داشت. در این فرآیند، تشخیص عبارت‌های گفتاری، بین ۱۰ تا ۳۰ ثانیه صورت می‌گیرد.

ارسال ایمیل