امروزه به سختی می توان کسی را با دستیار صوتی غافلگیر کرد. الکسای موبایل، دستیار گوگل و سیری وجود دارد، کورتانا در ویندوز وجود دارد. اما سیستم عامل لینوکس برای مدت طولانی بدون چنین برنامه ای باقی ماند. اما اکنون ظاهر شده است - پس از 3 سال توسعه آن بود منتشر شد نسخه منتشر شده دستیار صوتی Dragonfire 1.0.
آنچه شناخته شده است
این برنامه به زبان پایتون نوشته شده و تحت مجوز MIT توزیع شده است. به توزیعهایی مبتنی بر سیستمعامل اوبونتو، از جمله نئون KDE و سیستمعامل ابتدایی نیاز دارد. نسخه موبایلی هم برای Android.
تشخیص دستورات صوتی توسط سیستم تشخیص زبان Mozilla DeepSpeech انجام می شود. این مبتنی بر پلت فرم یادگیری ماشینی TensorFlow است. سنتز با هزینه جشنواره انجام می شود. رابط پرسش/پاسخ بر اساس کتابخانه تشخیص متن به زبان طبیعی spaCy و داده های ویکی پدیا است. پاسخ ها بر اساس دیالوگ های فیلم ها (Cornell Movie-Dialogs Corpus) شکل می گیرد.
برای تجسم Dragonfire می توان یک شبح نیمه شفاف روی صفحه نمایش داد. عملکرد سیستم را نشان می دهد. دستورات صوتی به شما امکان می دهد برنامه ها را راه اندازی کنید، عبارات ریاضی را محاسبه کنید و سوالات دلخواه بپرسید. می توانید از صدای خود برای جستجو در لیست دستورات داخلی استفاده کنید.
این سیستم قادر است در حالت سرور کار کند و یک API RESTful برای ایجاد رباتهای گفتگوی گفتگو ارائه میکند. تحویل در حال حاضر یک نسخه آماده از ربات برای Twitter. سیستم مورد نیاز Dragonfire شامل کارت گرافیک با پشتیبانی از CUDA و 2 گیگابایت رم رایگان است. تشخیص گفتار نیز با استفاده از Google Speech API به جای موتور داخلی پشتیبانی میشود. این باعث صرفه جویی در منابع سیستم می شود.
چرا این لازم است؟
در ابتدا، دستیار Dragonfire به عنوان بخشی از پروژه کلاه ایمنی موتور سیکلت واقعیت افزوده Dragon Armor در حال توسعه است. با این حال، استفاده از فناوری کنترل صوتی در رایانه های شخصی معمولی نیز جالب است. بله، این روشی کمتر آشنا نسبت به ماوس است، اما چه کسی می داند، شاید در آینده Dragonfire و موارد مشابه به "ساکنان" اجباری سیستم عامل تبدیل شوند.
بنابراین، حق با افراد فوق العاده بود، به زودی می توان با یک دستیار مجازی مانند یک فرد عادی صحبت کرد.
منبع: GitHub