Manapság nehéz meglepni valakit hangsegéddel. Van mobil Alexa, Google Assistant és Siri, van Cortana Windowson. De a Linux operációs rendszer hosszú ideig ilyen alkalmazás nélkül maradt. De most megjelent – 3 év fejlesztés után meg is volt kiadták a Dragonfire hangsegéd 1.0 kiadású verziója.
Ami ismert
A program Python nyelven íródott, és MIT licenc alatt terjesztik. Ehhez Ubuntu operációs rendszeren alapuló disztribúciók szükségesek, beleértve a KDE neon és az elemi operációs rendszert is. Mobil verziója is létezik Android.
A hangutasítások felismerését a Mozilla DeepSpeech nyelvfelismerő rendszer végzi. A TensorFlow gépi tanulási platformon alapul. A szintézis a Fesztivál költségére történik. A kérdés/válasz felület a spaCy természetes nyelvű szövegfelismerő könyvtáron és a Wikipédia adatain alapul. A válaszok filmek párbeszédei alapján alakulnak ki (Cornell Movie-Dialogs Corpus).
A képernyőn egy áttetsző sziluett jeleníthető meg a Dragonfire megjelenítéséhez. A rendszer működését mutatja. A hangutasítások lehetővé teszik alkalmazások indítását, matematikai kifejezések kiszámítását és tetszőleges kérdések feltevését. Hangjával kereshet a beépített parancsok listájában.
A rendszer képes szerver módban dolgozni, RESTful API-t biztosítva párbeszédes chatbotok létrehozásához. A szállítmány már rendelkezik a bot kész verziójával Twitter. A Dragonfire rendszerkövetelményei között szerepel egy CUDA-támogatással rendelkező videokártya és 2 GB szabad RAM. A beszédfelismerést a Google Speech API is támogatja, nem pedig a beépített motor. Ezzel a rendszer erőforrásait takaríthatja meg.
Miért van erre szükség?
Kezdetben a Dragonfire asszisztenst a Dragon Armor kiterjesztett valóságú motoros sisak projekt részeként fejlesztik. A hangvezérlési technológia használata azonban a hétköznapi PC-ken is érdekes. Igen, ez kevésbé ismert módszer, mint az egér, de ki tudja, lehet, hogy a jövőben a Dragonfire és hasonlók az operációs rendszerek kötelező "lakói" lesznek.
Így igazuk volt a fantasztikus embereknek, hamarosan egy virtuális asszisztenssel lehet majd úgy beszélni, mint egy normális ember.
Forrás: GitHub