Umetna Inteligenca Se Je Naučila Pravilno Prepoznavati Govor Med Hrupom - Alternativni Pogled

Umetna Inteligenca Se Je Naučila Pravilno Prepoznavati Govor Med Hrupom - Alternativni Pogled
Umetna Inteligenca Se Je Naučila Pravilno Prepoznavati Govor Med Hrupom - Alternativni Pogled

Video: Umetna Inteligenca Se Je Naučila Pravilno Prepoznavati Govor Med Hrupom - Alternativni Pogled

Video: Umetna Inteligenca Se Je Naučila Pravilno Prepoznavati Govor Med Hrupom - Alternativni Pogled
Video: OBVEZNO CIJEPLJENJE? Narod vam neće dopustiti‼️ 2024, Maj
Anonim

Navidezni pomočniki in sistemi za prepoznavanje glasu so se naučili "prepoznati", kaj jim oseba reče, in slediti njegovim ukazom. Toda za pravilno delovanje istih Siri in Cortane je lahko zunanji hrup velik problem. Pri soočanju s to tehnično pomanjkljivostjo lahko pomagajo strokovnjaki iz Mitsubishi Electric, ki so predstavili novo tehnologijo za ločevanje govora ene osebe od splošnega hrupa.

Tehnologija japonskega podjetja se imenuje Deep Clustering, katere delovanje je zgrajeno na načelih strojnega učenja. Za začetek se je umetna inteligenca naučila samostojno ločevati govor ene osebe od splošnega toka različnih zvokov in hrupa. Nevronska mreža loči dohodne zvočne podatke v različne elemente in analizira vsakega posebej, nakar lahko že obdela človeški glas. Podobno delo opazimo, ko sta dva ali več sogovornikov "povezana".

Med predstavitvijo tehnologije japonskega podjetja je sistem lahko uspešno ločil govor dveh ljudi, ki govorijo isti stavek v različnih jezikih, v en mikrofon. Vsa obdelava je bila izvedena v realnem času, zamuda pa ni presegla treh sekund. Natančnost prepoznavanja je znašala 90 odstotkov in ko so trije ljudje začeli govoriti v mikrofon, je odstotek "zadetkov" padel na 80, kar je tudi dober rezultat. Po besedah avtorjev projekta Anthony Vetro in Yohei Okato sta dr.

"Za razliko od ločevanja govora od hrupa v ozadju je ločitev govora ene osebe od" glasovnega "hrupa ljudi, ki hkrati govorijo, zelo težka naloga, saj imajo zvoki glasu različnih ljudi številne posebnosti. V večini sistemov težavo ločevanja glasu rešujejo z namestitvijo dveh ali več mikrofonov, v primeru uporabe samo enega mikrofona pa lahko le umetna inteligenca opravi nalogo ločevanja glasu. Ta tehnologija se lahko uporablja tam, kjer je potrebna visoka natančnost prepoznavanja govornih sporočil. Na primer v sistemih za govorni nadzor za avtomobile, dvigala, gospodinjske in druge elektronske naprave."

VLADIMIR KUZNETSOV