Znanstveniki So Usposobili Nevronsko Mrežo Za Določitev Spola Osebe Iz Napisanega Besedila - Alternativni Pogled

Znanstveniki So Usposobili Nevronsko Mrežo Za Določitev Spola Osebe Iz Napisanega Besedila - Alternativni Pogled
Znanstveniki So Usposobili Nevronsko Mrežo Za Določitev Spola Osebe Iz Napisanega Besedila - Alternativni Pogled

Video: Znanstveniki So Usposobili Nevronsko Mrežo Za Določitev Spola Osebe Iz Napisanega Besedila - Alternativni Pogled

Video: Znanstveniki So Usposobili Nevronsko Mrežo Za Določitev Spola Osebe Iz Napisanega Besedila - Alternativni Pogled
Video: cellF 2024, Maj
Anonim

Skupina znanstvenikov Nacionalne raziskovalne jedrske univerze "MEPhI", Nacionalnega raziskovalnega centra "Kurchatov inštitut" in Voronješke državne univerze je razvila metodo, ki računalnik uči prepoznati spol osebe iz besedila, ki ga je napisal z natančnostjo 80 odstotkov. Znanstveni razvoj spada v področje računalniške jezikoslovja. Raziskava je bila izvedena s štipendijo Ruske znanstvene fundacije. Rezultati so objavljeni v reviji Procedia Computer Science.

Številne znanstvene študije kažejo, da pisno besedilo neizogibno odraža značilnosti njegovega avtorja - spol, psihološke značilnosti, stopnjo izobrazbe. Govor je dragoceno psihodiagnostično orodje, ki ga uporabljajo kadrovski strokovnjaki velikih podjetij, pa tudi varnostne službe.

Na podlagi analize govora je mogoče diagnosticirati prisotnost določenih bolezni pri osebi (demenca, depresija) in nagnjenost k samomorilnemu vedenju. Potreba po določitvi značilnosti avtorja besedila raste tudi z razvojem internetnih komunikacij: za podjetja je pomembno vedeti, katere skupine ljudi imajo radi svoje izdelke in storitve.

Znanstveniki, ki delujejo v tej smeri (jezikoslovci, psihologi, strokovnjaki za informacijsko tehnologijo), na osnovi številskih vrednosti različnih parametrov besedila gradijo matematične modele za diagnosticiranje določenih osebnostnih parametrov.

Skupina strokovnjakov je analizirala učinkovitost različnih tehnologij strojnega učenja s pomočjo nevronskih mrež za analizo besedila.

Med študijo so primerjali natančnost reševanja problema identifikacije besedil na podlagi spola na podlagi dveh pristopov k modeliranju na osnovi podatkov: na eni strani algoritme strojnega učenja (podporni vektorski stroj in povečanje gradientov), na drugi strani globoko učenje nevronskih mrež (konvolucionarne nevronske mreže in ponavljajoče se nevronske mreže z dolgoročnim spominom).

»Dosegli smo visoke rezultate pri določanju spola avtorja besedila zahvaljujoč naprednim modelom nevronske mreže, v pogojih, ko avtor ne skriva svojega spola. Naslednja naloga je določiti spol v smislu njegovega namernega prikrivanja, «pravi Aleksander Sboev, izredni profesor na NRNU MEPhI.

Torej v naslednjih besedilih, sprva objavljenih na spletnem mestu za zmenke, nevronska mreža zlahka najde ulov v desetih od desetih primerov, poleg tega pa avtor namerno v podpis navede ime nasprotnega spola.

Promocijski video:

Besedilo je napisala deklica: "Sem čeden, mišičav moški, star 30 let. Delam za veliko naftno in plinsko podjetje v dobrem položaju z dostojno plačo. Živim v svojem stanovanju v Moskvi. Posestvo ima tudi majhno, a lepo hišo v eni od vasi v Italiji. Obožujem šport, predvsem nogomet. Zelo rad hodim za vikend, sovražim bivanje doma. Dekle, ki bi mi ustrezalo, bi moralo biti po modernih merilih skromne razporeditve, dobrega videza in privlačne figure. Morala bi si deliti moje interese, ne bi smela biti ljubosumna in se ne bi smela truditi, da bi se počutila ljubosumna. Deklice ne bom podpiral, ker verjamem, da bi v družini morala delati oba. Raje tudi raje vodim proračun ločeno. Ne bom prenašal izdaje."

Besedilo je napisal moški: "Pozdravljeni! Sem izjemno nesrečen, izjemno! Zakaj se tako obnašate z nami ?! Tudi mi smo ljudje, vsi smo enaki! Ste seksist? Tega ne bom več sprejel! Vaš avto bom razbil po vsem, ga poslikal. Počakaj, nečloveško. Tako bom končal."

Rezultati te študije so pokazali, da je najbolj optimalen pristop, ki temelji na uporabi konvolucijskih nevronskih mrež in metod globokega učenja za prepoznavanje spola osebe, ki je napisala besedilo.

Zdaj skupina raziskovalcev deluje na problematiki prepoznavanja starosti.