Un program ghiceşte vârsta şi sexul utilizatorilor Twitter

Persoanele în jur de 40 de ani scriu mesaje mai lungi, adolescenţilor le plac emoticoanele, iar femeile utilizează frecvent formula 'hi,hi', potrivit unor universitari olandezi care au creat un soft de analiză. Programul, care poate evalua vârsta şi sexul unui utilizator în funcţie de ce postează pe Twitter, a fost lansat de Universitatea din Twente (Olanda) şi un institut de limbă şi cultură olandeze.

14 mai 2013, 16:15
Un program ghiceşte vârsta şi sexul utilizatorilor Twitter

Pe site-ul tweetgenie.nl, lansat luni, 13 mai, este suficientă introducerea numelui utilizatorului pentru a-i evalua vârsta şi sexul. Cercetătorii au analizat aproape 3.000 de conturi Twitter, cu utilizatori identificaţi. Au stabilit apoi liste de cuvinte sau sintagme ce apar frecvent la internauţii dintr-un anumit segment de vârstă sau aparţinând unui anumit sex, arată Dong Nguyen, doctorand în informatică la Universitatea din Twente, care a participat la proiect. Ea a precizat că a fost luat în considerare doar conţinutul mesajelor şi nu, de exemplu, imaginea profilului, potrivit Agerpres.

Pentru a ghici vârsta şi sexul, programul analizează ultimele 200 de mesaje ale utilizatorului şi le compară cu baza de date stabilită de creatorii site-ului. ‘Sunt foarte clare lucrurile care îi diferenţiază pe bărbaţi de femei’, afirmă dna Nguyen. De exemplu, bărbaţii folosesc mai des cuvintele ‘fotbal’ şi ‘bere’, iar femeile, ‘unghii’ şi ‘hihi’, arată site-ul. În ceea ce priveşte vârsta, tinerii vorbesc mai des despre ei înşişi şi recurg la multe emoticoane, în timp ce persoanele mai mature utilizează cuvinte şi fraze mai lungi’, adaugă ea.

Programul are o marjă de eroare medie de patru ani, fiind mult mai precis în privinţa tinerilor decât a persoanelor mai mature, precizează creatorii lui. ‘Am observat că limbajul utilizatorilor este mai uniform de la 35 de ani’, susţine Dong Nguyen. ‘De exemplu, există mai multe diferenţe între un utilizator de 15 ani şi unul de 20 decât între un utilizator de 45 de ani şi unul de 55’, precizează ea.

Cine doreşte să i se ghicească vârsta şi sexul mai are totuşi de aşteptat fiindcă programul analizează deocamdată numai mesajele scurte în olandeză. Dong Nguyen afirmă că echipa de cercetători vrea să adapteze softul la alte limbi şi alte reţele de socializare, ca de exemplu Facebook.