Liviu P. Dinu, lector al Facultăţii de Matematică şi Informatică din Bucureşti, a descoperit o formulă, ce ar putea revoluţiona modul în care sunt comparate diferite limbi, texte sau chiar lanţuri ADN. Cu ajutorul algoritmului distanţei rank, Liviu P. Dinu a ajuns la concluzia că, deşi limbile derivate din latină sunt foarte apropiate de limba română, paradoxal, limba noastră este, în acelaşi timp, şi cea mai depărtată de acestea. Cu alte cuvinte, profesorul, în vârstă de 37 de ani, a demonstrat ştiinţific că pentru români este foarte uşor să înveţe italiana sau spaniola, iar pentru italieni sau spanioli, româna înseamnă multă bătaie de cap. „Am comparat primele 500 de silabe, cele mai folosite de cei care vorbesc româna, franceza, spaniola, portugheza, italiana, catalana şi latina.
Întâi, am comparat româna cu celelalte 6 limbi romanice şi, după primele 200 de silabe, cea mai apropiată limbă părea a fi italiana, ce se diferenţia net de celelalte limbi. Apoi, până la finalul clasamentului, italiana pierde teren, mai ales în favoarea portughezei, ce pare să fie , până la urmă, cea mai apropiată de română. Asta înseamnă că un român prinde foarte repede lexicul de bază al italienei, dar cu cât aprofundează mai mult limba italiană, cu atât îi va fi mai greu. În schimb, dacă învaţă portugheza, îi va fi ceva mai greu la început dar, ulterior, nu va mai avea dificultăţi serioase.“
Algoritmul ce depistează plagiatul
Datorită faptului că algoritmul distanţei rank contorizează diferenţele de poziţie ale literelor din două cuvinte, algoritmul distanţei rank poate fi aplicat cu succes şi în compararea a două lucrări scrise, pentru a identifica autorul unui text cu paternitate controversată. Astfel, respectiva teorie, aplicată printre altele şi în domeniul biologiei, poate verifica dacă un text este plagiat sau nu. „Împreună cu colegul meu, Marius Popescu, am experimentat pe sute de texte scrise în limba engleză şi am avut cele mai bune rezultate raportate din lume. După cât se pare, fiecare autor are o amprentă literară unică, dată de modul în care îşi gestionează cuvintele de legătură.
Aplic formula, după ce văd cum apar cuvintele funcţionale şi ce clasament are fiecare scriitor, iar textele se grupează automat pe autori“, ne-a explicat profesorul Dinu, al cărui următor proiect este să testeze dacă cele peste 100 de lucrări cu paternitate controversată, atribuite lui Eminescu, au fost sau nu scrise de către poet. Pentru cele patru articole ce au fost scrise în anul 2005, dintre care trei sunt cotate ISI, reunite sub numele de „Rank Distance in Computational Linguistics”, Liviu P. Dinu va fi premiat astăzi de Academia Română cu distincţia „Grigore Moisil“.
Supliment SCOALA – Gandul
» Comenteaza articolul






















RSS studente


































