Martin Kováčik

Diploma Thesis (in Slovak)

Cieľom diplomového projektu je vytvorenie rámcového systému na porovnávanie dokumentov a určenie podobností. Predpokladá sa aplikácia v prostredí softvérového nástroja Cluster Navigator, ktorý sa vyvíja v rámci výskumného projektu. Prehľad problematiky uvádza viacero metód, avšak ich aplikácia nie je univerzálna, teda jednotlivé metódy sú doménovo špecifické. Výskumným zámerom je návrh, implementácia a overenie prístupov, ktoré umožnia učenie a ohodnocovanie podobnosti dokumentov.

Výstupy projektu

Použité zdroje

  • University of Princeton: Wordnet, URL: http://wordnet.princeton.edu/
  • Patwardhan, S., Pedersen, T.: Using WordNet-based Context Vectors to Estimate the Semantic Relatedness of Concepts, Proceedings of the EACL 2006 Workshop Making Sense of Sense - Bringing Computational Linguistics and Psycholinguistics Together, April 4, 2006, Trento, Italy