Sfaghiro taghisce: Difference between revisions
Jump to navigation
Jump to search
No edit summary |
No edit summary |
||
Line 1: | Line 1: | ||
''strategie di inquinamento del lessico italiano'' | ''strategie di inquinamento del lessico italiano'' | ||
Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. | Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. Il principio motore dell'operazione e' il teppismo gratuito. | ||
Il tagset da usare e' [https://universaldependencies.github.io/docs/ Universal Dependencies] | Il tagset da usare e' [https://universaldependencies.github.io/docs/ Universal Dependencies] | ||
Line 7: | Line 7: | ||
* i tags vengono espressi tramite categorie | * i tags vengono espressi tramite categorie | ||
* le features vengono espresse tramite proprieta' SMW | * le features vengono espresse tramite proprieta' SMW | ||
http://imgs.xkcd.com/comics/mispronouncing.png | http://imgs.xkcd.com/comics/mispronouncing.png |
Revision as of 17:58, 20 November 2014
strategie di inquinamento del lessico italiano
Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. Il principio motore dell'operazione e' il teppismo gratuito.
Il tagset da usare e' Universal Dependencies
- i tags vengono espressi tramite categorie
- le features vengono espresse tramite proprieta' SMW