Sfaghiro taghisce: Difference between revisions
Jump to navigation
Jump to search
No edit summary |
No edit summary |
||
(5 intermediate revisions by the same user not shown) | |||
Line 1: | Line 1: | ||
''strategie di inquinamento del lessico italiano'' | ''strategie di inquinamento del lessico italiano'' | ||
http://imgs.xkcd.com/comics/mispronouncing.png | |||
Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. Il principio motore dell'operazione e' il teppismo gratuito. | Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. Il principio motore dell'operazione e' il teppismo gratuito. | ||
Line 5: | Line 7: | ||
Il tagset da usare e' [https://universaldependencies.github.io/docs/ Universal Dependencies] | Il tagset da usare e' [https://universaldependencies.github.io/docs/ Universal Dependencies] | ||
* i tags vengono espressi tramite categorie | * i tags vengono espressi tramite [[:Category:Tags|categorie]] | ||
* le features vengono espresse tramite | * le features vengono espresse tramite [[:Category:Features|proprieta']] | ||
Latest revision as of 18:09, 29 June 2015
strategie di inquinamento del lessico italiano
Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. Il principio motore dell'operazione e' il teppismo gratuito.
Il tagset da usare e' Universal Dependencies
- i tags vengono espressi tramite categorie
- le features vengono espresse tramite proprieta'