Sfaghiro taghisce: Difference between revisions

From rasplice
Jump to navigation Jump to search
Cesco (talk | contribs)
No edit summary
Cesco (talk | contribs)
No edit summary
Line 1: Line 1:
''strategie di inquinamento del lessico italiano''
''strategie di inquinamento del lessico italiano''


Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente.
Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. Il principio motore dell'operazione e' il teppismo gratuito.


Il tagset da usare e' [https://universaldependencies.github.io/docs/ Universal Dependencies]
Il tagset da usare e' [https://universaldependencies.github.io/docs/ Universal Dependencies]
Line 7: Line 7:
* i tags vengono espressi tramite categorie
* i tags vengono espressi tramite categorie
* le features vengono espresse tramite proprieta' SMW
* le features vengono espresse tramite proprieta' SMW


http://imgs.xkcd.com/comics/mispronouncing.png
http://imgs.xkcd.com/comics/mispronouncing.png

Revision as of 17:58, 20 November 2014

strategie di inquinamento del lessico italiano

Il progetto si propone di sostituire e disseminare testi in italiano in cui, quando possibile, i lemmi originali vengono sostituiti con lemmi rasplice che abbiano POS tagging equivalente. Il principio motore dell'operazione e' il teppismo gratuito.

Il tagset da usare e' Universal Dependencies

  • i tags vengono espressi tramite categorie
  • le features vengono espresse tramite proprieta' SMW


mispronouncing.png