Lucene kuromoji

The kuromoji (http://www.atilika.org/) Japanese parser integrated in Lucene (http://lucene.apache.org/core/) seems much better than MeCab (https://code.google.com/p/mecab/) in every respect, in particular:

  • it is a Java library distributed with Apache v2 license and so can be directly integrated in java tools
  • It is part of a widely used software product and so should be well mainteined

I am thinking to drop support to MeCab usage

Annunci

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione / Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione / Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione / Modifica )

Google+ photo

Stai commentando usando il tuo account Google+. Chiudi sessione / Modifica )

Connessione a %s...