Lucene - Analizzatore

La classe Analyzer ha il compito di analizzare un documento e ottenere i token / parole dal testo che deve essere indicizzato. Senza analisi =, IndexWriter non può creare index.

Dichiarazione di classe

Di seguito è riportata la dichiarazione per il org.apache.lucene.analysis.Analyzer classe -

public abstract class Analyzer
   extends Object
      implements Closeable

Costruttori di classi

La tabella seguente mostra un costruttore di classi:

S.No. Costruttore e descrizione
1

protected Analyzer()

Metodi di classe

La tabella seguente mostra i diversi metodi di classe:

S.No. Metodo e descrizione
1

void close()

Libera le risorse persistenti utilizzate dall'Analyzer.

2

int getOffsetGap(Fieldable field)

È simile a getPositionIncrementGap (java.lang.String), ad eccezione degli offset dei token.

3

int getPositionIncrementGap(String fieldName)

Viene richiamato prima di indicizzare un file Fieldable istanza se i termini sono già stati aggiunti a quel campo.

4

protected Object getPreviousTokenStream()

Utilizzato dagli analizzatori che implementano TokenStream riutilizzabili per recuperare TokenStream salvati in precedenza per il riutilizzo da parte dello stesso thread.

5

TokenStream reusableTokenStream(String fieldName, Reader reader)

Crea un TokenStream che può essere riutilizzato dalla volta precedente in cui lo stesso thread ha chiamato questo metodo.

6

protected void setPreviousTokenStream(Object obj)

Utilizzato dagli analizzatori che implementano reusableTokenStream per salvare un TokenStream per un successivo riutilizzo dallo stesso thread.

7

abstract TokenStream tokenStream(String fieldName, Reader reader)

Crea un TokenStream che tokenizza tutto il testo nel Reader fornito.

Metodi ereditati

Questa classe eredita i metodi dalle seguenti classi:

  • java.lang.Object

Questo analizzatore divide il testo in un documento in base agli spazi.