TIKA - API referenziata

Gli utenti possono incorporare Tika nelle loro applicazioni utilizzando la classe per facciate Tika. Ha metodi per esplorare tutte le funzionalità di Tika. Poiché è una classe di facciata, Tika astrae la complessità dietro le sue funzioni. Oltre a questo, gli utenti possono anche utilizzare le varie classi di Tika nelle loro applicazioni.

Tika Class (facciata)

Questa è la classe più importante della libreria Tika e segue il modello di progettazione della facciata. Pertanto, astrae tutte le implementazioni interne e fornisce metodi semplici per accedere alle funzionalità di Tika. La tabella seguente elenca i costruttori di questa classe insieme alle loro descrizioni.

package - org.apache.tika

class - Tika

Sr.No. Costruttore e descrizione
1

Tika ()

Utilizza la configurazione predefinita e costruisce la classe Tika.

2

Tika (Detector detector)

Crea una facciata Tika accettando l'istanza del rivelatore come parametro

3

Tika (Detector detector, Parser parser)

Crea una facciata Tika accettando le istanze del rilevatore e del parser come parametri.

4

Tika (Detector detector, Parser parser, Translator translator)

Crea una facciata Tika accettando il rivelatore, il parser e l'istanza del traduttore come parametri.

5

Tika (TikaConfig config)

Crea una facciata Tika accettando l'oggetto della classe TikaConfig come parametro.

Metodi e descrizione

I seguenti sono i metodi importanti della classe di facciata Tika:

Sr.No. Metodi e descrizione
1

analizzareToString (File file)

Questo metodo e tutte le sue varianti analizzano il file passato come parametro e restituiscono il contenuto di testo estratto nel formato String. Per impostazione predefinita, la lunghezza di questo parametro stringa è limitata.

2

int getMaxStringLength ()

Restituisce la lunghezza massima delle stringhe restituite dai metodi parseToString.

3

vuoto setMaxStringLength (int maxStringLength)

Imposta la lunghezza massima delle stringhe restituite dai metodi parseToString.

4

Lettore parse (File file)

Questo metodo e tutte le sue varianti analizzano il file passato come parametro e restituiscono il contenuto di testo estratto sotto forma di oggetto java.io.reader.

5

Corda detect (InputStream ruscello, Metadata metadati)

Questo metodo e tutte le sue varianti accettano un oggetto InputStream e un oggetto Metadata come parametri, rileva il tipo di documento specificato e restituisce il nome del tipo di documento come oggetto String. Questo metodo astrae i meccanismi di rilevamento utilizzati da Tika.

6

Corda translate (InputStream testo, String lingua di destinazione)

Questo metodo e tutte le sue varianti accetta l'oggetto InputStream e una stringa che rappresenta la lingua in cui vogliamo che il nostro testo venga tradotto e traduce il testo dato nella lingua desiderata, tentando di rilevare automaticamente la lingua di origine.

Interfaccia parser

Questa è l'interfaccia implementata da tutte le classi parser del pacchetto Tika.

package - org.apache.tika.parser

Interface - Parser

Metodi e descrizione

Quello che segue è il metodo importante dell'interfaccia di Tika Parser:

Sr.No. Metodi e descrizione
1

parse (InputStream stream, ContentHandler handler, Metadata metadata, ParseContext context)

Questo metodo analizza il documento dato in una sequenza di eventi XHTML e SAX. Dopo l'analisi, inserisce il contenuto del documento estratto nell'oggetto della classe ContentHandler e i metadati nell'oggetto della classe Metadati.

Classe di metadati

Questa classe implementa varie interfacce come CreativeCommons, Geographic, HttpHeaders, Message, MSOffice, ClimateForcast, TIFF, TikaMetadataKeys, TikaMimeKeys, Serializable per supportare vari modelli di dati. Le tabelle seguenti elencano i costruttori e i metodi di questa classe insieme alle loro descrizioni.

package - org.apache.tika.metadata

class - Metadati

Sr.No. Costruttore e descrizione
1

Metadata()

Costruisce un nuovo metadata vuoto.

Sr.No. Metodi e descrizione
1

add (Property property, String value)

Aggiunge una proprietà di metadati / mappatura valore a un dato documento. Usando questa funzione, possiamo impostare il valore su una proprietà.

2

add (String name, String value)

Aggiunge una proprietà di metadati / mappatura valore a un dato documento. Usando questo metodo, possiamo impostare un nuovo valore di nome sui metadati esistenti di un documento.

3

String get (Property property)

Restituisce il valore (se presente) della proprietà dei metadati fornita.

4

String get (String name)

Restituisce il valore (se presente) del nome dei metadati fornito.

5

Date getDate (Property property)

Restituisce il valore della proprietà dei metadati Date.

6

String[] getValues (Property property)

Restituisce tutti i valori di una proprietà di metadati.

7

String[] getValues (String name)

Restituisce tutti i valori di un determinato nome di metadati.

8

String[] names()

Restituisce tutti i nomi degli elementi di metadati in un oggetto di metadati.

9

set (Property property, Date date)

Imposta il valore della data della proprietà dei metadati specificata

10

set(Property property, String[] values)

Imposta più valori su una proprietà dei metadati.

Classe di identificazione della lingua

Questa classe identifica la lingua del contenuto dato. Le tabelle seguenti elencano i costruttori di questa classe insieme alle loro descrizioni.

package - org.apache.tika.language

class - Identificatore della lingua

Sr.No. Costruttore e descrizione
1

LanguageIdentifier (LanguageProfile profile)

Crea un'istanza dell'identificatore della lingua. Qui devi passare un oggetto LanguageProfile come parametro.

2

LanguageIdentifier (String content)

Questo costruttore può creare un'istanza di un identificatore di lingua passando una stringa dal contenuto di testo.

Sr.No. Metodi e descrizione
1

String getLanguage ()

Restituisce la lingua data all'oggetto LanguageIdentifier corrente.