TIKA - API referenziata
Gli utenti possono incorporare Tika nelle loro applicazioni utilizzando la classe per facciate Tika. Ha metodi per esplorare tutte le funzionalità di Tika. Poiché è una classe di facciata, Tika astrae la complessità dietro le sue funzioni. Oltre a questo, gli utenti possono anche utilizzare le varie classi di Tika nelle loro applicazioni.
Tika Class (facciata)
Questa è la classe più importante della libreria Tika e segue il modello di progettazione della facciata. Pertanto, astrae tutte le implementazioni interne e fornisce metodi semplici per accedere alle funzionalità di Tika. La tabella seguente elenca i costruttori di questa classe insieme alle loro descrizioni.
package - org.apache.tika
class - Tika
Sr.No. | Costruttore e descrizione |
---|---|
1 | Tika () Utilizza la configurazione predefinita e costruisce la classe Tika. |
2 | Tika (Detector detector) Crea una facciata Tika accettando l'istanza del rivelatore come parametro |
3 | Tika (Detector detector, Parser parser) Crea una facciata Tika accettando le istanze del rilevatore e del parser come parametri. |
4 | Tika (Detector detector, Parser parser, Translator translator) Crea una facciata Tika accettando il rivelatore, il parser e l'istanza del traduttore come parametri. |
5 | Tika (TikaConfig config) Crea una facciata Tika accettando l'oggetto della classe TikaConfig come parametro. |
Metodi e descrizione
I seguenti sono i metodi importanti della classe di facciata Tika:
Sr.No. | Metodi e descrizione |
---|---|
1 | analizzareToString (File file) Questo metodo e tutte le sue varianti analizzano il file passato come parametro e restituiscono il contenuto di testo estratto nel formato String. Per impostazione predefinita, la lunghezza di questo parametro stringa è limitata. |
2 | int getMaxStringLength () Restituisce la lunghezza massima delle stringhe restituite dai metodi parseToString. |
3 | vuoto setMaxStringLength (int maxStringLength) Imposta la lunghezza massima delle stringhe restituite dai metodi parseToString. |
4 | Lettore parse (File file) Questo metodo e tutte le sue varianti analizzano il file passato come parametro e restituiscono il contenuto di testo estratto sotto forma di oggetto java.io.reader. |
5 | Corda detect (InputStream ruscello, Metadata metadati) Questo metodo e tutte le sue varianti accettano un oggetto InputStream e un oggetto Metadata come parametri, rileva il tipo di documento specificato e restituisce il nome del tipo di documento come oggetto String. Questo metodo astrae i meccanismi di rilevamento utilizzati da Tika. |
6 | Corda translate (InputStream testo, String lingua di destinazione) Questo metodo e tutte le sue varianti accetta l'oggetto InputStream e una stringa che rappresenta la lingua in cui vogliamo che il nostro testo venga tradotto e traduce il testo dato nella lingua desiderata, tentando di rilevare automaticamente la lingua di origine. |
Interfaccia parser
Questa è l'interfaccia implementata da tutte le classi parser del pacchetto Tika.
package - org.apache.tika.parser
Interface - Parser
Metodi e descrizione
Quello che segue è il metodo importante dell'interfaccia di Tika Parser:
Sr.No. | Metodi e descrizione |
---|---|
1 | parse (InputStream stream, ContentHandler handler, Metadata metadata, ParseContext context) Questo metodo analizza il documento dato in una sequenza di eventi XHTML e SAX. Dopo l'analisi, inserisce il contenuto del documento estratto nell'oggetto della classe ContentHandler e i metadati nell'oggetto della classe Metadati. |
Classe di metadati
Questa classe implementa varie interfacce come CreativeCommons, Geographic, HttpHeaders, Message, MSOffice, ClimateForcast, TIFF, TikaMetadataKeys, TikaMimeKeys, Serializable per supportare vari modelli di dati. Le tabelle seguenti elencano i costruttori e i metodi di questa classe insieme alle loro descrizioni.
package - org.apache.tika.metadata
class - Metadati
Sr.No. | Costruttore e descrizione |
---|---|
1 | Metadata() Costruisce un nuovo metadata vuoto. |
Sr.No. | Metodi e descrizione |
---|---|
1 | add (Property property, String value) Aggiunge una proprietà di metadati / mappatura valore a un dato documento. Usando questa funzione, possiamo impostare il valore su una proprietà. |
2 | add (String name, String value) Aggiunge una proprietà di metadati / mappatura valore a un dato documento. Usando questo metodo, possiamo impostare un nuovo valore di nome sui metadati esistenti di un documento. |
3 | String get (Property property) Restituisce il valore (se presente) della proprietà dei metadati fornita. |
4 | String get (String name) Restituisce il valore (se presente) del nome dei metadati fornito. |
5 | Date getDate (Property property) Restituisce il valore della proprietà dei metadati Date. |
6 | String[] getValues (Property property) Restituisce tutti i valori di una proprietà di metadati. |
7 | String[] getValues (String name) Restituisce tutti i valori di un determinato nome di metadati. |
8 | String[] names() Restituisce tutti i nomi degli elementi di metadati in un oggetto di metadati. |
9 | set (Property property, Date date) Imposta il valore della data della proprietà dei metadati specificata |
10 | set(Property property, String[] values) Imposta più valori su una proprietà dei metadati. |
Classe di identificazione della lingua
Questa classe identifica la lingua del contenuto dato. Le tabelle seguenti elencano i costruttori di questa classe insieme alle loro descrizioni.
package - org.apache.tika.language
class - Identificatore della lingua
Sr.No. | Costruttore e descrizione |
---|---|
1 | LanguageIdentifier (LanguageProfile profile) Crea un'istanza dell'identificatore della lingua. Qui devi passare un oggetto LanguageProfile come parametro. |
2 | LanguageIdentifier (String content) Questo costruttore può creare un'istanza di un identificatore di lingua passando una stringa dal contenuto di testo. |
Sr.No. | Metodi e descrizione |
---|---|
1 | String getLanguage () Restituisce la lingua data all'oggetto LanguageIdentifier corrente. |