TIKA - Formati di file
Formati di file supportati da Tika
La tabella seguente mostra i formati di file supportati da Tika.
Formato del file | Libreria dei pacchetti | Classe a Tika |
---|---|---|
XML | org.apache.tika.parser.xml | XMLParser |
HTML | org.apache.tika.parser.html e utilizza la libreria Tagsoup | HtmlParser |
Documento composto MS-Office Ole2 fino al 2007 ooxml dal 2007 in poi | org.apache.tika.parser.microsoft org.apache.tika.parser.microsoft.ooxml e utilizza la libreria Apache Poi |
OfficeParser (ole2) OOXMLParser (ooxml) |
Formato OpenDocument openoffice | org.apache.tika.parser.odf | OpenOfficeParser |
formato documento portatile (PDF) | org.apache.tika.parser.pdf e questo pacchetto utilizza la libreria Apache PdfBox | PDFParser |
Formato di pubblicazione elettronica (libri digitali) | org.apache.tika.parser.epub | EpubParser |
Formato Rich Text | org.apache.tika.parser.rtf | RTFParser |
Formati di compressione e confezionamento | org.apache.tika.parser.pkg e questo pacchetto utilizza la libreria Common compress | PackageParser e CompressorParser e le sue sottoclassi |
Formato testo | org.apache.tika.parser.txt | TXTParser |
Formati di feed e syndication | org.apache.tika.parser.feed | FeedParser |
Formati audio | org.apache.tika.parser.audio e org.apache.tika.parser.mp3 | AudioParser MidiParser Mp3- per mp3parser |
Imageparsers | org.apache.tika.parser.jpeg | JpegParser: per immagini jpeg |
Videoformati | org.apache.tika.parser.mp4 e org.apache.tika.parser.video questo parser utilizza internamente Simple Algorithm per analizzare i formati video flash | Mp4parser FlvParser |
file di classe java e file jar | org.apache.tika.parser.asm | ClassParser CompressorParser |
Mobxformat (messaggi di posta elettronica) | org.apache.tika.parser.mbox | MobXParser |
Formati cad | org.apache.tika.parser.dwg | DWGParser |
FontFormats | org.apache.tika.parser.font | TrueTypeParser |
programmi eseguibili e librerie | org.apache.tika.parser.executable | ExecutableParser |