Apache POI Word - Panoramica

Molte volte, è necessaria un'applicazione software per generare documenti di riferimento in formato file Microsoft Word. A volte, un'applicazione dovrebbe persino ricevere file di Word come dati di input.

Qualsiasi programmatore Java che desidera produrre file MS-Office come output deve utilizzare un'API predefinita e di sola lettura per farlo.

Cos'è Apache POI?

Apache POI è un'API popolare che consente ai programmatori di creare, modificare e visualizzare file MS-Office utilizzando programmi Java. È una libreria open source sviluppata e distribuita da Apache Software Foundation per progettare o modificare file MS-Office utilizzando il programma Java. Contiene classi e metodi per decodificare i dati di input dell'utente o un file in documenti MS-Office.

Componenti di Apache POI

Apache POI contiene classi e metodi per lavorare su tutti i documenti OLE2 Compound di MS-Office. Di seguito è riportato l'elenco dei componenti di questa API:

  • POIFS (Poor Obfuscation Implementation File System)- Questo componente è il fattore di base di tutti gli altri elementi POI. Viene utilizzato per leggere diversi file in modo esplicito.

  • HSSF (Horrible SpreadSheet Format) - Viene utilizzato per leggere e scrivere in formato .xls di file MS-Excel.

  • XSSF (XML SpreadSheet Format) - Viene utilizzato per il formato file .xlsx di MS-Excel.

  • HPSF (Horrible Property Set Format) - Viene utilizzato per estrarre i set di proprietà dei file di MS-Office.

  • HWPF (Horrible Word Processor Format) - Viene utilizzato per leggere e scrivere file con estensione .doc di MS-Word.

  • XWPF (XML Word Processor Format) - Serve per leggere e scrivere .docx file di estensione di MS-Word.

  • HSLF (Horrible Slide Layout Format) - Viene utilizzato per leggere, creare e modificare presentazioni di PowerPoint.

  • HDGF (Horrible DiaGram Format) - Contiene classi e metodi per i file binari di MS-Visio.

  • HPBF (Horrible PuBlisher Format) - Viene utilizzato per leggere e scrivere file MS-Publisher.

Questo tutorial ti guida attraverso il processo di lavoro sui file MS-Word utilizzando Java. Pertanto la discussione è limitata ai componenti HWPF e XWPF.

Note- VERSIONI VECCHIE DI FORMATI DI FILE BINARI DI SUPPORTO PER POI COME DOC, XLS, PPT, ECC. VERSIONE 3.5 IN POI, POI SUPPORTA I FORMATI DI FILE OOXML DI MS-OFFICE COME DOCX, XLSX, PPTX, ETC.