Comment lire le contenu d’un fichier PDF en Java
Pour lire un fichier pdf existant en utilisant le jar iText, commencez par télécharger les fichiers jar iText et les inclure dans le chemin d’accès aux classes de l’application.
Les étapes:
1. Créez une instance PdfReader.
2. Récupérer le nombre de pages en pdf.
3. Itérer le pdf à travers les pages.
4. Extraire le contenu de la page à l’aide de PdfTextExtractor.
5. Afficher le contenu de la page sur la console.
6. Fermez le PdfReader.
Exemple:
import com.itextpdf.text.pdf.*; import com.itextpdf.text.pdf.PdfReader; import com.itextpdf.text.pdf.parser.PdfTextExtractor; public class PDFClasse { public static void main(String args[]){ try { //Créer une instance PdfReader. PdfReader pdf = new PdfReader("C:\\my.pdf"); //Récupérer le nombre de pages en pdf. int nbrPages = pdf.getNumberOfPages(); //Itérer le pdf à travers les pages. for(int i=1; i <= nbrPages; i++) { //Extraire le contenu de la page à l'aide de PdfTextExtractor. String content = PdfTextExtractor.getTextFromPage(pdf, i); //Afficher le contenu de la page sur la console. System.out.println("Contenu du page : " + content); } //Fermez le PdfReader. pdf.close(); } catch (Exception ex) { ex.printStackTrace(); } } }