Comment lire le contenu d’un fichier PDF en Java

Pour lire un fichier pdf existant en utilisant le jar iText, commencez par télécharger les fichiers jar iText et les inclure dans le chemin d’accès aux classes de l’application.

QCM-JavaQCM Java – Programmation Orientée ObjetQCM sur Java avec des réponses pour la préparation des entretiens d’embauche, des tests en ligne, aux examens et aux certifications. Ces questions et réponses…Lire plus

 

Les étapes:

1. Créez une instance PdfReader.
2. Récupérer le nombre de pages en pdf.
3. Itérer le pdf à travers les pages.
4. Extraire le contenu de la page à l’aide de PdfTextExtractor.
5. Afficher le contenu de la page sur la console.
6. Fermez le PdfReader.

Exemple:
import com.itextpdf.text.pdf.*;
import com.itextpdf.text.pdf.PdfReader;
import com.itextpdf.text.pdf.parser.PdfTextExtractor;


public class PDFClasse {
  public static void main(String args[]){
    try 
    {
        //Créer une instance PdfReader.
        PdfReader pdf = new PdfReader("C:\\my.pdf");	
	 
        //Récupérer le nombre de pages en pdf.
        int nbrPages = pdf.getNumberOfPages(); 
	 
        //Itérer le pdf à travers les pages.
        for(int i=1; i <= nbrPages; i++) 
        { 
            //Extraire le contenu de la page à l'aide de PdfTextExtractor.
            String content = PdfTextExtractor.getTextFromPage(pdf, i);
	 
            //Afficher le contenu de la page sur la console.
            System.out.println("Contenu du page : " + content);
        }
	 
        //Fermez le PdfReader.
        pdf.close();
	  
    } catch (Exception ex) {
	      ex.printStackTrace();
    }
  }
}

 

Partagez cet article

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *