Extraire une chaîne entre deux balises en Java

Les expressions régulières ou Regex est une API pour définir des patterns qui peuvent être utilisés pour rechercher, manipuler et éditer une chaîne en Java. Regex est largement utilisé pour définir des contraintes. Les expressions régulières sont fournies sous le package java.util.

Dans ce tutoriel nous allons découvrir comment extraire une chaîne entre deux balises en utilisant les expressions régulières en Java.
 
 

Exemple:
import java.util.regex.*;

public class Main 
{
  public static void main(String[]args) 
  {
      Pattern p = Pattern.compile("<balise>(.+?)</balise>", Pattern.DOTALL);
      Matcher m = p.matcher("<balise>Chaîne que je veux extraire</balise>");
      m.find();
      System.out.println(m.group(1)); 
  }
}

Sortie:

Chaîne que je veux extraire
  • (.+?) signifie n’importe quel caractère entre les deux balises spécifiés.
  • Le champ DOTALL de la classe Pattern active le mode dotall. Par défaut, le méta-caractère « . » dans les expressions régulières correspond à tous les caractères sauf les sauts de ligne. Autrement dit, lorsque vous utilisez DOTALL comme valeur d’indicateur pour la méthode compile(), le méta-caractère « . » correspond à tous les caractères, y compris les sauts de ligne.
Les expressions régulières en Java

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *