Un souci avec cet outil ?

À propos de « Supprimer Les Balises HTML En Ligne »

Cet outil supprime toutes les balises HTML d'un document, ne laissant que le texte brut. Il gère correctement les balises imbriquées et auto-fermantes, les commentaires, les blocs script et style (supprimés avec leur contenu) et décode les entités HTML.

Utile pour ne récupérer que les mots d'une page web, préparer du texte e-mail ou SMS à partir d'HTML, alimenter un outil aval qui attend du texte brut, ou nettoyer du rich text utilisateur avant stockage.

Options : conserver les sauts de ligne des éléments de bloc (paragraphes séparés) et garder certaines balises comme <a> ou <strong> pour un balisage partiel.

Comment utiliser cet outil

Extraire du texte brut depuis du HTML en supprimant toutes les balises

  1. Coller le HTML

    HTML (page complète ou fragment) dans « HTML ». Les balises comme `<p>`, `<a href="…">`, `<br>` sont nettoyées, le texte entre elles reste. Les valeurs d’attribut NE sont PAS préservées — seul le texte visible du body subsiste.

  2. Exécuter

    Résultat : champ unique `text`. Les espaces consécutifs sont compactés ; les ruptures aux frontières de blocs (`<p>`, `<div>`, `<br>`) deviennent des sauts de ligne, donnant une structure de paragraphes lisible.

  3. Ce qu’il ne gère pas

    Le contenu de `<script>` et `<style>` disparaît. Les gestionnaires d’événements inline (`onclick="…"`) partent avec l’attribut — pas de souci. Les entités comme `&amp;` sont décodées ; `&lt;` devient `<`.

  4. Quand l’utiliser

    Générer un corps d’e-mail en texte brut à partir d’un template HTML ; compter les mots d’un article publié ; nourrir un outil qui attend du texte avec du HTML riche. Pour conserver la sémantique (liens, listes), utilisez plutôt `html-to-markdown-converter`.