Un souci avec cet outil ?

À propos de « Nettoyer Le Texte En Ligne »

Cet outil normalise un texte désordonné. Il peut écraser les espaces multiples, rogner les espaces en début/fin de ligne, supprimer les lignes vides, normaliser les fins de ligne (CR, LF, CRLF), supprimer les caractères non imprimables et remplacer les guillemets typographiques par des guillemets droits — tout cela en une passe avec les options choisies.

Utile pour les copier-coller depuis Word ou PDF (qui embarquent souvent des caractères invisibles), la normalisation de données de formulaires ou la préparation d'un texte pour un diff qui doit ignorer les différences cosmétiques.

Chaque option est indépendante, du nettoyage léger au plus strict.

Comment utiliser cet outil

Normaliser un whitespace désordonné et les caractères de contrôle

  1. Coller le texte

    Source dans « Text ». Cas typiques : texte PDF copié avec retours à la ligne bizarres ; chaînes scrapées avec espaces insécables ; messages bourrés de caractères zero-width servant de trackers.

  2. Exécuter

    Résultat : champ unique `cleaned`. Plusieurs espaces consécutifs deviennent un, des séries de sauts de ligne au plus une ligne vide, les tabulations deviennent un espace, les caractères zero-width et BOM disparaissent.

  3. Ce qui est touché ou non

    Lettres, chiffres, ponctuation classique et Unicode au-delà de l’ASCII (emoji, CJK) restent intacts. Seuls le whitespace, les codes de contrôle et les caractères invisibles de format sont normalisés.

  4. Quand NE PAS l’utiliser

    Du code source avec whitespace significatif (YAML, Python, indentation Markdown) sera corrompu — tab→espace change le sens. Des CSV où l’espace en bord représente un champ vide peuvent perdre des champs. Diff ou échantillon avant.