Un souci avec cet outil ?
À propos de « Extraire Les Liens En Ligne »
Cet outil scanne un texte et extrait toutes les URL qu'il y trouve. Collez un log de chat, un document, du HTML ou un e-mail, et l'outil renvoie une liste dédupliquée prête à copier.
Reconnaît HTTP, HTTPS, FTP et autres protocoles courants ; en option, les domaines nus comme « example.com ». Chaque URL unique n'apparaît qu'une fois.
Utile pour auditer les liens d'un long document, rassembler les références d'un papier, lister les sites cités dans un chat, ou analyser les commentaires pour les liens spam.
Comment utiliser cet outil
Extraire les URL d’un bloc de texte quelconque
Coller le texte
Source dans « Text ». L’outil cherche les préfixes `http://` et `https://` ; les mentions de domaine seul comme `example.com` ne matchent pas car ambiguës.
Exécuter
Résultat : `urls` (tableau d’URL uniques trouvées) et `count` (longueur). Dédoublonné selon la première apparition. Les URL se terminant par `.`, `,`, `)` ou `]` perdent la ponctuation finale pour que les fins de paragraphe ne polluent pas le match.
Ce que la regex capture
Les formes standard `scheme://host/path?query#fragment`. Paramètres de tracking, fragments et ports sont préservés. Les hostnames non-ASCII (`https://例え.jp`) passent ; les chemins URL-encodés passent inchangés sans décodage.
Ce qu’elle ne capture pas
FTP/file/mailto/data-URLs (http/https uniquement), domaines nus et URLs coupées par un retour à la ligne. Pour des protocoles exotiques, prétraitez le texte en ajoutant `https://` à chaque domaine d’intérêt.