Stimmt etwas mit diesem Tool nicht?

Über „URLs Aus Text Online“

Dieses Tool durchsucht beliebigen Text und extrahiert jede gefundene URL. Inhalte aus Chats, Dokumenten, HTML oder E-Mails einfügen — und Sie erhalten eine deduplizierte, kopierbereite Liste.

Erkannt werden HTTP, HTTPS, FTP und andere gängige Protokolle, optional auch nackte Domains wie „example.com". Doppelte URLs erscheinen nur einmal.

Hilfreich beim Auditieren von Links in langen Dokumenten, Sammeln von Referenzen aus Papern, Aufbereiten erwähnter Sites aus Chats oder Analyse von Spam-Links in Kommentaren.

So nutzt du dieses Tool

URLs aus einem beliebigen Textblock herausziehen

  1. Text einfügen

    Quelle ins Feld «Text». Das Tool sucht nach `http://`- und `https://`-Präfixen; nackte Domains wie `example.com` matchen nicht, weil sie mehrdeutig sind.

  2. Ausführen

    Ergebnis: `urls` (Array eindeutiger Treffer) und `count` (Länge). Duplikate werden nach Erstauftreten entfernt. URLs, die auf `.`, `,`, `)` oder `]` enden, werden um die abschließende Interpunktion gekürzt, damit Absatzenden den Treffer nicht verunreinigen.

  3. Was die Regex erfasst

    Standardformen `scheme://host/path?query#fragment`. Tracking-Parameter, Fragmente und Ports bleiben. Non-ASCII-Hostnames (`https://例え.jp`) gehen; URL-codierte Pfade laufen wörtlich durch, ohne Decoding.

  4. Was nicht erfasst wird

    FTP/file/mailto/data-URLs (nur http/https), nackte Domains und URLs, die durch versehentliche Zeilenumbrüche zerschnitten sind. Für exotische Protokolle den Text vorab präparieren und gewünschten Domains ein `https://` voranstellen.