این ابزار درست کار نمی‌کند؟

دربارهٔ ابزار «استخراج لینک از متن آنلاین»

این ابزار هر متنی را اسکن می‌کند و هر URL یافت شده را استخراج می‌کند. محتوا را از یک گزارش چت، سند، منبع HTML یا ایمیل جای‌گذاری کنید، و ابزار لیست بدون تکرار و آماده برای کپی از پیوندها برمی‌گرداند.

تطبیق الگو HTTP، HTTPS، FTP و سایر پروتکل‌های رایج، و همچنین ارجاعات دامنه ساده مانند «example.com» در صورت انتخاب را تشخیص می‌دهد. هر پیوند منحصربه‌فرد یک بار در خروجی ظاهر می‌شود.

برای ممیزی پیوندها در یک سند طولانی، جمع‌آوری مراجع از یک مقاله تحقیقاتی، ساختن لیستی از سایت‌های ذکر شده از یک تاریخچه چت، یا تجزیه و تحلیل بخش‌های نظر برای پیوندهای اسپم مفید است.

چطور از این ابزار استفاده کنم؟

چطور URLها را از یک block متن دلخواه بیرون بکشم؟

  1. متن را بچسبانید

    source را در فیلد «Text» قرار دهید. ابزار به دنبال پیشوندهای `http://` و `https://` می‌گردد؛ ذکرهای bare-domain مانند `example.com` match نمی‌شوند چون مبهم هستند.

  2. «اجرا» را بزنید

    خروجی `urls` (آرایه‌ای از URL‌های متمایز یافت‌شده) و `count` (طول) را برمی‌گرداند. duplicate‌ها به ترتیب اولین ظهور حذف می‌شوند. URL‌هایی که به `.`، `,`، `)` یا `]` ختم می‌شوند، نقطه‌گذاری پایانی trim می‌شود تا پایان‌های paragraph match را آلوده نکنند.

  3. آنچه regex می‌گیرد

    فرم‌های استاندارد `scheme://host/path?query#fragment`. پارامترهای tracking، fragment‌ها و port‌ها حفظ می‌شوند. hostname‌های non-ASCII (`https://例え.jp`) کار می‌کنند؛ path‌های URL-encoded verbatim عبور می‌کنند — بدون decoding.

  4. آنچه نمی‌گیرد

    URL‌های FTP/file/mailto/data (فقط http/https)، ارجاعات bare-domain، و URL‌هایی که با newline ولگرد در خطوط split شده‌اند. برای پروتکل‌های exotic‌تر، متن را pre-process کنید تا `https://` به هر domain که برایتان مهم است اضافه کنید.