این ابزار درست کار نمیکند؟
دربارهٔ ابزار «استخراج لینک از متن آنلاین»
این ابزار هر متنی را اسکن میکند و هر URL یافت شده را استخراج میکند. محتوا را از یک گزارش چت، سند، منبع HTML یا ایمیل جایگذاری کنید، و ابزار لیست بدون تکرار و آماده برای کپی از پیوندها برمیگرداند.
تطبیق الگو HTTP، HTTPS، FTP و سایر پروتکلهای رایج، و همچنین ارجاعات دامنه ساده مانند «example.com» در صورت انتخاب را تشخیص میدهد. هر پیوند منحصربهفرد یک بار در خروجی ظاهر میشود.
برای ممیزی پیوندها در یک سند طولانی، جمعآوری مراجع از یک مقاله تحقیقاتی، ساختن لیستی از سایتهای ذکر شده از یک تاریخچه چت، یا تجزیه و تحلیل بخشهای نظر برای پیوندهای اسپم مفید است.
چطور از این ابزار استفاده کنم؟
چطور URLها را از یک block متن دلخواه بیرون بکشم؟
متن را بچسبانید
source را در فیلد «Text» قرار دهید. ابزار به دنبال پیشوندهای `http://` و `https://` میگردد؛ ذکرهای bare-domain مانند `example.com` match نمیشوند چون مبهم هستند.
«اجرا» را بزنید
خروجی `urls` (آرایهای از URLهای متمایز یافتشده) و `count` (طول) را برمیگرداند. duplicateها به ترتیب اولین ظهور حذف میشوند. URLهایی که به `.`، `,`، `)` یا `]` ختم میشوند، نقطهگذاری پایانی trim میشود تا پایانهای paragraph match را آلوده نکنند.
آنچه regex میگیرد
فرمهای استاندارد `scheme://host/path?query#fragment`. پارامترهای tracking، fragmentها و portها حفظ میشوند. hostnameهای non-ASCII (`https://例え.jp`) کار میکنند؛ pathهای URL-encoded verbatim عبور میکنند — بدون decoding.
آنچه نمیگیرد
URLهای FTP/file/mailto/data (فقط http/https)، ارجاعات bare-domain، و URLهایی که با newline ولگرد در خطوط split شدهاند. برای پروتکلهای exoticتر، متن را pre-process کنید تا `https://` به هر domain که برایتان مهم است اضافه کنید.