این ابزار درست کار نمی‌کند؟

دربارهٔ ابزار «حذف تگ‌های HTML آنلاین»

این ابزار تمام تگ‌های HTML را از یک سند حذف می‌کند و فقط محتوای متن ساده را باقی می‌گذارد. به درستی تگ‌های تو در تو، تگ‌های خودبسته، نظرات، بلوک‌های اسکریپت و استایل (که آنها را همراه با محتویاتشان حذف می‌کند) و موجودیت‌های HTML (که آنها را به شکل کاراکتری رمزگشایی می‌کند) را مدیریت می‌کند.

هنگام کپی محتوا از یک صفحه وب که فقط کلمات را می‌خواهید، هنگام آماده‌سازی متن ایمیل یا SMS از یک منبع HTML، هنگام لوله کردن HTML به یک ابزار پایین‌دستی که متن ساده انتظار دارد، یا هنگام پاکسازی متن غنی ارسالی توسط کاربر برای ذخیره‌سازی ایمن مفید است.

ابزار گزینه‌هایی برای حفظ شکست خط برای عناصر بلوک (تا پاراگراف‌ها جدا بمانند) و نگه داشتن برخی تگ‌ها مانند <a> یا <strong> در صورت تمایل به نشانه‌گذاری جزئی ارائه می‌دهد.

چطور از این ابزار استفاده کنم؟

چطور با حذف همهٔ tag‌ها متن ساده از HTML استخراج کنم؟

  1. HTML را بچسبانید

    HTML (صفحهٔ کامل یا fragment) را در فیلد «HTML» قرار دهید. tag‌هایی مانند `<p>`، `<a href="…">`، `<br>` scrub می‌شوند و text content بین آن‌ها باقی می‌ماند. مقادیر attribute حفظ نمی‌شوند — فقط متن body قابل‌مشاهده باقی می‌ماند.

  2. «اجرا» را بزنید

    خروجی یک فیلد `text` است. whitespace run‌ها collapse می‌شوند؛ line break در block boundary (`<p>`، `<div>`، `<br>`) به newline تبدیل می‌شود تا خروجی ساختار paragraph قابل‌خواندن داشته باشد.

  3. آنچه handle نمی‌کند

    محتوای `<script>` و `<style>` می‌رود (محتویاتشان خالی می‌شود)، اما اگر inline event handler (`onclick="…"`) دارید آن‌ها همراه با attribute ناپدید می‌شوند — هیچ نگرانی. Entity‌های encoded مانند `&amp;` decode می‌شوند؛ `&lt;` به `<` تبدیل می‌شود.

  4. چه زمانی استفاده کنیم

    تولید plaintext body ایمیل از یک template HTML؛ شمارش کلمات در یک مقالهٔ منتشرشده؛ تغذیهٔ ورودی HTML-rich به ابزاری که فقط متن می‌خواهد. برای حفظ semantic (link، list)، به‌جای آن از `html-to-markdown-converter` استفاده کنید.