این ابزار درست کار نمی‌کند؟

دربارهٔ ابزار «پاک‌سازی متن آنلاین»

این ابزار متن نامرتب را نرمال‌سازی می‌کند. می‌تواند چندین فاصله را به یک فاصله جمع کند، فضای خالی ابتدا/انتهای هر خط را حذف کند، خطوط خالی را حذف کند، پایان خطوط (CR، LF، CRLF) را نرمال‌سازی کند، کاراکترهای غیرقابل چاپ را حذف کند، و گیومه‌های هوشمند را با گیومه‌های صاف جایگزین کند — همه در یک گذر با گزینه‌هایی که انتخاب می‌کنید.

هنگام کپی-جای‌گذاری از یک سند Word یا PDF که اغلب کاراکترهای قالب‌بندی نامرئی همراه می‌آیند، هنگام نرمال‌سازی داده‌های فرم ارسالی کاربر، یا هنگام آماده‌سازی متن برای مقایسه‌های diff که باید تفاوت‌های ظاهری را نادیده بگیرند، مفید است.

هر گزینه می‌تواند به طور مستقل تغییر کند.

چطور از این ابزار استفاده کنم؟

چطور whitespace و کاراکترهای control را نرمال کنم؟

  1. متن را بچسبانید

    source را در فیلد «Text» قرار دهید. ورودی‌های معمول: متن PDF کپی‌شده با line wrap عجیب، رشته‌های web-scrap شده با non-breaking space، یا پیام‌های پر از کاراکترهای zero-width که برای پنهان کردن tracker استفاده می‌شوند.

  2. «اجرا» را بزنید

    خروجی یک فیلد `cleaned` است. چندین space پشت‌سرهم به یکی collapse می‌شوند؛ run‌های newline به حداکثر یک خط خالی collapse می‌شوند؛ tab به single space تبدیل می‌شود؛ کاراکترهای zero-width و BOM ناپدید می‌شوند.

  3. آنچه لمس می‌شود و نمی‌شود

    حروف، ارقام، نقطه‌گذاری معمولی و Unicode فراتر از ASCII (مانند emoji و کاراکترهای CJK) دست‌نخورده می‌مانند. فقط whitespace، control code و کاراکترهای invisible-format نرمال می‌شوند.

  4. چه زمانی اجرا نکنیم

    source code با whitespace معنادار (YAML، Python، indentation Markdown) corrupt می‌شود — tab → space معنا را تغییر می‌دهد. CSV با فیلدهای خالی ممکن است آن‌ها را از دست بدهد اگر space ابتدا/انتها مهم باشد. اول diff یا sample بگیرید.