این ابزار درست کار نمیکند؟
دربارهٔ ابزار «پاکسازی متن آنلاین»
این ابزار متن نامرتب را نرمالسازی میکند. میتواند چندین فاصله را به یک فاصله جمع کند، فضای خالی ابتدا/انتهای هر خط را حذف کند، خطوط خالی را حذف کند، پایان خطوط (CR، LF، CRLF) را نرمالسازی کند، کاراکترهای غیرقابل چاپ را حذف کند، و گیومههای هوشمند را با گیومههای صاف جایگزین کند — همه در یک گذر با گزینههایی که انتخاب میکنید.
هنگام کپی-جایگذاری از یک سند Word یا PDF که اغلب کاراکترهای قالببندی نامرئی همراه میآیند، هنگام نرمالسازی دادههای فرم ارسالی کاربر، یا هنگام آمادهسازی متن برای مقایسههای diff که باید تفاوتهای ظاهری را نادیده بگیرند، مفید است.
هر گزینه میتواند به طور مستقل تغییر کند.
چطور از این ابزار استفاده کنم؟
چطور whitespace و کاراکترهای control را نرمال کنم؟
متن را بچسبانید
source را در فیلد «Text» قرار دهید. ورودیهای معمول: متن PDF کپیشده با line wrap عجیب، رشتههای web-scrap شده با non-breaking space، یا پیامهای پر از کاراکترهای zero-width که برای پنهان کردن tracker استفاده میشوند.
«اجرا» را بزنید
خروجی یک فیلد `cleaned` است. چندین space پشتسرهم به یکی collapse میشوند؛ runهای newline به حداکثر یک خط خالی collapse میشوند؛ tab به single space تبدیل میشود؛ کاراکترهای zero-width و BOM ناپدید میشوند.
آنچه لمس میشود و نمیشود
حروف، ارقام، نقطهگذاری معمولی و Unicode فراتر از ASCII (مانند emoji و کاراکترهای CJK) دستنخورده میمانند. فقط whitespace، control code و کاراکترهای invisible-format نرمال میشوند.
چه زمانی اجرا نکنیم
source code با whitespace معنادار (YAML، Python، indentation Markdown) corrupt میشود — tab → space معنا را تغییر میدهد. CSV با فیلدهای خالی ممکن است آنها را از دست بدهد اگر space ابتدا/انتها مهم باشد. اول diff یا sample بگیرید.