این ابزار درست کار نمی‌کند؟

دربارهٔ ابزار «حدس زدن جداکنندهٔ CSV آنلاین»

این ابزار یک فایل CSV یا متن CSV جای‌گذاری شده را بررسی می‌کند و به شما می‌گوید کدام جداکننده استفاده می‌شود: کاما، نقطه‌ویرگول، تب، پایپ، یا دیگر. این کار با تحلیل سازگاری تعداد فیلدها در ردیف‌ها برای هر جداکننده نامزد و انتخاب آنکه بهترین تناسب را دارد، کار می‌کند.

مناطق و ابزارهای مختلف از جداکننده‌های مختلف استفاده می‌کنند: Excel آمریکایی از کاما استفاده می‌کند، Excel آلمانی از نقطه‌ویرگول استفاده می‌کند زیرا اعداد در آنجا از کاما به عنوان جداکننده اعشاری استفاده می‌کنند، صادرات از پایگاه‌های داده اغلب از تب برای جلوگیری از مسائل نقل قول استفاده می‌کنند. شناسایی نادرست جداکننده شایع‌ترین علت شکست واردات CSV است.

ابزار همچنین کاراکترهای نقل قول، پایان خط، و نشانه‌گذارهای BOM را تشخیص می‌دهد — تمام متادیتایی که برای پیکربندی صحیح یک تجزیه‌کننده نیاز دارید. قبل از وارد کردن به Excel، R، Python pandas، یا هر ابزار داده مفید است.

چطور از این ابزار استفاده کنم؟

چطور جداکنندهٔ یک نمونهٔ CSV را حدس بزنم؟

  1. نمونهٔ CSV را بچسبانید

    چند خط اول CSV را در فیلد «Sample» قرار دهید. یک خط با header ستون‌ها معمولاً کافی است — detector فقط به اولین خط غیرخالی نگاه می‌کند.

  2. چه چیزی شمارش می‌شود

    ابزار رخدادهای کاما، semicolon و tab را در آن خط می‌شمارد و رتبه‌بندی می‌کند. pipe (`|`)، فاصله یا جداکننده‌های سفارشی در نظر گرفته نمی‌شوند.

  3. «اجرا» را بزنید

    نتیجه شامل counts (شمارش per-delimiter)، likelyDelimiter (برنده) و hint (`heuristic` وقتی جداسازی واضح بود، `ambiguous` وقتی همه ۰ بودند) است.

  4. چه زمانی override

    روی خطوطی با فیلدهای quote شامل candidate delimiter (مثل `"hello, world"`) این شمارش ساده زیادی برآورد می‌کند. برای CSVهای دشوار چند خط داده به‌جای فقط header بدهید.