این ابزار درست کار نمیکند؟
دربارهٔ ابزار «حدس زدن جداکنندهٔ CSV آنلاین»
این ابزار یک فایل CSV یا متن CSV جایگذاری شده را بررسی میکند و به شما میگوید کدام جداکننده استفاده میشود: کاما، نقطهویرگول، تب، پایپ، یا دیگر. این کار با تحلیل سازگاری تعداد فیلدها در ردیفها برای هر جداکننده نامزد و انتخاب آنکه بهترین تناسب را دارد، کار میکند.
مناطق و ابزارهای مختلف از جداکنندههای مختلف استفاده میکنند: Excel آمریکایی از کاما استفاده میکند، Excel آلمانی از نقطهویرگول استفاده میکند زیرا اعداد در آنجا از کاما به عنوان جداکننده اعشاری استفاده میکنند، صادرات از پایگاههای داده اغلب از تب برای جلوگیری از مسائل نقل قول استفاده میکنند. شناسایی نادرست جداکننده شایعترین علت شکست واردات CSV است.
ابزار همچنین کاراکترهای نقل قول، پایان خط، و نشانهگذارهای BOM را تشخیص میدهد — تمام متادیتایی که برای پیکربندی صحیح یک تجزیهکننده نیاز دارید. قبل از وارد کردن به Excel، R، Python pandas، یا هر ابزار داده مفید است.
چطور از این ابزار استفاده کنم؟
چطور جداکنندهٔ یک نمونهٔ CSV را حدس بزنم؟
نمونهٔ CSV را بچسبانید
چند خط اول CSV را در فیلد «Sample» قرار دهید. یک خط با header ستونها معمولاً کافی است — detector فقط به اولین خط غیرخالی نگاه میکند.
چه چیزی شمارش میشود
ابزار رخدادهای کاما، semicolon و tab را در آن خط میشمارد و رتبهبندی میکند. pipe (`|`)، فاصله یا جداکنندههای سفارشی در نظر گرفته نمیشوند.
«اجرا» را بزنید
نتیجه شامل counts (شمارش per-delimiter)، likelyDelimiter (برنده) و hint (`heuristic` وقتی جداسازی واضح بود، `ambiguous` وقتی همه ۰ بودند) است.
چه زمانی override
روی خطوطی با فیلدهای quote شامل candidate delimiter (مثل `"hello, world"`) این شمارش ساده زیادی برآورد میکند. برای CSVهای دشوار چند خط داده بهجای فقط header بدهید.