ITエンジニア/デザイナ向けにオープンソースを毎日紹介

これは秀逸なアイディア!CSVはセル内のフォーマットは規定できません。そのため、同じ列であっても文字列も入れられれば数値も入れられます。さらに数値でも整数もあれば小数点を含む場合もあるでしょう。

そこでCSVのチェックに使ってみたいのがCSV Fingerprintです。CSV Fingerprintを使うことで、CSVの各フォーマットがどうなっているのか可視化してくれます。

CSV Fingerprintの使い方

トップページです。テキストエリアにCSVの内容を貼付けます。
トップページです。テキストエリアにCSVの内容を貼付けます。

こちらはサンプルです。色分けされています。
こちらはサンプルです。色分けされています。

黄色は文字列、青は整数、紫は小数点を含む数値、グレーは空のセルとなっています。

別なサンプル。色がついていることで全体のチェックができます。
別なサンプル。色がついていることで全体のチェックができます。

実際のCSVファイルはこのようになっています。
実際のCSVファイルはこのようになっています。

一つ一つを厳密にチェックするのには使えませんが、全体の傾向をざっとチェックするのにはぴったりではないでしょうか。少なくとも数値の列に文字列が入っていないかと言った確認が簡単です。

CSV FingerprintはPython製、MIT Licenseのオープンソース・ソフトウェアです。

setosa/csv-fingerprint

 

MOONGIFTの関連記事

コメント

  • DevRel
  • Com2