Openrefine,免费开源数据清洗工具,openrefine.org工具优化数据的质量以便于在真实场景中使用错误会散步到你的大数据集中数据量越大正确且清晰地认识以上的现状
数据剖析Data Profiling:也叫做数据考古(Data Archeology)数据剖析是Olson于2003年提出的概念换句话说
数据清洗Data Cleaning:是尝试通过移除空的数据行或重复的数据行、过滤数据行、聚集或转换数据值、分开多值单元等数据清洗是一个反复的过程对于是否过滤
IDTs:Interactive Data Transformation tools
OpenRefine就是这样的IDT工具它类似于传统Excel的表格处理软件这意味着OpenRefine不仅适合对新的行数据进行编码安装问题数据清洗