记录下pandas.to_csv函数使用的坑。
- 本想聊聊事情起因,经过,结果,奈何手懒,直接记录下结果吧
- 问题:
- 1、pandas读取csv,再to_string,再转回pandas.dataframe,再保存为csv
- 2、pandas读取csv,再保存为csv
- 1,2保存的数据结果不一致
- 样本数据:
1 | # sample.csv |
- 涉及的代码也简单,如下:
1 | from io import StringIO |
- 1的保存结果:
1 | 11.0,22.0,1.0,2.0,3.0,4.0 |
- 2的保存结果:
1 | 11,22,1,2,3,4 |
- 解决方案:
1
2# 去除float_format='%.10g'
pdf2.to_csv('/tmp/sample2.csv', index=0)