8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

自定义 pandas read_csv 中的分隔符

ZainZaheer06 2月前

53 0

我正在将许多不同的数据文件读入各种 pandas 数据框。这些数据文件中的列由空格分隔。但是,对于每个文件,空格的数量是不同的(对于某些文件...

我正在将许多不同的数据文件读入各种 pandas 数据框。这些数据文件中的列由空格分隔。但是,对于每个文件,空格的数量是不同的(对于其中一些文件,只有一个空格,对于其他文件,有两个空格等等)。因此,每次导入文件时,我都必须手动转到该文件并查看已使用的空格数,并在中给出这些空格数 sep

import pandas as pd
df = pd.read_csv('myfile.dat', sep = '    ')

有什么方法可以告诉 pandas 将 \'任意数量的空格\' 视为分隔符?此外,有什么方法可以告诉 pandas 使用制表符 ( \t ) 或空格作为分隔符?

帖子版权声明 1、本帖标题:自定义 pandas read_csv 中的分隔符
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由ZainZaheer06在本站《csv》版块原创发布, 转载请注明出处!
最新回复 (0)
  • 是的,您可以使用简单的正则表达式来 sep='\s+' 表示一个或多个空格。

  • 成功了!谢谢。有什么方法可以告诉 pandas 使用空格或制表符作为分隔符吗?

  • 空格也可能与制表符匹配,但我相信您只需在正则表达式中添加或条件即可:sep=\s+|\t+

  • 跳过任何分隔符后的前导空格的 skipinitialspace=True 参数

  • 您可以直接使用 delim_whitespace

    import pandas as pd
    df = pd.read_csv('myfile.dat', delim_whitespace=True )
    

    该参数 delim_whitespace 控制是否 ' ' 使用 ' ' pandas.read_csv

  • 我发现,如果你使用不受支持的分隔符,Pandas/Dask 将不得不使用 Python 引擎而不是 C 引擎。这会慢很多。

返回
作者最近主题: