8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

如何从转置格式将 .txt 文件读入 pandas DataFrame

xqpopid378 1月前

54 0

我正在尝试将数据集读入 pandas 数据框。数据集当前位于 .txt 文件中,其内容如下:name: hello_worldrating: 5description: basic programname: python

我正在尝试将数据集读入 pandas 数据框。数据集当前位于 .txt 文件中,如下所示:

name: hello_world
rating: 5
description: basic program

name: python
rating: 10
description: programming language

如您所见,每行开头都是列名,后面跟着数据。数据框的不同行由一条额外的线分隔。有没有一种简单的方法可以将这种类型的文件读入 pandas,还是我必须手动完成?

谢谢!

编辑:感谢大家的帮助。看来答案是,是的,你必须手动完成。我在下面发布了我手动完成的方法,但我确信还有其他更有效的方法。

帖子版权声明 1、本帖标题:如何从转置格式将 .txt 文件读入 pandas DataFrame
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由xqpopid378在本站《file》版块原创发布, 转载请注明出处!
最新回复 (0)
  • 通用建议:

    import pandas as pd
    def from_txt_transposed_to_pandas(file):
        """
        take a txt file like this:
    
        "
        name: hello_world
        rating: 5
        description: basic program
    
        name: python
        rating: 10
        description: programming language 
        "
    
        -of any length- and returns a dataframe.
        """
        tabla = pd.read_table(file)
        cols = list(set([x.split(":")[0] for x in tabla.iloc[::,0]]))
        tabla_df= pd.DataFrame(columns = cols)
        elem = list(tabla[tabla.columns[0]])+[tabla.columns[0]]
        for n in range(len(cols)):  
            tabla_df[cols[n]]= [x.split(":")[1] for x in elem if\ 
            x.startswith(cols[n])]
        return tabla_df
    
返回
作者最近主题: