我们循环遍历 CSV 文件,处理 CSV 并将结果存储到字符串变量中。字符串的格式如下循环迭代 1 -- string1--> CS,20,20021988,Ind 循环迭代 2 -- stri...
我们循环处理 CSV 文件并将结果存储到字符串变量中。
字符串格式如下
Loop iteration 1 -- string1--> CS,20,20021988,Ind
Loop iteration 2 -- string2--> FQ,20,,Aus
loop Iteration 3 -- string3 -->SR,,,US
如果您发现字符串中的字段数不一致,是否有任何方法可以在每次循环期间将此结果存储到 pyspark 数据框中。即在每次迭代期间将每条记录附加到数据框中
最终数据框结果如下
循环遍历 CSV 并生成数据框
下载声明:
本站所有软件和资料均为软件作者提供或网友推荐发布而来,仅供学习和研究使用,不得用于任何商业用途。如本站不慎侵犯你的版权请联系我,我将及时处理,并撤下相关内容!