我有原始数据框 = data_df,其中 data_df[\'country_name\'] 列和城市列 data_df[\'city_name\'] 中缺少 427 个国家/地区,所有行都有城市名称
我有原始数据框 = data_df,其中列中缺少 427 个国家 data_df["country_name"]
,城市列中 data_df["city_name"]
除 1 行外所有行都有城市名称。我还有另一个数据框,其中约有 261 行缺少国家和城市名称。我想替换 NaN
原始数据集中 country_name 的值,这些值在我的新数据框(261 行)中可用。我该如何实现。
我尝试使用索引和 for 循环,如果 city_name 等于 city,则使用 Nan
匹配项替换该值,但结果却在数据框中附加了更多行。
for city_index, city_name in enumerate(nan_rows["city_name"]):
country = nan_rows.iloc[city_index]["country_name"]
print(f"City index is {city_index} and City name is {city_name} and county is {country}")
for city in new_country_missing_df["city_name"]:
if city == city_name:
nan_rows.loc[city_index, "country_name"] = country
我的数据框示例:nan_rows 数据框:
country_name city_name
535 NaN Granville
654 NaN Kingston Upon Hull
787 NaN New Waterford
801 NaN Kingstown
new_country_missing_df数据框:
city_name country
0 Granville France
1 Kingston Upon Hull United Kingdom
2 New Waterford Canada
3 Kingstown Saint Vincent and the Grenadines
4 Nanakuli United States