不间断空格打印为空白,但在内部处理为 \xa0。如何一次性删除所有这些字符?到目前为止,我直接替换它:text = text.replace('\u202f','') t...
不间断空格打印为空白,但内部处理为 \xa0
。如何一次性删除所有这些字符?
到目前为止我已经直接替换它:
text = text.replace('\u202f','')
text = text.replace('\u200d','')
text = text.replace('\xa0','')
但每次我从外部源抓取文本句子时,这些字符都不同。我该如何一次性删除它们?
在 python nlp 中删除窄“无间断空格”Unicode 字符(U+00A0)
下载声明:
本站所有软件和资料均为软件作者提供或网友推荐发布而来,仅供学习和研究使用,不得用于任何商业用途。如本站不慎侵犯你的版权请联系我,我将及时处理,并撤下相关内容!