8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

re.sub('.*', ', '(replacement)', 'text') 在 Python 3.7 上进行双倍替换

Torben Klein 2月前

40 0

在 Python 3.7(在 Windows 64 位上测试)中,使用 RegEx .* 替换字符串会导致输入字符串重复两次!在 Python 3.7.2 中:>>> import re>>> re.sub(\'.*\', \'(

在 Python 3.7(在 Windows 64 位上测试)上,使用 RegEx 替换字符串 .* 会导致输入字符串重复两次!

在 Python 3.7.2 上:

>>> import re
>>> re.sub(".*", "(replacement)", "sample text")
'(replacement)(replacement)'

在 Python 3.6.4 上:

>>> import re
>>> re.sub(".*", "(replacement)", "sample text")
'(replacement)'

在 Python 2.7.5(32 位)上:

>>> import re
>>> re.sub(".*", "(replacement)", "sample text")
'(replacement)'

出了什么问题?如何解决?

帖子版权声明 1、本帖标题:re.sub('.*', ', '(replacement)', 'text') 在 Python 3.7 上进行双倍替换
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由Torben Klein在本站《regex》版块原创发布, 转载请注明出处!
最新回复 (0)
  • rr- 2月前 0 只看Ta
    引用 2

    这是一个常见的正则表达式问题,它影响很多正则表达式类型,请参阅相关

    有几种方法可以解决此问题:

    • 在 两侧添加锚点 .* re.sub("^.*$", "(replacement)", "sample text")
    • 由于您只想匹配一次行,因此添加参数 count=1 print( re.sub(".*", "(replacement)", "sample text", count=1) )
    • 如果您想替换任何非空行,请替换 * + print( re.sub(".+", "(replacement)", "sample text") )

    查看 Python 演示 :

    import re
    # Adding anchors:
    print( re.sub("^.*$", "(replacement)", "sample text") ) # => (replacement)
    # Using the count=1 argument
    print( re.sub(".*", "(replacement)", "sample text", count=1) ) # => (replacement)
    # If you want to replace non-empty lines:
    print( re.sub(".+", "(replacement)", "sample text") ) # => (replacement)
    
  • 这不是一个错误,而是 Python 3.7 中来自提交 fbb490fd2f38bd817d99c20c05121ad0168a38ee .

    在正则表达式中,非零宽度匹配会将指针位置移动到匹配的末尾,以便下一个断言(无论是否为零宽度)都可以从匹配之后的位置继续匹配。因此,在您的示例中,在 .* 贪婪匹配并消耗整个字符串之后,指针随后移动到字符串末尾这一事实实际上仍然为该位置的零宽度匹配留下了“空间”,从以下代码中可以看出,它在 Python 2.7、3.6 和 3.7 中的行为相同:

    >>> re.findall(".*", 'sample text')
    ['sample text', '']
    

    因此,关于在非零宽度匹配之后立即替换零宽度匹配的错误修复现在可以正确地用替换文本替换两个匹配。

  • @CharlesDuffy 那么为什么它只匹配两次?空字符串可以匹配任意次数。毫无意义。两个合乎逻辑的选择是 1 次匹配或无限次匹配。让它匹配两次是完全任意的,根本不合逻辑。

返回
作者最近主题: