8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

在 Pandas str.contains() 中的正则表达式中使用变量

RaytheonXie-MSFT 2月前

62 0

我正在尝试使用带有包含变量的正则表达式的 pandas str.contains() 函数从数据框中选择行,如下所示。df = pd.DataFrame([\'A test Case\',\'Another

带有包含变量的正则表达式的 str.contains() pandas 函数从数据框中选择行,

df = pd.DataFrame(["A test Case","Another Testing Case"], columns=list("A"))
variable = "test"
df[df["A"].str.contains(r'\b' + variable + '\b', regex=True, case=False)] #Returns nothing

虽然上面的代码没有返回任何内容,但下面的代码按预期返回了相应的行

df[df["A"].str.contains(r'\btest\b', regex=True, case=False)] #Returns values as expected

任何帮助都将不胜感激。

帖子版权声明 1、本帖标题:在 Pandas str.contains() 中的正则表达式中使用变量
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由RaytheonXie-MSFT在本站《dataframe》版块原创发布, 转载请注明出处!
最新回复 (0)
  • 两个字边界字符都必须位于原始字符串内。为什么不使用某种字符串格式呢?一般不鼓励使用字符串连接。

    df[df["A"].str.contains(fr'\b{variable}\b', regex=True, case=False)] 
    # Or, 
    # df[df["A"].str.contains(r'\b{}\b'.format(variable), regex=True, case=False)] 
    
                 A
    0  A test Case
    
  • 如果您必须指定字符数量,您将如何执行此操作,因为 [0-9]{3} 会发生这种情况,例如,如果您想要一个由三个数字组成的模式。刚刚遇到这个问题,所以只使用了字符串连接就解决了它,而 f-string 不起作用。

  • 以下命令对我有用:
    df.query('text.str.contains(@variable)')

  • 将“变量”解析为 str.contains(variable) 时,我遇到了完全相同的问题。

    尝试使用 str.contains(variable, regex=False)

    它对我来说非常有效。

返回
作者最近主题: