8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

如何在 cpp 中为所有语言构建一个全词匹配的正则表达式?

Webber 1月前

24 0

\b 正则表达式是否适用于 cpp 中的所有语言?还是仅限于拉丁字母?如果不是 - 如何匹配整个单词,例如 \'תפוח\'?具体来说,我想到了一些...

是否 \b 适用于所有语言的 cpp?还是仅适用于拉丁字母?

如果不是--如何匹配整个单词,例如\'תפוח\'?

具体来说,我想到过这样的事情 [^\s]תפוח[$\s] ,但不确定 ^ 在这里是否被解释为否定或字符串的开始......

我正在使用 PCRE 库。

帖子版权声明 1、本帖标题:如何在 cpp 中为所有语言构建一个全词匹配的正则表达式?
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由Webber在本站《regex》版块原创发布, 转载请注明出处!
最新回复 (0)
  • 您没有说明您使用的是哪种正则表达式引擎。但无论如何,您可能想考虑使用 boost regex ,因为它有一个包装器,可以与 ICU 库一起使用来处理 unicode。

    文档 表明您可以:

    创建支持各种 Unicode 数据属性(包括字符分类)的正则表达式。

    这意味着 /b 和 /B 应该与 ICU 支持的任何编码一起使用。

    在 Unicode 合规性的“标准”部分中,它指出:

    1.4 简单单词边界:符合:单词字符集中包含非间距标记。

返回
作者最近主题: