8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

在 Google 应用脚本中解析 html 的最佳方法是什么

Excessstone 2月前

195 0

var page = UrlFetchApp.fetch(contestURL);var doc = XmlService.parse(page); 上面的代码在使用时会出现解析错误,但是如果我用已弃用的 Xml 类替换 XmlService 类,则......

var page = UrlFetchApp.fetch(contestURL);
var doc = XmlService.parse(page);

上述代码在使用时会出现解析错误,但是如果我用弃用的 Xml 类替换 XmlService 类,并设置宽松标志,它就能正确解析 html。

var page = UrlFetchApp.fetch(contestURL);
var doc = Xml.parse(page, true);

该问题主要是因为 html 的 javascript 部分没有 CDATA 而导致的,解析器抱怨以下错误。

The entity name must immediately follow the '&' in the entity reference.

即使我删除了所有 <script>(.*?)</script> 使用正则表达式,它仍然会抱怨,因为 <br> 标签没有关闭。有没有一种干净的方法将 html 解析为 DOM 树。

帖子版权声明 1、本帖标题:在 Google 应用脚本中解析 html 的最佳方法是什么
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由Excessstone在本站《google-maps》版块原创发布, 转载请注明出处!
最新回复 (0)
  • 不安全 - \'lib:parser:8\' 想要访问 \'gdrive\'

返回
作者最近主题: