var page = UrlFetchApp.fetch(contestURL);var doc = XmlService.parse(page); 上面的代码在使用时会出现解析错误,但是如果我用已弃用的 Xml 类替换 XmlService 类,则......
var page = UrlFetchApp.fetch(contestURL);
var doc = XmlService.parse(page);
上述代码在使用时会出现解析错误,但是如果我用弃用的 Xml 类替换 XmlService 类,并设置宽松标志,它就能正确解析 html。
var page = UrlFetchApp.fetch(contestURL);
var doc = Xml.parse(page, true);
该问题主要是因为 html 的 javascript 部分没有 CDATA 而导致的,解析器抱怨以下错误。
The entity name must immediately follow the '&' in the entity reference.
即使我删除了所有 <script>(.*?)</script>
使用正则表达式,它仍然会抱怨,因为 <br>
标签没有关闭。有没有一种干净的方法将 html 解析为 DOM 树。