8wDlpd.png
8wDFp9.png
8wDEOx.png
8wDMfH.png
8wDKte.png

提取 DOCX 注释

Louise Sørensen 1月前

64 0

我是一名教师。我想要一份对我布置的论文发表评论的所有学​​生的名单,以及他们说了什么。Drive API 对我来说太难了,但我想我可以将它们下载为......

我是一名教师。我想要一份对我布置的论文发表评论的所有学​​生的名单,以及他们说了什么。Drive API 对我来说太难了,但我想我可以将它们下载为 zip 文件并解析 XML。

评论用标签 w:comment 标记,其中 w:t 表示评论文本, 表示评论内容。这应该很容易,但是 XML (etree) 让我很头疼。

通过教程(和官方 Python 文档):

z = zipfile.ZipFile('test.docx')
x = z.read('word/comments.xml')
tree = etree.XML(x)

然后我这样做:

children = tree.getiterator()
for c in children:
    print(c.attrib)

结果是:

{}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}author': 'Joe Shmoe', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}id': '1', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}date': '2017-11-17T16:58:27Z'}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidR': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidDel': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidP': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidRDefault': '00000000', '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}rsidRPr': '00000000'}
{}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val': '0'}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val': '0'}
{'{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val': '0'}

此后,我完全陷入了困境。我试过了 element.get() ,但 element.findall() 没成功。即使我复制/粘贴值 ( '{http://schemas.openxmlformats.org/wordprocessingml/2006/main}val' ),我也会得到 None 回报。

有人可以帮忙吗?

帖子版权声明 1、本帖标题:提取 DOCX 注释
    本站网址:http://xjnalaquan.com/
2、本网站的资源部分来源于网络,如有侵权,请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点,并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
5、站长邮箱:yeweds@126.com 除非注明,本帖由Louise Sørensen在本站《parsing》版块原创发布, 转载请注明出处!
最新回复 (0)
  • @lucid_dreamer:Word Automation 需要 Microsoft Word,在服务器部署中不可靠。如果您需要在纯 Python 解决方案中引用文本,而不需要 Word,请提出新问题。

返回
作者最近主题: