PyQuery 教程

常用语法

  • 选择 table 节点

doc.find('table')
  • 选择直接父亲节点

doc.find('table').parent('div')
  • 根据索引选择节点

caption = caption.filter(lambda i: i in tb_index)
  • 移除所有 div 子节点

caption = PyQuery(copy.deepcopy(table.copy()))
caption.find('div').remove()

其中,tablecaption 的类型均为 PyQuery

伪类选择器

  • 选择最后一个子节点

doc("div:last-child")