用python提取网页中需要的内容时,免不了要处理html文档。

遥想当年,扒教务网的考试成绩,是用的正则表达式处理:

pattern = re.compile('<tr class="odd".*?>.*?<td.*?>.*?</td......