1post
用python提取网页中需要的内容时,免不了要处理html文档。
遥想当年,扒教务网的考试成绩,是用的正则表达式处理:
pattern = re.compile('<tr class="odd".*?>.*?<td.*?>.*?</td......