数据采集

文档状态:编辑中....


Table of Contents

Intro

1.[lib]I choose bs4
2.[version]python3.x

Object[BeautifulSoup]

构造参数

Encode

输入编码其实可以自动检测,但是不一定准哦,输出指定UTF8
- from_encoding[以文档指定的编码解析]E:from_encoding="iso-8859-8"
- exclude_encodings[排除编码]E: exclude_encodings=["ISO-8859-7"]

Parser

parse_only

Attribute

Method

Normal

Traversal

周末放映室


没想到center标签不支持width属性,只能自定义<div>了