python 에서 BeautifulSoup 을 사용할 때 lxml parser 를 사용하는 이유
페이지 정보
본문
BeautifulSoup 을 사용하기 위해서는 파서가 필요하다.
python 에 기본적으로 포함되어 있는 html.parser 를 사용할 수도 있지만,
보통의 경우, 추가적으로 lxml 모듈을 설치해서 사용한다.
그 이유와 장단점을 알아보자.
## parser 비교
1. 기본 html.parser
- 사용법 : BeautifulSoup(html,'html.parser')
- 장단점 : 추가적인 설치가 필요없고, 속도는 보통이다.
2. lxml html parser
- 사용법 : BeautifulSoup(html,'lxml')
- 장단점 : lxml 모듈을 설치해야 하지만, 속도가 빠르다.
## 설치 방법
beautifulsoup4
```
pip install beautifulsoup4
```
lxml
```
pip install lxml
```
## 참고
https://brownbears.tistory.com/414
python 에 기본적으로 포함되어 있는 html.parser 를 사용할 수도 있지만,
보통의 경우, 추가적으로 lxml 모듈을 설치해서 사용한다.
그 이유와 장단점을 알아보자.
## parser 비교
1. 기본 html.parser
- 사용법 : BeautifulSoup(html,'html.parser')
- 장단점 : 추가적인 설치가 필요없고, 속도는 보통이다.
2. lxml html parser
- 사용법 : BeautifulSoup(html,'lxml')
- 장단점 : lxml 모듈을 설치해야 하지만, 속도가 빠르다.
## 설치 방법
beautifulsoup4
```
pip install beautifulsoup4
```
lxml
```
pip install lxml
```
## 참고
https://brownbears.tistory.com/414
추천0
댓글목록
등록된 댓글이 없습니다.