PHP Simple HTML DOM Parser > 개발

사이트 내 전체검색

개발

PHP Simple HTML DOM Parser

페이지 정보

작성자 관리자 (61.♡.12.126)
댓글 0건 조회 5,780회 작성일 16-04-24 15:42

본문

기본적으로 url 에서 가져올 때는 file_get_html 를 이용해서 가져온다.
그런데, 가져올 때 잘못가져오거나 덜 가져오는 경우가 있다.

이때는 php 기본함수인 file_get_contents 를 이용해서 가져온 후에,
html 문서를 str_get_html 함수로 DOM 을 읽어 올 수 있다.

아래와 같은 것들로 불러올 수 있다.
innerhtml
innertext
plaintext : 태그를 제외한 문자열만

## How to get HTML elements?

```
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');

// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';

// Find all links
foreach($html->find('a') as $element)
echo $element->href . '<br>';
```

## How to modify HTML elements?

```
// Create DOM from string
$html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>');

$html->find('div', 1)->class = 'bar';

$html->find('div[id=hello]', 0)->innertext = 'foo';

echo $html; // Output: <div id="hello">foo</div><div id="world" class="bar">World</div>
```

## Extract contents from HTML

```
// Dump contents (without tags) from HTML
echo file_get_html('http://www.google.com/')->plaintext;
```

## Scraping Slashdot!

```
// Create DOM from URL
$html = file_get_html('http://slashdot.org/');

// Find all article blocks
foreach($html->find('div.article') as $article) {
$item['title'] = $article->find('div.title', 0)->plaintext;
$item['intro'] = $article->find('div.intro', 0)->plaintext;
$item['details'] = $article->find('div.details', 0)->plaintext;
$articles[] = $item;
}

print_r($articles);
```

## Finding descendants
```
// Find all <li> in <ul>
$es = $html->find('ul li');

// Find Nested <div> tags
$es = $html->find('div div div');

// Find all <td> in <table> which class=hello
$es = $html->find('table.hello td');

// Find all td tags with attribite align=center in table tags
$es = $html->find('table td[align=center]');
```

** 참고
http://simplehtmldom.sourceforge.net
https://simplehtmldom.sourceforge.io/docs/1.9/manual/finding-html-elements/

추천0

댓글목록

등록된 댓글이 없습니다.

개발 목록
번호	제목	조회	날짜
387	두번째 제목	4439	04-14
386	테스트3	6060	06-29
385	자동저장 안될때 나던 오류	5884	07-13
384	갤러리 스킨에 글쓰기시 임시저장글목록	5337	07-13
383	자동 로그인시에 나오는 에러.. ^^	5439	07-31
382	답변하던글	5509	08-01
381	MySQL 사용자 및 디비 생성 쿼리문 스크립트	4723	10-02
380	다음 지도 테스트댓글1개	7431	08-27
379	CentOS 6.x 에 phpMyAdmin 을 yum 으로 설치하기	4645	10-02
378	아이프레임 테스트	5629	09-12
377	bo_mobile_subject 필드	5859	09-14
376	g4s => g5 옮겨가기	6214	09-14
375	슈가싱크 - 개인적으로 괜찮은 클라우드 서비스	6388	08-08
374	아웃로그인에서 outlogin_url 값이	5747	09-14
373	BB 코드 기능	6159	12-09
372	www.youtube.com	3455	01-14
371	테스트 테스트	3551	01-24
370	워드프레스 테스트	4450	02-17
369	구글 리캡차 테스트	2746	05-03
368	CentOS 6.x 서버관리 초기 설정	4173	09-21

개발 목록

번호

제목

387

4439

04-14

386

테스트3

6060

06-29

385

자동저장 안될때 나던 오류

5884

07-13

384

갤러리 스킨에 글쓰기시 임시저장글목록

5337

07-13

383

자동 로그인시에 나오는 에러.. ^^

5439

07-31

382

답변하던글

5509

08-01

381

MySQL 사용자 및 디비 생성 쿼리문 스크립트

4723

10-02

380

다음 지도 테스트댓글1개

7431

08-27

379

CentOS 6.x 에 phpMyAdmin 을 yum 으로 설치하기

4645

10-02

378

아이프레임 테스트

5629

09-12

377

bo_mobile_subject 필드

5859

09-14

376

g4s => g5 옮겨가기

6214

09-14

375

슈가싱크 - 개인적으로 괜찮은 클라우드 서비스

6388

08-08

374

아웃로그인에서 outlogin_url 값이

5747

09-14

373

BB 코드 기능

6159

12-09

372

www.youtube.com

3455

01-14

371

테스트 테스트

3551

01-24

370

워드프레스 테스트

4450

02-17

369

구글 리캡차 테스트

2746

05-03

368

CentOS 6.x 서버관리 초기 설정

4173

09-21

1	원더랜드	72,980
2	퓨리오사: 매드맥스 사가	58,400
3	그녀가 죽었다	31,957
4	나쁜 녀석들: 라이드 오어 다이	21,799
5	범죄도시4	21,163
6	설계자	18,198
7	명탐정 코난 VS 괴도 키드	13,074
8	존 오브 인터레스트	11,911
9	가필드 더 무비	9,545
10	극장판 하이큐!! 쓰레기장의 결전	7,078