[mw_shl_code=php,true]<?php @ J, O2 A$ ]9 U& k$ ]
set_time_limit(0);//設置程序執行時間 + J9 Z9 u. ?: @! }: f! X7 Z
header("Content-Type: text/html; charset= utf-8"); //設置頁面的編碼,不設置會亂碼 ! \7 i; C2 \; [! f' n" N7 `
8 C9 {- {( [# _ @. ]2 W5 f
$url="http://www.luosuo.net/old/forum-4-1.html";
; }8 c* u3 o! c% {1 I$ch = curl_init($url);//初始化 & `$ w- L, b! ^) q
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//返回的內容我們是作為變量儲存, 而不輸出,所以這裡選1.
1 @; w7 F0 F, p' r8 |$contents = curl_exec($ch);// 運行cURL,請求網頁 # y9 U3 w9 A6 r7 K! a$ i
preg_match_all('{<a href="([^"]+)" target="_blank">(.*)</a>}',$contents,$matches);//正則匹配想要的內容
6 W5 p; M( g$ N5 y3 F- ncurl_close($ch);// 關閉URL請求 ! H" ~9 L0 ~ U! S5 ?! U. n
print_r($matches);
$ h" M' N6 x4 c3 @7 tfor ($i=0;$i<count($matches[1]);$i++)//for循環結構很常用,這裡的作用是循環記錄總數的的次數,每次循環中可以任意處理採集到的內容 ) n4 \0 r) d" Y% z$ N3 {& v
{
A" n* R8 C* B! C9 d$title = $matches[2][$i];
2 B# s' B' J) ~& U$geturl = $matches[1][$i];
% U0 N/ e; Q3 j/ t/ U4 Oecho "我要的標題是:" . $title. "<br/>" . "對應的網址是:" . $geturl . "<br/><br/><br/>"; / ~8 ?( j- H+ ]9 z' N7 @$ n
} . X0 [) _0 s" P1 O( Z$ J
?>[/mw_shl_code]
7 `9 R4 A, U/ Q; n7 Q$ K7 n8 ^. {9 i, Q
這是我測試的代碼,怎麼出現了這個
& C4 R3 F7 C' t- |9 |
: a- d/ a( G5 D$ Q- _% P/ @. F1 o; {6 d+ z$ y% F1 D* ]
|