鍍金池/ 問(wèn)答/Java  PHP  Linux  HTML/ curl 抓取 https 錯(cuò)誤(問(wèn)題很多)

curl 抓取 https 錯(cuò)誤(問(wèn)題很多)

前幾天接到一個(gè)領(lǐng)導(dǎo)派來(lái)的任務(wù)
要抓 https://www.maicoin.com/ 網(wǎng)站上html的資料
https://www.maicoin.com/api/p... 的資料

我用curl 去抓取再來(lái)解析 ,
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, False);

curl_setopt($ch, CURLOPT_SSL_VERIFYHOST, false);
對(duì)于一般ssl網(wǎng)站有用,但這個(gè)網(wǎng)站沒(méi)用 一直得到404的錯(cuò)誤

上網(wǎng)抓了幾天的文 ,大約是
一、証書(shū)錯(cuò)誤 :http://unitstep.net/blog/2009... 這個(gè)文有教如何匯出憑証,但我一直找不到去哪匯出。到 https://curl.haxx.se/docs/cae... 下載 最新的pem 也無(wú)法。用 openssl s_client -connect www.maicoin.com:443 看到了憑証,但也不知道要怎么用。

二、cookies問(wèn)題 :某位大大說(shuō) 是cookies的問(wèn)題 https://stackoverflow.com/que... ,這篇說(shuō)得很仔詳,但不知道怎么設(shè)置 cookies file (這時(shí)才發(fā)現(xiàn)知識(shí)的重要) ,

三、有人說(shuō) 用curl_error可以看到哪里出了錯(cuò),但我總是只看到404 的畫(huà)面。

曾聽(tīng)到有人說(shuō)過(guò) curl非常的強(qiáng)大,可以模擬出brower的環(huán)境,讓主機(jī)以為是brower來(lái)的,我一直沒(méi)有什么感覺(jué),覺(jué)得這是一件很難的事情 。

總之,就是我抓不到html 我試了很久很久,有沒(méi)有哪位有經(jīng)驗(yàn)的前輩可以略微指導(dǎo)一番
感謝

圖片描述

回答
編輯回答
孤星

curl 'https://www.maicoin.com/api/prices/btc-twd' -H 'Cookie: locale=InpoLVRXIg%3D%3D--a65135f98901cde92d397aef024641fac25550a3; currency=InR3ZCI%3D--6eec4eff818e386526edfcc1b4af684de0367230; visid_incap_160122=8CKUBS5CRzW2jgxC+wKaVpYHrloAAAAAQUIPAAAAAAA9XFHlJQppJiQOwk6k6aA1; incap_ses_434_160122=RB6ACx7+Mno9jD/UC+EFBpYHrloAAAAAJMgpqZFKRf5j9Cj/HLAW/A==; _ga=GA1.2.1402085178.1521354648; _gid=GA1.2.1469388641.1521354648; _twcoin_session=YkVLWUZUaWFnSGE0UEl3VDhmc2QvcGI3cndTTlZ5MVdITE1xSWNtOS84MThvS3pieDFFT0dWc1NlajI5SXBDVG43dlJTQkJjMjBmSUNob0xqanN5TnM2TnNDNk1rS2NucHB4NTUzbXB5K3BpN1VGWlRKQ29nRi9zd0p5cXpxMzFibDFyVHMrbVh4VjYvclY5ZFBnWDh3PT0tLTQwYWdQUHlSSXJwNHM2c3d0S0pIaFE9PQ%3D%3D--5217aa1d4a5c131b7f37bef34c90ce10e2fb7586'

要帶上cookie

2018年6月18日 17:56