Semalt: Eastóscadh Sonraí Gréasáin Le Breiseán Google Chrome

Má tá Brabhsálaí Google Chrome á úsáid agat chun an glan a surfáil, tá breiseán brabhsálaí ann chun sonraí a bhaint as na leathanaigh ghréasáin is fearr leat. Is bogearraí é Google Chrome Scraper a úsáidtear chun sonraí a aisghabháil ó láithreáin ghréasáin dinimiciúla agus statacha. Ligfidh an breiseán Chrome seo duit an t-ábhar leathanach gréasáin is fearr leat a scrabhadh agus é a shábháil in Google Docs.

Scraper Gréasáin Google Chrome

Is síneadh brabhsálaí é Google Chrome Web Scraper a bhaintear sonraí ó shuímh agus leathanaigh. Leis an síneadh seo, ní theastaíonn na céadta oibrithe uait chun ábhar a chóipeáil ó shuíomhanna an lá ar fad. Tar éis duit a bheith suiteáilte ar do bhrabhsálaí Chrome, níl le déanamh agat ach an t-ábhar sprice a roghnú agus ligean do scraper gréasáin an chuid eile a dhéanamh.

Mura bhfuil aon eolas códaithe agat, is é seo an scraper gréasáin is fearr le breithniú. Moltar Google Chrome Scraper le haghaidh scrapáil ar scála beag agus ar scála mór. Cuimsíonn sé faisnéis agus sonraí luachmhara ar féidir iad a iompú ina sonraí faisnéise iomaíocha. Leis an síneadh seo, is furasta do spriocíomhánna agus eolairí go léir a bhaint agus a easpórtáil isteach i CouchDB nó i scarbhileoga.

Treoracha maidir le conas tosú

Is tasc é féin a dhéanamh leathanaigh leathanaigh a scríobadh le breiseán brabhsálaí is féidir leat a fhorghníomhú go tapa le do ríomhaire. Seo treoir dheiridh a chabhróidh leat tosú:

  • Tosaigh do bhrabhsálaí Google Chrome agus cliceáil ar "Chrome Web Store."
  • Oscail síntí do bhrabhsálaí agus cuardaigh "Scraper."
  • Cliceáil ar an rogha "Cuir le Chrome" ar taispeáint ar do scáileán
  • Oscail an suíomh Gréasáin nó an leathanach gréasáin le scríobadh agus aibhsigh na sonraí a theastaíonn uait a fháil. Cliceáil ar dheis ar an eilimint agus cliceáil ar "Scrape similar."
  • Beidh consól scraper le feiceáil ar do scáileán. Tabhair faoi deara go bhfuil an consól scraper gréasáin comhdhéanta de na sonraí a bhaintear.
  • Ag an gcéim seo, is féidir leat cinneadh a dhéanamh cá háit le d’ábhar scrapáilte a shábháil. Mar shampla, is féidir leat an t-ábhar a shábháil ar Google Docs trí chliceáil ar "Sábháil go Google Docs."

Tabhair faoi deara gur script uathoibrithe é "scraper" a bhaineann sonraí úsáideacha as leathanaigh agus suíomhanna Gréasáin dinimiciúla. Murab ionann agus uirlisí scrapála gréasáin eile, is féidir le scraper gréasáin Google chrome sonraí a ghintear le JavaScript a scrabhadh. I measc na dtascanna eile a dhéanann breiseán scraper Chrome tá:

  • Cliceáil ar cnaipí ábhair chun sonraí a luchtú;
  • Cliceáil ar cnaipí leathanach a luchtaíonn faisnéis ag úsáid AJAX;
  • Scrollaigh síos leathanaigh ghréasáin chun níos mó ábhar a luchtú;
  • Ag fanacht le hábhar dinimiciúil a luchtú ar leathanach gréasáin;

Tar éis duit sonraí a scríobadh ó leathanach gréasáin, is féidir leat na sonraí a íoslódáil i bhformáid luachanna scartha le Coma (CSV) nó iad a stóráil i CouchDB. Le Google Chrome Web Scraper, ní gá duit oibriú ar eastóscadh sonraí, pleanáil a thógáil, nó easpórtáil.