Back to Question Center
0

Semalt: 14 Free Web Scraping Software To Try

1 answers:

Ireo fitaovana fandinganana tranokala dia mikendry ny hanangona, hanangona, handamina, hanova ary hamonjy ny vaovao avy amin'ny tranonkala samihafa. Afaka manao asa maromaro izy ireo ary afaka miditra amin'ny browsers sy ny rafitra miasa. Ny safidy tsara indrindra tranonkala dia raisina etsy ambany.

Soupa tsara

Raha te ho tsara indrindra amin'ny Supra tsara ianao, dia mila mianatra Python. Marina fa ny Soupa tsara tarehy dia ny tahirim-bokin'ny Python izay novolavolaina tamin'ny fanoratana ny rakitra HTML sy XML. Ity freeware io dia azo ampidirina amin'ny rafitra Debian sy Ubuntu tsy misy olana - unifi security gateway xg.

Import. io

Import. io dia iray amin'ireo fandaharam-pamokarana mahatalanjona amin'ny tranonkala. Izany dia mamela antsika hanakatona ny fampahalalam-baovao ary handraisana azy ho toy ny daty samihafa. Izy io dia fitaovana mora ampiasaina miaraka amin'ny fitaovana avo lenta izay hanampy anao hampitombo ny orinasa.

Mozenda

Mozenta dia iray amin'ireo fandaharana tena ilaina sy fandokoana. Izy io dia manasongadina ny famokarana angon-drakitra ary mora manangona votoaty avy amin'ny pejy web.

ParseHub

Raha efa nitady fandaharana amin'ny tranokala maimaim-poana ianao, ny ParseHub dia safidy tsara ho anao. Amin'ny fampiasana ity rindrambaiko ity dia afaka mamorona API avy amin'ny tranonkalanao mora indrindra ianao.

Octoparse

Octoparse dia manodidina ny fotoana elaela ary fandaharam-pandevonan 'ny mpanjifa ho an'ny mpampiasa Windows. Hanova ny votoatiny semi-strukture ho amin'ny angona azo vakina sy azo antoka ao anatin'ny minitra vitsy.

CrawlMonster

Ity misy fitaovana lehibe sy mahasoa ho an'ny filànao amin'ny tranonkalanao. CrawlMonster dia tsy vitan'ny mpangalatra fa mpikirakira ny tranonkala ihany koa. Azonao ampiasaina izany mba hijerena tranonkala samihafa amin'ny teboka daty.

Connotate

Safidy mahafinaritra ho an'ireo orinasa sy mpandrindra. Ny Connotate no hany vahaolana amin'ny olana amin'ny Internet. Ilainao fotsiny ny manasongadina ny angon-drakitra ary manaparitaka azy io amin'ity programa ity.

Fihetseham-po tsotra

Ny ampahany tsara indrindra amin'ny Common Crawl dia ny manome tahiry misokatra amin'ny tranonkala mikorontana. Ity fitaovana ity dia manolotra ny angon-drakitra sy ny votoaty momba ny harena ankibon'ny tany ary afaka mamoaka metadata ihany koa.

Miondrika

Tranonkala manaparitaka sy manasitrana ny Internet. Ny Crawly dia efa nanakaiky nandritra ny fotoana fohy ary nahazo anao tahirin-kevitra amin'ny endrika tahaka ny JSON sy ny CSV.

Content Grabber

Fitrandrahana hafa momba ny harena ankibon'ny tany . Ny Content Grabber dia mamoaka lahatsoratra sy sary ho an'ireo mpampiasa ary mamela anao hamorona ireo mpilatsaka an-tsitrapo ao anaty tranonkala.

Diffbot

Diffbot dia programa vaovao iray izay mamolavola sy mamolavola ny angonao amin'ny fomba tsara kokoa. Afaka manova ny tranokala ho APIs ary ny safidy voalohany amin'ny mpandrindra.

Dexi. io

Dexi. Tena tsara ho an'ny mpanao gazety sy mpandraharaha ara-nomerika izany. Vohikala onjam-peo marefo ho an'ny rafinera goavambe lehibe.

Data Scraping Studio

Fitaovana maimaim-poana misy safidy am-polony izay afaka manangona angona avy amin'ny HTML, tranonkala, PDF ary XML.

Easy Web Extract

Fanodinana tranonkala iray manontolo izany ho an'ny mpandraharaha sy ny mpikirakira aterineto. Ny safidy HTTP-tolotra nataony dia mahatonga azy ho tokana sy tsara kokoa noho ny hafa.

December 22, 2017