Semalt: Як выкарыстоўваць пашырэнне Chrome для вэб

Існуе вялікая колькасць дадзеных, даступных праз сетку. Спрабаванне скапіяваць дадзеныя ў зручную базу дадзеных непасрэдна з сайта можа быць працаёмкім працэсам. Такім чынам, выкарыстанне метаду выскрабання ў Інтэрнэце для здабывання дадзеных з вэб-сайтаў дазваляе зэканоміць ваш час, энергію і грошы.
Выдаленне з Інтэрнэту, таксама вядомае як "Выдаленне дадзеных у Інтэрнэце" альбо "Інтэрнэт-збор", - гэта працэс выкарыстання ботаў для здабывання дадзеных з сайтаў. Вэб-скрэперы перамяшчаюцца па сайце, ацэньваюць яго ўтрыманне, а потым выцягваюць і змяшчаюць яго ў табліцу або базу дадзеных.
На рынку ёсць мноства інструментаў для выскрабання ў Інтэрнэце , але яны досыць дарагія і не простыя ў карыстанні кемлівым не-тэхнічным людзям. Аднак пашырэнне Chrome Scraper Chrome з'яўляецца бясплатным і простым у выкарыстанні. З гэтым пашырэннем вы нават можаце спыніць працэс у сярэдзіне сваёй працы.
Вы можаце спампаваць праграмнае забеспячэнне Web Scraper Chrome Extension з вэб-крамы Google Chrome. Адзіны мінус заключаецца ў тым, што вы павінны саскрэбіць сайт уручную, і гэта няпросты працэс. Акрамя таго, вы не можаце ажыццяўляць вычышчэнне праз пэўныя прамежкі часу праграмна.

Усталёўка пашырэння Chrome Chrome
- Адкрыць браўзэр Google Chrome;
- Наведайце вэб-краму Chrome і знайдзіце пашырэнне вэб-скрабкоў;
- Дадаць інструмент у Chrome;
- Цяпер вы гатовыя пачаць выскрабаць сайты з дапамогай браўзэра Chrome.
Пасля ўстаноўкі скрабка націсніце F12, каб адкрыць інструменты распрацоўшчыка Google Chrome. Акрамя таго, вы можаце пстрыкнуць правай кнопкай мышы на экране і выбраць «праверку элемента». Пасля таго, як вы адкрыеце Інструменты для распрацоўнікаў, вы ўбачыце ўкладку пад назвай "Веб-скрабок".
Зараз давайце даведаемся, як выкарыстоўваць гэта на жывой вэб-старонцы. Давайце ўявім, што мы хочам пераламаць сайт Awesomegifs і здабыць з яго некаторы змест і дадзеныя. Адкрыйце сайт. Што першае, што вы бачыце? Выявы ляніва загружаныя, так?
Пасля таго, як вы адкрыеце вэб-старонку, вам неабходна распазнаць графічныя URL-адрасы. Гэта азначае, што вам трэба вызначыць CSS-селектар, які адпавядае малюнкам. На сайце прыблізна 130 старонак з выявамі; і для пераключэння паміж старонкамі трэба змяніць нумар старонкі, якая ў цяперашні час складае 125. Самы просты спосаб зрабіць гэта - стварыць новую мапу сайта і дадаць поле Стартавы URL. Такім чынам, Web Scraper будзе прапанавана адкрываць URL пастаянна, тым самым павялічваючы канчатковае значэнне ў працэсе. Ён адкрые першую старонку, другую старонку, трэцюю старонку ..., пакуль яна не дасягне старонкі 125.
Каб пачаць працэс выскрабання, адкрыйце ўкладку карты сайта і націсніце «Скрап». Інструмент пачне выскрабаць неабходныя дадзеныя. У выпадку, калі вы хочаце спыніць працэс выскрабання пасярэдзіне, проста зачыніце Window і перайдзіце на ўкладку сайта, каб экспартаваць здабытыя дадзеныя ў файл CSV.