Chrome үчүн Скреперди кеңейтүү боюнча Semalt колдонмосу

Кандай гана болбосун бизнестин өсүшү жана акыры өсүшү үчүн, атаандаштарынан жана ар кандай тобокелчиликтерден озуп кетүү керек. Аналитикалык маалыматтарга негизделген чечим кабыл алуу бул көйгөйлөрдү унутуунун анык жолу. Мындай маалыматтарды маалыматты кысуу аркылуу алууга болот. Мына ушул жерде Chrome үчүн кыргычты оңой кеңейтүү кирет : ал маалыматтарды чогултуу процессин жеңилдетип қана койбостон, татаал жөндөөлөрсүз эле жол жүрүп кетүүгө мүмкүнчүлүк берет.

Скреперди кантип колдонсо болот

    1. Адегенде кеңейтүүнү орнотуу керек, андыктан Chrome веб дүкөнүнө өтүп, "кыргычты" издеп, Chrome-го кошууну чыкылдатыңыз.

    2. Маалыматты кырккыңыз келген веб-сайтка өтүңүз , сизди кызыктырган жазууну белгилеп белгилеп коюңуз. Аны оң баскыч менен чыкылдатып, калкып чыккан менюдагы "окшош таштарды" тандаңыз.

    3. Муну менен өзүнчө кыргыч консолунун терезеси ачылат. Бул жерде сиз кесилген маалыматтардын тизмесин көрө аласыз.

    4. Мазмунду сактоо үчүн "Google документтерине сактоо" баскычын чыкылдатыңыз, ал автоматтык түрдө Google электрондук таблицасына экспорттолот.

Узартылган кыргыч

Эгерде сиз көбүрөөк маалыматты кыргыңыз келсе, алдыңкы ыкманы колдонсоңуз болот. Эскертүү, сиз HTML жөнүндө бир аз билип калсаңыз, курал менен иштөө бир топ жеңилирээк болот. Убакыт катарларынын маалыматтарына негизделген архиви бар булактан дайындарды кыргыңыз келди дейли. Мындай учурда, сиз жогоруда сүрөттөлгөн ыкманы колдонуп көрсөңүз, анда бузулган маалыматты алмаксыз.

Бул маселени чечүү үчүн, XPath деп аталган HTML жана XML суроо тилин колдонсоңуз болот. Ал эмне кылат? XPath ар бир тандоодо камтылган ар кандай элементтер жөнүндө маалыматтарды тааныйт. Төмөндө бул жөнүндө кантип колдонсо болот:

1. Scraper консолуна өтүңүз, жогорку сол жактагы "XPath" баскычын байкап, аны басып, баштапкы таблицаны чогултуп алыңыз.

2. Сизге туура элемент үчүн XPath жазуу керек. Толук маалыматты камтыган учурдагы XPath мындай форматта көрсөтүлөт "// div [3] / div [3] / div [2] / div". <div> элементтерин компьютер HTML документинде тааныйт.

3. Таанылган маалыматтарды бөлүп алуу үчүн, Scraper тилкелерин колдонуу керек. Ан үчүн, сизде бар маалыматтын ар кандай түрлөрүн издөө керек. Сиз кыркып жаткан маалыматтарыңызга жараша аталыштарыңыз болушу мүмкүн. Бул аталыштар ар бир маалымат топтомунун жанында. Алар тег менен коштолушат, бул учурда <b> теги.

4. Текшерүү элементин колдонуп, XPathка <b> теги жана кошуңуз. Эми сиз ушул биринчи тилкени "аталыш мамы" деп белгилей аласыз, анткени ал аталыштардын тизмесин берет. Ар бир тилке үчүн ар кандай XPathтарды түзүүнү улантыңыз.

5. Скреперди чыкылдатыңыз жана кеңейтүү автоматтык түрдө маалыматтарды чогултат жана сиз орноткон ар башка тилкелерге жайгаштырылат.