Back to Question Center
0

Chrome Web Scraper Tutorial od Semalt Expert

1 answers:

Pokud používáte prohlížeč Google Chrome, což může pomoci vyškrábat webové stránky. Je známá jako "Scrapper" a může být využita bez problémů. Scrapper pomůže škrábat obsah webových stránek a nahrát výsledky do dokumentů Google.

Jak odstranit webové stránky pomocí rozšíření škrabáka?

1. V prohlížeči Google Chrome vyberte Internetový obchod Chrome;

2. V rozšířeních proveďte hledání "Scrapper";

3. Prvním výsledkem vyhledávání je přípona známá jako "Scrapper";

4. Zvolte tlačítko uvedené jako '' Přidat do Chromu ',

5. Vraťte se do seznamu britských poslanců

8. Klikněte pravým tlačítkem myši na "Scrape"

9. Konzola pro scrapper se objeví v dalším okně,

10. Zobrazit škrábaný obsah ve škrabáku

11. Chcete-li zajistit, aby byl obsah uložen jako Tabulka Google, vyberte možnost Uložit do Dokumentů Google ...

Rozšířená oškrábání

, je užitečné porozumět základům HTML. Například si můžete přečíst krátký úvod do HTML pomocí tohoto odkazu

Představme si, že nás zajímá všechny filmy, které hrály Asia Argento,

1. V IMDB je velmi podrobný archiv herců, kde je stránka Asia Asia: https://www.imdb.com/name/nm0000782/;

2. Zde si můžete prohlédnout všechny role herečky..Začněme šrotovat informace, o které nás zajímá;

3. Snažte se oškrabat, jak bylo popsáno výše;

4. Uvidíte, že seznam je trochu zkreslený. To je způsobeno skutečností, že seznam zde může být strukturován jinak;

5. Přejděte ke konzole škrabky. Vlevo nahoře uvidíte malý rámeček, který říká XPath;

6. Xpath je druh dotazovacího jazyka, který pracuje pro XML a HTML;

7. XPath může pomoci najít části stránky, které vás zajímá. Další věcí je najít vhodný prvek a zapsat XPath pro něj;

8. Pořiďte si náš stůl;

9. Uvidíte, že naše stávající XPath, který má všechna potřebná data, je "// div [3] / div [3] / div [2] / div";

10. XPath informuje systém o zobrazení dokumentu HTML a zvolí třetí prvek, pak druhý prvek a pak všechny;

11. Rádi bychom však naši data oddělili;

12. Využijte sekci sloupců v konzole pro scrapper, abyste to provedli;

13. Nejprve najděte náš titul РІР, "Použijte Inspect Element pro zobrazení titulu;

14. Zkontrolujte název v tagu. Přidejte značku na XPath;

15. Zdá se, že výraz funguje přiměřeně, takže je náš první sloupec;

16. V části "Sloupce" nahraďte název prvního sloupce na "název";

17. Přidejte XPath k němu;

18. V části sloupce jsou XPaths relativní a to znamená, že "./b" zvolí prvek

pro název sloupce, přidejte "./b" a vyberte "škrábání";

20. Nyní pokračujme rok. Roky lze nalézt v jednom rozpětí;

21. Vytvořte nový sloupec výběrem malého plusu vedle sloupce titulu;

22. Pomocí XPath "./span" vytvořte sloupec pro "rok";

23. Klikněte na škrábání a podívejte se, jak byl rok přidán;

24. Hotovo!

December 6, 2017
Chrome Web Scraper Tutorial od Semalt Expert
Reply