Welcome, Guest. Please login or register.

Author Topic: Tutorial extragere date cu GoogleDocs  (Read 1797 times)

0 Members and 1 Guest are viewing this topic.

Offline Shtrumphu

  • Marketer, Content writer.
  • Hero Member
  • *****
  • Posts: 1412
  • Reputation: +234/-136
  • Gender: Male
    • View Profile
    • Reduceri haine
Tutorial extragere date cu GoogleDocs
« on: April 17, 2014, 04:10:27 PM »
Avand in vedere ca nu sunt programator, deci nu pot realiza scripturi care sa extraga anumite date de pe pagini web, a trebuit sa caut o alternativa. Am intrebat acum ceva timp aici cum se poate face, insa nu a raspuns nimeni, asa ca va las un exemplu, in caz ca are cineva nevoie...sunt destule aplicatii ale functiei ImportXML din GoogleDocs.


Deci, cum extragem date de pe o pagina web? Putem folosi GoogleDocs, deschidem o foaie de calcul(spreadsheet) si vom folosi functia ImportXML. Aveti un exemplu aici: https://docs.google.com/spreadsheet/ccc?key=0AiMnI3tjG6lcdExMN0FEOUtDa2RaOXdrRFFYM0VTRUE&usp=sharing   in care vedeti cum 2-3 formule va scutesc de 50 de copy/paste. Cum spuneam, sunt multe aplicatii. In casuta A2 am folosit adresa unui site cu o lista, in casutele B2, C2, D2 vedeti formula folosita pentru a extrage fiecare element in parte.


Cum identifici elementul? Pentru asta e nevoie sa te uiti in codul sursa, si sa vezi ce elemente se repeta. De exemplu nota filmelor se afla in div class=rating de aici si formula din casuta D2. O alta metoda de a vedea calea completa catre un element este sa dati click dreapta in Chrome pe un element, il reperati in partea de jos, click dreapta in consola de jos si Copy Xpath. E un pic mai greu de identificat, eventual va informati de pe alte site-uri.


Alte informatii: din pacate in GoogleDocs numarul datelor e limitat... teoretic ar trebui sa mearga si in Excel, insa eu unul nu am reusit pana acum sa il fac. Pentru a explica mai bine ce face functia (rog expertii sa nu rada) voi "traduce" cam cum am inteles eu:
Code: [Select]
=importxml(A2,"//*[@class='title extended_movie_info_space']/h2")e ca si cum ai da comanda: importeaza elementele xml de pe pagina din casuta A2, extrage orice element cu class=title.... inchis in tagul h2.  Sau ceva de genul.

ArenaWeb

Tutorial extragere date cu GoogleDocs
« on: April 17, 2014, 04:10:27 PM »