Hvad er dataskrabning?
Dataskrabning er den teknik, der hjælper med udvinding af ønsket information fra en HTML-webside til en lokal fil, der findes i din lokale maskine. Normalt kan en lokal fil svare til en excel-fil, word-fil eller at sige ethvert Microsoft-kontorapplikation. Det hjælper med at kanalisere kritisk information fra websiden.
Dataskrabning bliver enkel, når man arbejder med et forskningsbaseret projekt dagligt, og et sådant projekt er rent afhængigt af internettet og hjemmesiden. For at illustrere yderligere om emnet, lad os tage eksemplet med en dagshandler, der kører en excel-makro til at trække markedsoplysninger fra et finansieringswebsted til et excel-ark ved hjælp af VBA.
I denne vejledning lærer du:
- Hvad er dataskrabning?
- Hvordan forberedes Excel-makro inden udførelse af dataskrabning ved hjælp af Internet Explorer?
- Hvordan åbner jeg Internet Explorer ved hjælp af Excel VBA?
- Hvordan åbner jeg websted i Internet explorer ved hjælp af VBA?
- Hvordan skrabes information fra webstedet ved hjælp af VBA?
Hvordan forberedes Excel-makro inden udførelse af dataskrabning ved hjælp af Internet Explorer?
Der er visse forudsætninger, der skal udføres på excel-makrofilen, før de går i gang med dataskrabning i Excel.
Disse forudsætninger er som følger: -
Trin 1) Åbn en Excel-baseret makro, og få adgang til udviklerens mulighed for excel.
Trin 2) Vælg Visual Basic-indstilling under Udviklerbånd.
Trin 3) Indsæt et nyt modul.
Trin 4) Initialiser en ny subrutine
Sub test()End sub
Modulet ville resultere som følger: -
Trin 5) Få adgang til referencemuligheden under fanen værktøj og henvis Microsoft Microsoft Object Object Library og Microsofts internetkontrol.
Følgende filer henvises til modulet, da det hjælper med at åbne internet explorer og letter udviklingen af makro-scripting.
Nu er Excel-filen klar til at interagere med Internet Explorer. Det næste trin ville være at inkorporere makro-scripts, der letter dataskrabning i HTML.
Hvordan åbner jeg Internet Explorer ved hjælp af Excel VBA?
Trin 1) Initialiser variablen i underrutinerne som vist nedenfor
Sub test()Dim ie As New InternetExplorerDim doc As New HTMLDocument
Trin 2) For at åbne internet explorer ved hjælp af VBA, skriv dvs. synlig = sand og tryk på F5.
Sub test()Dim ie As New InternetExplorerDim doc As New HTMLDocumentIe.visible=true
Modulet ser ud som følger: -
Hvordan åbner jeg websted i Internet explorer ved hjælp af VBA?
Her er trin til at åbne websted i Internet exploer ved hjælp af VBA
Trin 1) Når du er i stand til at få adgang til Internet Explorer ved hjælp af Excel VBA, vil det næste trin omfatte adgang til et websted ved hjælp af VBA. Dette lettes af Navigate Attribute, hvor URL'en skal passere som dobbelt anførselstegn i attributten. Følg følgende trin som vist.
Sub test()Dim, ie As New InternetExplorerDim doc As New HTMLDocumentDim ecoll As Objectie.Visible = Trueie.navigate"http://demo.guru99.com/test/web-table-element.php"DoDoEventsLoop Until ie.readyState = READYSTATE_COMPLETE
Trin 2) - Tryk på F5 for at udføre makroen. Den følgende webside åbnes som vist
Nu er excel-makroen klar med hensyn til udførelse af skrabefunktionerne. Det næste trin viser, hvordan oplysningerne kan udvindes fra internet explorer ved hjælp af VBA.
Hvordan skrabes information fra webstedet ved hjælp af VBA?
Antag, at den daglige erhvervsdrivende ønsker at få adgang til dataene fra hjemmesiden på daglig basis. Hver gang den daglige erhvervsdrivende trykker på klik på knappen, skal den automatisk trække markedsdataene til excel.
Fra ovenstående webside ville det være nødvendigt at inspicere et element og observere, hvordan dataene er struktureret.
Trin 1) Få adgang til nedenstående kildekode for HTML ved at trykke på kontrol + Skift + I
Company | Group | Pre Close (Rs) | Current Price (Rs) | % Change |
---|