Web Scraping e automazione dei test di Puppeteer: un'eccellente guida all'apprendimento del tutorial 3 di Puppeteer

Al giorno d'oggi, il Burattinaio sta ricevendo più attenzione come strumento di scraping web. Grazie alla semplicità, alla disponibilità come strumento open source e alla capacità di sviluppare applicazioni a pagina singola, Puppeteer sta ottenendo popolarità. Prima di iniziare a imparare sullo strumento di scraping web Puppeteer, dovremmo avere una conoscenza di base della riga di comando, Javascript e la struttura del DOM HTML. Il Tutorial burattinaio è stato suddiviso in pochi articoli che sono specificati nella tabella dei contenuti di seguito.

Tutorial burattinaio

Tutorial Tosca # 1: Panoramica del burattinaio

Tosca Tutorial # 2: Variabili d'ambiente del burattinaio

Tosca Tutorial # 3: Panoramica su Puppeteer Web Scraping e Puppeteer Test Automation

Tosca Tutorial # 4: Installa Puppeteer 

In questo articolo di Tutorial burattinaio, discuteremo di Puppeteer Web Scraping con un esempio e una panoramica dell'automazione del Puppeteer Test. 

Burattinaio Web Scraping

Il processo di estrazione dei dati da qualsiasi pagina web è chiamato web scraping. Il web scraping ha due passaggi. In primo luogo, recupera la pagina Web e quindi estrae i dati. Dopo l'estrazione dei dati, possiamo usarlo per qualsiasi API o memorizzarlo in un file CSV. 

Puppeteer è uno dei migliori strumenti per supportare il web scraping per il browser Google Chrome o Chromium. Il web scraping del burattinaio è spiegato in dettaglio con l'esempio seguente: 

Esempio di raschiatura web di burattinaio di base:

Passo 1# Il burattinaio lavora sulla libreria Node JS. Quindi, il primo passo è includere la libreria del burattinaio prima di scrivere lo script per il web scraping.

const puppeteerObj = require("puppeteer");

Passo 2# Dopo aver incluso la classe Puppeteer, dobbiamo scrivere una funzione asincrona utilizzando la parola chiave await. È richiesto poiché Puppeteer utilizza le promesse. Quindi chiama il metodo Puppeteer.launch () per richiamare il browser e chiama il metodo newPage () per creare un'istanza di pagina web.

const browserWeb = await puppeteerObj.launch();
const pageWeb = await browserWeb.newPage();

Passo 3# Ora chiama il metodo page.goto () per fornire l'URL del sito web desiderato.

await pageWeb.goto("https://techiescience.com/");

Passo 4# Usa il metodo page.evaluate () per catturare il testo di un particolare elemento (in questo esempio, cattureremo il testo dell'intestazione). 

const data = await pageWeb.evaluate(() => {   
const header = document.querySelector(".uabb-heading-text").innerText;
return { header };

Discuteremo come identificare qualsiasi oggetto dalla schermata web nel prossimo tutorial.

Tutorial burattinaio - Scraping web burattinaio
Tutorial burattinaio - Scraping web burattinaio

Passo 5# In questo ultimo passaggio, dobbiamo elaborare i dati e quindi chiudere la pagina web. Il codice completo di Puppeteer Web Scraping apparirà come di seguito:

const puppeteer = require("puppeteer");

async function scrap() {
  // Launch the browser
  const browserApp = await puppeteer.launch();
  // Create a page instance
  const pageApp = await browserApp.newPage();
  // invoke the web page for scraping
  await pageApp.goto("https://techiescience.com/");

  // Select any web element
const data = await pageApp.evaluate(() => {   
const header = document.querySelector(".uabb-heading-text").innerText;
return { header };

// Here we can do anything with this data. Here displaying the data
console.log(header);

 //We close the browser
  await browserApp.close();
}

Scrap();

Passo 6# Ora possiamo eseguire questo codice di web scraping del burattinaio usando il comando:  nodo index.js

Nota: Nel prossimo articolo, "Installa Puppeteer", discuteremo la configurazione dell'installazione di Puppeteer ed eseguiremo il codice di Puppeteer Web Scraping sopra.

Panoramica dell'automazione del test dei burattinai

Oltre al web scraping, il burattinaio ha le caratteristiche per eseguire anche le seguenti attività,

  • Cattura gli screenshot delle pagine web.
  • Possiamo salvare la schermata della pagina web come file pdf.
  • È possibile ottenere l'automazione dei passaggi manuali per eseguire i test dell'interfaccia utente.

Quindi, combinando tutte le funzionalità di cui sopra, possiamo utilizzare Puppeteer per l'automazione dei test. Per comprendere l'automazione dei test dei burattinai, in primo luogo, dobbiamo familiarizzare con il test del software.

Panoramica dei test:

Il test è necessario per garantire che tutti i requisiti software siano soddisfatti senza problemi. Sono disponibili diversi tipi di cicli di test dall'inizio del processo di sviluppo del software. Il software può essere testato manualmente o tramite l'approccio automatizzato.

Gli scopi del test del software sono:

  • Verifica la qualità dei prodotti.
  • Trova i bug del prodotto prima della distribuzione in produzione.
  • La verifica dei requisiti è soddisfatta.
  • Testare le prestazioni del prodotto.

I tipi di test sono spiegati qui:

Test unitari - Gli sviluppatori sono responsabili di eseguire test unitari durante la fase di sviluppo del codice.

Test d'integrazione - Questo test è necessario dopo aver integrato i diversi componenti del prodotto software. Lo scopo principale è garantire che tutte le interfacce funzionino senza problemi.

Test di sistema - È un test dettagliato che deve essere eseguito dopo l'integrazione per garantire che tutti i requisiti siano soddisfatti.

Test di accettazione degli utenti - È anche un test dettagliato che deve essere eseguito dall'utente finale del prodotto per garantire la qualità.

Test di regressione - È necessario per garantire che il processo aziendale principale funzioni senza problemi durante qualsiasi miglioramento del software.

Vantaggi dell'automazione dei test:

  • Riduci il ciclo di esecuzione.
  • Evita le possibilità di errori umani.
  • Ridurre al minimo gli sforzi di esecuzione dei test.
  • Rilascio veloce del software.
  • Aumentare la copertura dei test per ridurre il rischio.
  • Capacità di eseguire l'esecuzione parallela.

Perché burattinaio?

La maggior parte delle operazioni manuali eseguite nel browser Chrome possono essere automatizzate utilizzando Puppeteer. Quindi, il burattinaio è una buona scelta per test unitari su applicazioni web in modo rapido e semplice. 

I limiti di Burattinaio come strumento di test di automazione sono:

  • Supporta solo i browser Chrome e Chromium.
  • Il test del browser Coss non è possibile.
  • Non è possibile eseguire test mobili.

Test di Chrome headless:

Il browser headless indica che il burattinaio sta interagendo con un browser Chrome come applicazione in background, il che significa che l'interfaccia utente di Chrome non è visibile sullo schermo. Quindi, il test di Chrome senza testa significa che il test di automazione deve essere eseguito in un browser nascosto. Inoltre, dopo il test headless chrome, il burattinaio è in grado di acquisire correttamente la schermata web.

Burattinaio vs selenio

Il confronto tra Puppeteer e Selenium come strumento di test di automazione è spiegato di seguito:

  • Supporto del linguaggio di programmazione - Puppeteer supporta solo JavaScript, dove Selenium supporta i linguaggi Java, Python, Node.js e C #.
  • Supporto browser - Puppeteer è applicabile solo per i browser Chrome o Chromium, ma Selenium supporta anche i browser Chrome, Mozilla, Safari, IE e Opera.
  • Supporto della comunità - Supporto della community limitato a Google Gruppi, GitHub e Stack Overflow per Puppeteer. Ma per Selenium è disponibile un'ampia community di supporto su più forum.
  • Velocità di esecuzione - L'esecuzione dello script Puppeteer è più veloce di Selenium.
  • Installazione e configurazione - L'installazione e la configurazione di Puppeteer è un processo più facile e semplice.
  • Supporto multipiattaforma - Puppeteer non lo supporta, ma Selenium sì.
  • Registrazione - Le funzioni di registrazione non sono disponibili in Puppeteer. Ma questa funzione è disponibile per Selenium IDE.
  • Screenshot - Puppeteer ha la capacità di acquisire uno screenshot come immagine o formato pdf, dove Selenium può supportare solo il formato immagine.
  • Supporto della piattaforma di test: Burattinaio supporta solo i browser Web, ma Selenium può automatizzare il Web e mobile con Appium.
  • Abilità di codifica - È richiesto per il driver Web Puppeteer Selenium ma non per Selenium IDE.

Sulla base del confronto di cui sopra, possiamo concludere che Puppeteer farà la scelta migliore quando dovremo eseguire test a livello di unità per qualsiasi applicazione Web in cui è richiesta una soluzione rapida e flessibile. L'altro strumento, Selenium, sarà la scelta migliore quando è necessaria un'applicazione mobile e multipiattaforma test dell'applicazione. Clic qui per imparare il selenio da LambdaGeeks.

Conclusione:

In questo articolo introduttivo su Tutorial burattinaio, abbiamo appreso la panoramica di Puppeteer Web Scraping e Puppeteer Test Automation. Impareremo la guida passo passo per installare Burattinaio ed eseguire un piccolo script nel prossimo articolo di Burattinaio. Si prega di fare clic qui per visitare il portale di riferimento per questo tutorial burattinaio.

Lascia un tuo commento