Sviluppato da | Tecnologie OutWit |
---|---|
Ultima versione | 9.0 |
Sistema operativo | Microsoft Windows , macOS e Linux |
genere | software di web scraping , download manager |
Licenza | licenza di proprietario |
Sito web | www.outwit.com |
OutWit Hub è un software di web scraping , progettato per estrarre e raccogliere automaticamente informazioni da risorse online o locali.
Il programma riconosce e raccoglie link, immagini, documenti, contatti, parole ricorrenti e gruppi di parole, feed RSS e converte dati strutturati o non strutturati in tabelle formattate che possono essere esportate su fogli di calcolo o database . La prima versione del software è stata rilasciata alla fine del 2010. Da allora è stata rilasciata la versione 9.0gennaio 2020.
Il programma include un browser web e un pannello laterale che fornisce l'accesso a una serie di viste contenenti dati da estrattori predefiniti. Le pagine Web e i documenti di testo sono suddivisi in diversi componenti e presentati come tabelle in queste viste. L'applicazione può scorrere automaticamente una serie di link o sequenze di pagine dei risultati dei motori di ricerca per estrarre le informazioni ricercate, organizzarle in tabelle ed esportarle in vari formati. Gli estrattori predefiniti consentono di raccogliere tabelle, elenchi e flussi strutturati. Se queste estrazioni automatiche non sono sufficienti, l'utente può anche creare raschietti specifici per estrarre elementi da pagine meno strutturate. Le espressioni regolari possono essere utilizzate negli scraper e in altre parti dell'applicazione per definire marcatori variabili per il riconoscimento e l'estrazione dei dati.
Il programma esiste in due versioni: un'applicazione eseguibile e un componente aggiuntivo di Mozilla Firefox , con funzionalità identiche. Una versione gratuita e limitata può essere scaricata dal sito dell'editore e dai siti di download.