Deduplica di duplicati

DataQualityTools 4.09 - Il software con cui trarre il massimo dai propri dati.

 

Altri software di deduplica:

 

Video didattico
Download
 Acquista ora

Confronto caratteristiche

 

Deduplica in Excel, ACCESS, SQL

DataQualityTools è un insieme di strumenti incentrati sul tema 'Qualità dei dati'. Il componente centrale è costituito da una serie di funzioni che permettono di trovare i set di dati doppi, di cui una in particolare consente di effettuare la ricerca fuzzy dei duplicati partendo dall’indirizzo postale (origine dati: ACCESS, EXCEL, MS SQL-Server, MySQL, PostgreSQL, ORACLE, dBase, OpenOffice Calc, VistaDB, file CSV e file di testo). Nel caso di marketing diretto, in questo modo si possono evitare pubblicità doppie e un sovraccarico di lavoro derivante dall’inutile aggiornamento multiplo dei dati di clienti e indirizzi, ottenendo non soltanto un risparmio sui costi ma anche un’immagine aziendale migliore. Tenendo inoltre in considerazione le liste di opposizione, o liste Robinson, si potranno evitare problemi con i destinatari che non desiderano ricevere pubblicità.

Di seguito una breve panoramica sulle principali caratteristiche di DataQualityTools:

  • Deduplica di set di indirizzi più veloce, ampiamente automatizzata e pertanto più facile da utilizzare. Come criterio di deduplica è possibile adottare anche l’indirizzo postale (doblonatura di duplicati fuzzy), il numero telefonico, l’indirizzo di posta elettronica (e-mail), il codice cliente e il codice fiscale/partita IVA.
  • Possibilità di deduplica tra due tabelle, ad esempio a fronte di liste di opposizione (black list).
  • Possibilità di arricchire un set di dati sulla base del risultato di deduplica.
  • Possibilità di raggruppare diverse tabelle in un’unica azione di deduplica.
  • Doblonatura universale definibile liberamente e quindi applicabile a qualsiasi dato.
  • Numerose possibilità di elaborare ulteriormente il risultato di deduplica: oltre ad eseguire la cancellazione diretta nel file di origine, è possibile marcare i risultati nel file di origine o elaborarli ulteriormente mediante una stored procedure, un file duplicato, un file di risultato o un file di archivio.
  • Storico del progetto, che indica cosa sia stato fatto e in che momento per un determinato progetto.
  • Registri di cancellazione e dei risultati che possono essere corredati di commenti e del proprio logo ed essere inoltre salvati in formato PDF.
  • Varie funzioni per la preparazione di indirizzi e set di dati, tra cui una funzione per correggere le maiuscole, una per sostituire i termini e una per cancellare in maniera mirata singoli set di dati.
  • Varie funzioni per scomporre e raggruppare campi di dati, tra l’altro per scomporre numeri telefonici e indirizzi di posta elettronica.
  • Varie liste di riepilogo che consentono di ottenere rapidamente una panoramica del set di indirizzi.
  • Possibilità di elaborare set di dati di (quasi) ogni tipo, ad esempio ACCESS (mdb), ACCESS 2007 / ACCESS 2010 (accdb), VistaDB (vdb3), EXCEL (xls), EXCEL 2007 / EXCEL 2010 (xlsx), OpenOffice Calc (ods), dBase (dbf), file CSV e file di testo, ma anche server database quali MS SQL-Server, MySQL, PostgreSQL e ORACLE.
  • Possibilità di elaborare anche grandi quantità di dati, come è stato comprovato da un test effettuato, tra l’altro, con MS SQL-Server e con ACCESS, che in meno di un’ora hanno elaborato 5,5 milioni di record di dati ciascuno.
  • I file di indirizzo allegati come esempio offrono un quadro chiaro del volume di funzioni e della capacità di performance del programma.
  • Testato ed eseguibile con Windows 7 (32Bit/64Bit), Windows Vista (32Bit/64Bit) e Windows XP.