Ricerca di duplicati in Excel

I duplicati nelle liste di indirizzi previste per le campagne di marketing fanno aumentare i costi della campagna e ne pregiudicano il successo. Trovare i duplicati nelle liste di indirizzi e cancellarli non è affatto difficile.

Per scoprire in che modo si originano i duplicati e come sono, invitiamo a leggere l'articolo 'Duplicati in liste di indirizzi' in cui è spiegato perché per eseguire la ripulitura di duplicati non è molto opportuno utilizzare strumenti semplici o addirittura procedere manualmente. Solo programmi ad alta prestazione, come il DeduplicationWizard, forniscono infatti risultati veramente utili. E con il DeduplicationWizard è facilissimo anche trovare gli inserimenti multipli nelle liste di indirizzi e da lì cancellarli.

Procedere nel seguente modo:

  1. Se non si è già provveduto, da qui è possibile scaricare il DeduplicationWizard gratuitamente. Installare il programma e richiedere un'attivazione test. In questo modo può lavorare con il programma per una settimana senza alcuna limitazione.
  2. La funzione necessaria è 'Deduplica in un file'.

    Deduplica in una tabella

  3. Dopo aver chiamato questa funzione, selezionare subito il criterio di deduplica. La ricerca di duplicati può essere effettuata per indirizzo postale, numero telefonico o indirizzo e-mail. Selezioniamo l’indirizzo postale.

    Criterio per la ricerca

  4. Dopo aver fatto clic sul pulsante 'Avanti' aprire il file di Excel da modificare.

    Selezionare il file

    Se del file Excel interessato si deve utilizzare un foglio di lavoro diverso dal primo, è possibile selezionarlo successivamente, dalla finestra di dialogo in cui viene effettuata anche l’attribuzione campo.
  5. Dopo aver aperto il file Excel, il programma ci porta automaticamente al passaggio successivo, l'attribuzione campo. Si dovrà indicare al programma quali informazioni trova in quale colonna della tabella, ad esempio qual è la colonna contenente la via o il nome della località. A tal fine, dalle liste di selezione con i nomi delle colonne della tabella si deve selezionare il campo dati che meglio si adatta alla definizione a sinistra.

    Attribuzione campo

    Il programma predefinisce automaticamente questa attribuzione campo sulla base dei nomi delle colonne. Poiché vogliamo cercare duplicati con l'indirizzo postale, anche per tutti i componenti dell'indirizzo postale si dovranno indicare le colonne della tabella da elaborare in cui sono memorizzate tali informazioni. Il risultato dell’attribuzione campo può essere controllato mediante il 'Controllo dell’attribuzione campo', a destra sulla videata.
  6. Con il pulsante di comando 'Avanti', si apre la finestra di dialogo in cui è configurata la funzione effettiva. Qui si deve indicare soprattutto il valore soglia per il massimo scostamento ammesso tra due indirizzi.

    Fattore di corrispondenza

    Dalla deduplica è inoltre possibile escludere singoli componenti dell'indirizzo postale; in questo caso, ovviamente, per ogni componente dell'indirizzo postale da confrontare nell'attribuzione campo eseguita con il passaggio precedente, si deve indicare anche una colonna della tabella da elaborare.
  7. Facendo clic sul pulsante 'Avanti' ha quindi inizio la ricerca di duplicati che in breve visualizzerà un riepilogo del risultato.

    Risultato della deduplica

    Se nella tabella da elaborare il programma ha trovato dei duplicati, per iniziare la rielaborazione manuale basta fare clic sul pulsante di comando 'OK'. Altrimenti è opportuno selezionare un valore soglia del grado di corrispondenza più basso e riavviare la deduplica.
  8. Con la 'Rielaborazione manuale' il risultato della deduplica appare in forma di tabella. I record di dati da cancellare sono contrassegnati con una croce rossa, che se necessario può essere eliminata o spostata in un altro record di dati del gruppo di duplicati.



  9. Con un altro clic sul pulsante di comando 'Avanti' si apre la finestra di dialogo con le funzioni che permettono di elaborare ulteriormente il risultato. I record di dati marcati per la cancellazione si potrebbero ad esempio eliminare direttamente dal file di origine con un semplice clic sul pulsante di comando 'Cancellare nel file di origine'.

    Cancellare nel file di origine

La ricerca di duplicati in una tabella può essere eseguita anche con DataQualityTools, che offre maggiori possibilità rispetto al DeduplicationWizard, non solo nella ricerca di duplicati.

Nota: per il DeduplicationWizard esiste un video didattico che nei comandi del programma introduce la ricerca di duplicati in una tabella.

Il nostro articolo 'Ricerca di duplicati tra due tabelle in Excel' spiega come cercare duplicati in due tabelle utilizzando DeduplicationWIzard.