Ricerca di duplicati tra due tabelle in Access

Le liste di opposizione sono una componente importante del marketing. Tenerle aggiornate ora non è più difficile e con DataQualityTools diventa possibile anche elaborarle senza difficoltà.

Le liste di opposizione sono il sistema ideale sia per soddisfare il desiderio dei singoli destinatari di non ricevere pubblicità sia per risparmiare. Le liste di opposizione personalizzate consentono inoltre di escludere da specifiche campagne di marketing anche i concorrenti, i propri dipendenti o addirittura i propri clienti consolidati, ad esempio per una campagna promozionale mirata ad acquisire clienti nuovi.

Per elaborare liste di opposizione occorre un programma in grado di eseguire una ricerca fuzzy di duplicati tra due tabelle, come ad esempio DataQualityTools. Con la ricerca di duplicati tra due tabelle è anche possibile sincronizzare liste di indirizzi, ad esempio, per evitare di inviare pubblicità a indirizzi che sono già stati oggetto di una precedente campagna di marketing oppure per trasferire informazioni da una lista di indirizzi a un'altra, come il numero di telefono o il codice cliente, sulla base del risultato della deduplica. La ricerca di duplicati tra due tabelle ha molteplici possibilità di impiego e con DataQualityTools è anche veloce.

Procedere nel seguente modo:

  1. Se non si è già provveduto, da qui è possibile scaricare il DataQualityTools gratuitamente. Installare il programma e richiedere un'attivazione test. In questo modo può lavorare con il programma per una settimana senza alcuna limitazione.
  2. La funzione che ci occorre si trova nel menu, nel blocco 'Deduplica tra due tabelle'. Lì selezioniamo 'Doblonatura universale'.

    Doblonatura universale

  3. Dopo aver chiamato questa funzione, viene innanzitutto visualizzata la gestione progetti. Inserire qui un nuovo progetto con un nome di progetto a piacere e quindi fare clic sul pulsante di comando 'Avanti'.
  4. Nel passo successivo, con il pulsante di comando 'Aprire file' innanzitutto apriamo il file ACCESS contenente i dati da elaborare.

    Origine dati Access

    Inserire infine il nome del server database. Dopo aver fatto clic sul pulsante di comando 'Connessione al server', inserire i dati di accesso. Il database e la tabella desiderati infine si selezionano dalle relative liste.
  5. Quindi dire al programma quali colonne della tabella si desidera confrontare:

    Definizione di deduplica

    In questo esempio, tra le altre si deve confrontare la colonna 'City'. Questa colonna contiene il nome della localita, motivo per cui è stata scelta 'Localita' dall'elenco di selezione per il contenuto del campo. Come soglia per il fattore di corrispondenza è stato scelto il 70%. Il nome della localita deve quindi corrispondere almeno del 70%, in modo che la serie di dati in questione far parte nel risultato.

    Se necessario, anche singole colonne possono essere combinate per formare un gruppo:

    Definizione di deduplica

    I contenuti delle colonne sono poi riassunti nel gruppo prima del confronto e sono quindi confrontati tra loro. In questo esempio, il contenuto dei campi di dati "Street" e "HouseNo" della tabella 1 viene confrontato con il contenuto del campo di dati "Street" della tabella 2.
  6. Con un clic sul pulsante 'Avanti' si accede a una finestra di dialogo con ulteriori opzioni. In questo caso, tuttavia, non ci servono.
  7. Facendo clic sul pulsante 'Avanti' ha quindi inizio la ricerca di duplicati che in breve visualizzerà un riepilogo del risultato. 

    Risultato della deduplica

    Se tra le tabelle da elaborare il programma ha trovato dei duplicati, facendo clic sul pulsante di comando 'OK' si apre la finestra di dialogo con le funzioni che consentono di continuare ad elaborare il risultato. Altrimenti è opportuno selezionare un valore soglia del grado di corrispondenza più basso e riavviare la deduplica.
  8. La parte superiore della finestra di dialogo con le funzioni che consentono di continuare l'elaborazione presenta un pulsante di comando con la dicitura 'Rielaborazione manuale'. Il risultato della deduplica qui appare in forma di tabella in cui i record di dati da cancellare sono contrassegnati con una croce rossa, che se necessario può essere eliminata.

    Risultato della deduplica

  9. Il risultato infine deve essere ulteriormente elaborato.I record di dati marcati per la cancellazione si potrebbero ad esempio eliminare direttamente dal file di origine. A questo scopo, selezioniamo la funzione appropriata cliccando prima su 'Funzioni di cancellazione':

    Funzioni di cancellazione

    Quindi su ''Cancellare nel file di origine'':

    Cancellare nel file di origine'

La ricerca di duplicati tra due tabelle può essere effettuata anche nel DedupeWizard, che può elaborare unicamente i file Excel e dispone unicamente delle funzioni di DataQualityTools più importanti.

Nota: per il DataQualityTools esiste un video didattico che nei comandi del programma introduce la ricerca di duplicati in una tabella.

Per sapere in che modo sia possibile utilizzare il DataQualityTools per effettuare la ricerca di duplicati all'interno di una lista di indirizzi, invitiamo a leggere l'articolo 'Ricerca di duplicati in Access'.