A tal fine, si potrebbe ad esempio utilizzare la funzione corrispondente di DataQualityTools. Poiché questa funzione non distingue tra contatti duplicati e contatti in eccesso, è necessario eseguire prima una pulizia dei duplicati, in cui tutti i contatti presenti due o più volte vengono eliminati dalla tabella. A tal fine è possibile utilizzare, tra le altre cose, la funzione “Confronto tramite indirizzo postale” di DataQualityTools. Successivamente è possibile rimuovere dalla tabella i contatti in eccesso.

Procedere nel seguente modo:

  1. Se non si è già provveduto, da qui è possibile scaricare il DataQualityTools gratuitamente. Installare il programma e richiedere un'attivazione test. In questo modo può lavorare con il programma per una settimana senza alcuna limitazione.
  2. La funzione che ci occorre si trova nel menu, nel blocco 'Deduplica in una tabella'. Lì selezioniamo 'Limitare il numero di contatti per indirizzo'.

    'Limitare il numero di contatti per indirizzo

  3. Dopo aver chiamato questa funzione, viene innanzitutto visualizzata la gestione progetti. Inserire qui un nuovo progetto con un nome di progetto a piacere e quindi fare clic sul pulsante di comando 'Avanti'.
  4. Nel passo successivo, con il pulsante di comando 'Aprire file' innanzitutto apriamo il file Excel contenente i dati da elaborare.

    Origine dati Access

    La tabella desiderati infine si selezionano dalle relative liste.
  5. Indicare infine al programma in quale colonna della tabella si trova quale informazione, ad esempio qual è la colonna contenente la via o il nome della località. A tal fine, dalle liste di selezione con i nomi delle colonne della tabella si deve selezionare il campo dati che meglio si adatta alla definizione a sinistra.

    Attribuzione campo

    Il programma predefinisce automaticamente questa attribuzione campo sulla base dei nomi delle colonne. Poiché vogliamo cercare duplicati con l'indirizzo postale, anche per tutti i componenti dell'indirizzo postale si dovranno indicare le colonne della tabella da elaborare in cui sono memorizzate tali informazioni. Il risultato dell’attribuzione campo può essere controllato mediante il 'Controllo dell’attribuzione campo', a destra sulla videata.
  6. Con il pulsante di comando 'Avanti', si apre la finestra di dialogo in cui è configurata la funzione effettiva. Qui occorre innanzitutto specificare il valore soglia per il massimo scostamento ammesso tra due indirizzi.

    Fattore di corrispondenza

    E naturalmente il numero massimo di contatti per indirizzo che devono essere mantenuti:

    Numero massimo di contatti

    Con l'aiuto della regola di cancellazione, se necessario, è possibile specificare l'ordine dei record all'interno di un gruppo del risultato. In questo modo è possibile controllare quali record all'interno di un gruppo vengono cancellati, ad esempio i record più vecchi per primi.
  7. Facendo clic sul pulsante 'Avanti' ha quindi inizio la funzione che in breve visualizzerà un riepilogo del risultato.

    Risultato della deduplica

    Se nella tabella da elaborare il programma ha trovato dei duplicati, facendo clic sul pulsante di comando 'OK' si apre la finestra di dialogo con le funzioni che consentono di continuare ad elaborare il risultato. Altrimenti è opportuno selezionare un valore soglia del grado di corrispondenza più basso e riavviare la deduplica.
  8. La parte superiore della finestra di dialogo con le funzioni che consentono di continuare l'elaborazione presenta un pulsante di comando con la dicitura 'Rielaborazione manuale'. Il risultato della deduplica qui appare in forma di tabella in cui i record di dati da cancellare sono contrassegnati con una croce rossa, che se necessario può essere eliminata.

    Risultato della deduplica

  9. Il risultato infine deve essere ulteriormente elaborato.I record di dati marcati per la cancellazione si potrebbero ad esempio eliminare direttamente dal file Excel. A questo scopo, selezioniamo la funzione appropriata cliccando prima su 'Funzioni di cancellazione':

    Funzioni di cancellazione

    Quindi su ''Cancellare nel file di origine'':

    Cancellare nel file di origine'

La ricerca di duplicati in una tabella può essere eseguita anche nel DedupeWizard, che può elaborare unicamente i file Excel e dispone unicamente delle funzioni di DataQualityTools più importanti.

Nota: per il DataQualityTools esiste un video didattico che nei comandi del programma introduce la ricerca di duplicati in una tabella.

Il nostro articolo 'Ricerca di duplicati tra due tabelle in Access' spiega come cercare duplicati in due tabelle utilizzando DataQualityTools.