Anonimiza tus datos

Última actualización el 20/03/2024
Tiempo de leer: 3 minutos

Si está trabajando en un libro que contiene datos confidenciales, debe anonimizar sus datos si está colaborando con otros. La técnica no es realmente compleja, pero hay que respetar los siguientes pasos.

El documento inicial

Imagina que eres un periodista y recibes el siguiente archivo en tu buzón (son todos datos falsos). En unos meses, estos datos serán conocidos como la Papeles de Nicaragua 😉

Antes de compartir el libro de trabajo, veamos cómo podemos anonimizar los nombres.

Datos_anónimos_1

Paso 1: duplicar la columna anónima

Duplica la columna que contiene los nombres en la columna H, por ejemplo.

Datos_anónimos_2

Puedes hacer esto con un estándar. copiar y pegar o utilizando el atajo ctrl tecla con el ratón.

Duplicar con Ctrl

Paso 2: Extraer sin duplicados

Entonces tú eliminar duplicados (Datos>Eliminar duplicados) mantener un solo nombre.

El resultado entonces es el siguiente:

Eliminar duplicados no elimina los errores ortográficos. Como habrás notado, todavía tenemos a Jacky Chin dos veces porque el nombre se escribe diferente. Sería tentador corregir el error en el archivo fuente, pero en el análisis de datos, la regla principal es dejar los datos sin procesar como están.

Paso 3: agrega el código anónimo

Agregaremos el código para reemplazar los nombres originales en la columna I. Escribiremos el valor NAME001 en la celda I2.

Luego, con el controlador de relleno, debemos arrastrar hacia abajo para aumentar la serie de números automáticamente 😉. El resultado entonces es.

Datos_anónimos_4

Paso 4: Reemplace los nombres originales

Ahora necesitamos reemplazar el nombre original en la columna A por el código anónimo. Para hacer eso usaremos el Función VLOOKUP.

Insertemos una columna cerca del nombre original y escribamos la siguiente fórmula

=VLOOKUP(A2,$I$2:$J$11;2;0)

$ signos significa que las referencias no se moverán. El resultado ahora es el siguiente.

Datos_anónimos_5

Paso 5: Reemplazar fórmulas por valores

La columna B ahora contiene los resultados de la fórmula. Debemos convertir estos resultados en valores. Esto se hace muy fácilmente con un valor especial Copiar/Pegar

  • Selecciona tus celdas en la columna B y haz una copia simple (Ctrl + C)
  • No cambies tu selección y seleccione el menú Pegado especial haciendo clic en la pequeña flecha debajo del icono Pegar.
  • En las opciones, selecciona este ícono para hacer un collage en valor

Todas las fórmulas de la columna B han sido reemplazadas por sus valores en las celdas.

Paso 6: eliminar el nombre original

Ahora solo nos queda borrar el valor de la columna A

  • Seleccione la columna A y clic derecho> Eliminar
  • Seleccione la columna A y aplique el método abreviado de teclado Ctrl + -

No olvide conservar el nombre de la tabla correspondiente para revertir la anonimización. 😉

Paso 7: volver a los datos originales

Restaurar sus datos no es difícil. Tienes que:

  1. Cambie la columna del nombre (el nombre del código debe ser la primera columna)
  2. Crea una vez más la BUSCARV para devolver el nombre original
  3. Convertir la fórmula en valor.
  4. Eliminar el nombre anónimo

5 Comentarios

  1. Chris
    25/01/2023 a las 06:45

    Excel en Mac 16.67 genera un error al intentar pegar esto en una celda:
    =VLOOKUP(A2,$I$2:$J$11;2;0)

    Hay un problema con esta fórmula.

    ¿No estás tratando de escribir una fórmula?
    Cuando el primer carácter es un signo igual...
    Para evitar esto, escriba primero un apóstrofo (')...

    Es como si Excel intentara "hacerme un favor" y pensara que no estoy intentando ingresar una fórmula. Esta fórmula no parece funcionar y Excel no la acepta.

    Responder

  2. Roy
    24/06/2021 a las 02:25

    Esto funciona si tienes un pequeño conjunto de datos, pero ¿cómo puedo hacerlo si tengo miles de registros? ¿Y los datos que necesito anonimizar son un conjunto de números de cuenta generados?

    Responder

    • Frédéric LE GUEN
      24/06/2021 a las 12:12

      Debe crear una regla para cifrar sus datos confidenciales. Esto no es fácil de hacer

      Responder

    • Yves
      10/12/2021 a las 22:42

      Si tiene sus datos en CSV, puede hacerlo fácilmente con Grafton. https://pypi.org/project/grafton/

      Responder

      • Frédéric LE GUEN
        11/12/2021 a las 16:26

        Python no es fácil de usar. Pero esa es una buena idea

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *

Anonimiza tus datos

Tiempo de leer: 3 minutos
Última actualización el 20/03/2024

Si está trabajando en un libro que contiene datos confidenciales, debe anonimizar sus datos si está colaborando con otros. La técnica no es realmente compleja, pero hay que respetar los siguientes pasos.

El documento inicial

Imagina que eres un periodista y recibes el siguiente archivo en tu buzón (son todos datos falsos). En unos meses, estos datos serán conocidos como la Papeles de Nicaragua 😉

Antes de compartir el libro de trabajo, veamos cómo podemos anonimizar los nombres.

Datos_anónimos_1

Paso 1: duplicar la columna anónima

Duplica la columna que contiene los nombres en la columna H, por ejemplo.

Datos_anónimos_2

Puedes hacer esto con un estándar. copiar y pegar o utilizando el atajo ctrl tecla con el ratón.

Duplicar con Ctrl

Paso 2: Extraer sin duplicados

Entonces tú eliminar duplicados (Datos>Eliminar duplicados) mantener un solo nombre.

El resultado entonces es el siguiente:

Eliminar duplicados no elimina los errores ortográficos. Como habrás notado, todavía tenemos a Jacky Chin dos veces porque el nombre se escribe diferente. Sería tentador corregir el error en el archivo fuente, pero en el análisis de datos, la regla principal es dejar los datos sin procesar como están.

Paso 3: agrega el código anónimo

Agregaremos el código para reemplazar los nombres originales en la columna I. Escribiremos el valor NAME001 en la celda I2.

Luego, con el controlador de relleno, debemos arrastrar hacia abajo para aumentar la serie de números automáticamente 😉. El resultado entonces es.

Datos_anónimos_4

Paso 4: Reemplace los nombres originales

Ahora necesitamos reemplazar el nombre original en la columna A por el código anónimo. Para hacer eso usaremos el Función VLOOKUP.

Insertemos una columna cerca del nombre original y escribamos la siguiente fórmula

=VLOOKUP(A2,$I$2:$J$11;2;0)

$ signos significa que las referencias no se moverán. El resultado ahora es el siguiente.

Datos_anónimos_5

Paso 5: Reemplazar fórmulas por valores

La columna B ahora contiene los resultados de la fórmula. Debemos convertir estos resultados en valores. Esto se hace muy fácilmente con un valor especial Copiar/Pegar

  • Selecciona tus celdas en la columna B y haz una copia simple (Ctrl + C)
  • No cambies tu selección y seleccione el menú Pegado especial haciendo clic en la pequeña flecha debajo del icono Pegar.
  • En las opciones, selecciona este ícono para hacer un collage en valor

Todas las fórmulas de la columna B han sido reemplazadas por sus valores en las celdas.

Paso 6: eliminar el nombre original

Ahora solo nos queda borrar el valor de la columna A

  • Seleccione la columna A y clic derecho> Eliminar
  • Seleccione la columna A y aplique el método abreviado de teclado Ctrl + -

No olvide conservar el nombre de la tabla correspondiente para revertir la anonimización. 😉

Paso 7: volver a los datos originales

Restaurar sus datos no es difícil. Tienes que:

  1. Cambie la columna del nombre (el nombre del código debe ser la primera columna)
  2. Crea una vez más la BUSCARV para devolver el nombre original
  3. Convertir la fórmula en valor.
  4. Eliminar el nombre anónimo

5 Comentarios

  1. Chris
    25/01/2023 a las 06:45

    Excel en Mac 16.67 genera un error al intentar pegar esto en una celda:
    =VLOOKUP(A2,$I$2:$J$11;2;0)

    Hay un problema con esta fórmula.

    ¿No estás tratando de escribir una fórmula?
    Cuando el primer carácter es un signo igual...
    Para evitar esto, escriba primero un apóstrofo (')...

    Es como si Excel intentara "hacerme un favor" y pensara que no estoy intentando ingresar una fórmula. Esta fórmula no parece funcionar y Excel no la acepta.

    Responder

  2. Roy
    24/06/2021 a las 02:25

    Esto funciona si tienes un pequeño conjunto de datos, pero ¿cómo puedo hacerlo si tengo miles de registros? ¿Y los datos que necesito anonimizar son un conjunto de números de cuenta generados?

    Responder

    • Frédéric LE GUEN
      24/06/2021 a las 12:12

      Debe crear una regla para cifrar sus datos confidenciales. Esto no es fácil de hacer

      Responder

    • Yves
      10/12/2021 a las 22:42

      Si tiene sus datos en CSV, puede hacerlo fácilmente con Grafton. https://pypi.org/project/grafton/

      Responder

      • Frédéric LE GUEN
        11/12/2021 a las 16:26

        Python no es fácil de usar. Pero esa es una buena idea

Deje un comentario

Su dirección de correo electrónico no será publicada. Las areas obligatorias están marcadas como requeridas *