Busque y elimine archivos idénticos. Los mejores programas para encontrar archivos duplicados (idénticos)

Si trabaja con una gran cantidad de información en Excel y la agrega regularmente, por ejemplo, datos sobre estudiantes de la escuela o empleados de la empresa, entonces pueden aparecer valores duplicados en dichas tablas, en otras palabras, duplicados.

En este artículo veremos cómo buscar, seleccionar, eliminar y contar la cantidad de valores duplicados en Excel.

Cómo encontrar y resaltar

Puede buscar y resaltar duplicados en un documento utilizando el formato condicional en Excel. Seleccione todo el rango de datos en la tabla deseada. En la pestaña “Inicio”, haga clic en el botón "Formato condicional", seleccione del menú "Reglas para resaltar celdas""Valores duplicados".

En la siguiente ventana, seleccione de la lista desplegable "repetitivo" y el color de la celda y el texto en el que pintar los duplicados encontrados. Luego haga clic en "Aceptar" y el programa buscará duplicados.

En el ejemplo, Excel ha resaltado la misma información en rosa. Como puede ver, los datos no se comparan fila por fila, sino que se resaltan celdas idénticas en las columnas. Por lo tanto, la celda "Sasha V." está resaltada. . Puede haber varios estudiantes de este tipo, pero con apellidos diferentes.

como contar

Si necesita encontrar y contar la cantidad de valores repetidos en Excel, crearemos una tabla dinámica de Excel para esto. Añade la columna “Código” a la original y rellénala con “1”: pon 1, 1 en las dos primeras celdas, selecciónalas y arrástralas hacia abajo. Cuando se encuentran duplicados en las filas, el valor en la columna Código se incrementará en uno cada vez.

Selecciona todo junto con los títulos, ve a la pestaña “Insertar” y presiona el botón "Mesa dinámica".

Para obtener más información sobre cómo trabajar con tablas dinámicas en Excel, lea el artículo siguiendo el enlace.

En la siguiente ventana, las celdas del rango ya están indicadas; use un marcador para marcar "A una hoja nueva" y haga clic en "Aceptar".

En el lado derecho, arrastre los primeros tres títulos al área "Títulos de línea" y arrastre el campo “Código” al área “Valores”.

Como resultado, obtendremos una tabla dinámica sin duplicados, y en el campo "Código" habrá números correspondientes a los valores repetidos en la tabla fuente: cuántas veces se repitió esta fila en ella.

Por conveniencia, resaltemos todos los valores en la columna. “Importe por código de campo” y ordenarlos en orden descendente.

Creo que ahora puedes buscar, seleccionar, eliminar e incluso contar el número de duplicados en Excel para todas las filas de la tabla o solo para las columnas seleccionadas.

Califica este artículo:

Seguramente cualquiera de nosotros tenemos archivos duplicados acumulados en nuestro disco con el paso del tiempo. Archivos en "Descargas" que has descargado varias veces, fotografías idénticas y composiciones musicales que se encuentran en tal profundidad que tus manos simplemente no pueden alcanzarlas. Puede deshacerse de todo esto manualmente, pero las utilidades especiales que buscan archivos idénticos funcionarán mucho más rápido.

Un “limpiador” muy popular que probablemente todo el mundo tenga instalado. Sí, no sólo busca basura del sistema y borra el historial del navegador y las cookies, sino que también elimina archivos duplicados.

Plataformas: Windows, Mac.

Precio: gratis, $24.95 para la versión premium.

El programa busca archivos con nombres iguales o similares y contenido idéntico. Funciona bien con música y puede encontrar archivos de música idénticos incluso si tienen etiquetas diferentes. Además, dupeGuru puede comparar imágenes para encontrar no sólo fotos idénticas, sino simplemente similares.

Desarrollado para Mac y Linux. El desarrollador ya no admite la versión de Windows, pero se puede descargar desde el sitio web oficial; es completamente funcional.

Plataformas: Windows, Mac, Linux.

Una aplicación de búsqueda avanzada de archivos que, entre otras cosas, puede eliminar duplicados. SearchMyFiles tiene filtros flexibles para que pueda personalizar los resultados de su búsqueda de la forma que desee.

Plataformas: Ventanas.

Una aplicación popular para Mac que busca archivos iguales o similares y le muestra la diferencia entre ellos. Copias en "Fotos", en la biblioteca de música de iTunes: nada pasará por Gemini 2. Los desarrolladores han anunciado un mecanismo inteligente de búsqueda de duplicados que recuerda qué archivos dejas y cuáles decides eliminar.

Plataformas: Impermeable.

Aunque AllDup es gratuito, hace muchas cosas. Busca, elimina, copia y mueve archivos duplicados, incluidas grabaciones de audio idénticas con diferentes etiquetas. Hay una configuración de búsqueda flexible. Con el visor integrado, puede examinar archivos y elegir qué eliminar.

Plataformas: Ventanas.

Duplicate File Finder encuentra rápida y eficientemente archivos duplicados. Brinda una oportunidad interesante para buscar duplicados no solo en el disco duro, sino también en la red local. Puede trabajar con imágenes y música, comparando tanto etiquetas como contenido. La función de vista previa le ayudará a determinar qué eliminar realmente y qué dejar. Desafortunadamente, muchas opciones no están disponibles en la versión gratuita.

Plataformas: Ventanas.

Precio: gratis, $29.95 para la versión premium.

Un administrador de archivos universal que puede hacer cualquier cosa con sus archivos. Incluyendo la búsqueda de archivos duplicados. Puede habilitar la opción de búsqueda de copias en la pestaña de parámetros de búsqueda, en el mismo lugar donde se especifican otros atributos de los archivos buscados.

Plataformas: Ventanas.

DupeGuru parece la opción más atractiva. Es gratis, pero ofrece todas las funciones necesarias para eliminar la basura acumulada en el disco. Lo único triste es que se ha detenido el desarrollo de la versión para Windows. Para los usuarios de Windows que no quieren pagar por alternativas comerciales, AllDup es una mejor opción. CCleaner y Total Commander son soluciones más universales y extendidas que probablemente ya estén instaladas en todos.

Quizás todos los que trabajan con datos en Excel se enfrentan a la pregunta de cómo comparar dos columnas en Excel en busca de similitudes y diferencias. Hay varias formas de hacer esto. Echemos un vistazo más de cerca a cada uno de ellos.

Cómo comparar dos columnas en Excel fila por fila

Al comparar dos columnas de datos, a menudo es necesario comparar los datos de cada fila individual en busca de coincidencias o diferencias. Podemos hacer tal análisis usando la función. Veamos cómo funciona esto usando los ejemplos siguientes.

Ejemplo 1: Cómo comparar dos columnas para coincidencias y diferencias en la misma fila

Para comparar los datos en cada fila de dos columnas en Excel, escribamos una fórmula simple. La fórmula debe insertarse en cada fila de la columna adyacente, al lado de la tabla en la que se encuentran los datos principales. Habiendo creado una fórmula para la primera fila de la tabla, podemos estirarla/copiarla a las filas restantes.

Para comprobar si dos columnas de la misma fila contienen los mismos datos, necesitamos la fórmula:

=SI(A2=B2; “Coincidencia”; “”)

La fórmula que determina las diferencias entre los datos de dos columnas de una fila se verá así:

=SI(A2<>B2; “No coincidir”; “”)

Podemos ajustar la prueba de coincidencias y diferencias entre dos columnas en una línea en una fórmula:

=SI(A2=B2; “Coincide”; “No coincide”)

=SI(A2<>B2; “No coincidir”; "Coincidente")

Un resultado de cálculo de ejemplo podría verse así:

Para comparar datos en dos columnas de la misma fila distinguiendo entre mayúsculas y minúsculas, utilice la fórmula:

=SI(COINCIDIR(A2,B2), “Coincidencia”, “Único”)

Cómo comparar varias columnas para coincidencias en una fila de Excel

Excel le permite comparar datos en varias columnas de la misma fila utilizando los siguientes criterios:

  • Busque filas con los mismos valores en todas las columnas de la tabla;
  • Busque filas con los mismos valores en dos columnas cualesquiera de la tabla;

Ejemplo 1. Cómo encontrar coincidencias en una fila en varias columnas de una tabla

Imaginemos que nuestra tabla consta de varias columnas de datos. Nuestra tarea es encontrar filas en las que los valores coincidan en todas las columnas. Excel y las funciones nos ayudarán con esto. La fórmula para determinar los partidos será la siguiente:

=SI(Y(A2=B2,A2=C2); “Coincide”; “ “)

Si nuestra tabla tiene muchas columnas, será más fácil usar la función en combinación con:

=SI(CONTAR.SI($A2:$C2,$A2)=3;”Coincidencia”;” “)

En la fórmula, "5" indica el número de columnas de la tabla para las que creamos la fórmula. Si su tabla tiene más o menos columnas, entonces este valor debe ser igual al número de columnas.

Ejemplo 2: Cómo encontrar coincidencias de la misma fila en dos columnas cualesquiera de una tabla

Imaginemos que nuestra tarea es identificar de una tabla con datos en varias columnas aquellas filas en las que los datos son iguales o se repiten en al menos dos columnas. Las funciones y nos ayudarán con esto. Escribamos una fórmula para una tabla que consta de tres columnas de datos:

=SI(O(A2=B2,B2=C2,A2=C2);”Coincidencia”;” “)

En los casos en que haya demasiadas columnas en nuestra tabla, nuestra fórmula con la función será muy grande, ya que en sus parámetros necesitamos especificar los criterios de coincidencia entre cada columna de la tabla. Una forma más sencilla, en este caso, es utilizar el archivo .

=SI(CONTAR.SI(B2:D2,A2)+CONTAR.SI(C2:D2,B2)+(C2=D2)=0; “Cadena única”; “Cadena no única”)

=SI(CONTAR.SI($B:$B,$A5)=0; “No hay coincidencias en la columna B”; “Hay coincidencias en la columna B”)

Esta fórmula verifica los valores de la columna B para ver si coinciden con los datos de las celdas de la columna A.

Si su tabla consta de un número fijo de filas, puede especificar un rango claro en la fórmula (por ejemplo, $B2:$B10). Esto acelerará la fórmula.

Cómo comparar dos columnas en Excel para buscar coincidencias y resaltarlas en color

Cuando buscamos coincidencias entre dos columnas en Excel, es posible que necesitemos visualizar las coincidencias o diferencias encontradas en los datos, por ejemplo usando resaltado de color. La forma más sencilla de resaltar coincidencias y diferencias de color es utilizar el formato condicional en Excel. Veamos cómo hacer esto usando los ejemplos siguientes.

Buscar y resaltar coincidencias en varias columnas en Excel

En los casos en los que necesitemos encontrar coincidencias en varias columnas, para ello necesitamos:

  • Seleccione las columnas con datos en las que desea calcular coincidencias;
  • En la pestaña "Inicio" de la barra de herramientas, haga clic en el elemento del menú "Formato condicional" -> "Reglas para resaltar celdas" -> "Valores repetidos";
  • En el cuadro de diálogo emergente, seleccione "Repetir" en la lista desplegable de la izquierda y, en la lista desplegable de la derecha, seleccione en qué color se resaltarán los valores repetidos. Haga clic en el botón "Aceptar":
  • Después de esto, las coincidencias se resaltarán en la columna seleccionada:

Buscar y resaltar filas coincidentes en Excel

Encontrar celdas coincidentes con datos en dos o más columnas y buscar coincidencias de filas enteras con datos son conceptos diferentes. Tenga en cuenta las dos tablas siguientes:

Las tablas anteriores contienen los mismos datos. Su diferencia es que en el ejemplo de la izquierda buscábamos celdas coincidentes y en el de la derecha encontramos líneas enteras repetidas con datos.

Veamos cómo encontrar filas coincidentes en una tabla:

  • A la derecha de la tabla con los datos crearemos una columna auxiliar en la que, frente a cada fila con los datos, pondremos una fórmula que combine todos los valores de la fila de la tabla en una celda:

=A2 y B2 y C2 y D2

En la columna auxiliar verás los datos de la tabla combinada:

Ahora, para determinar las filas coincidentes en la tabla, siga los siguientes pasos:

  • Seleccione el área con datos en la columna auxiliar (en nuestro ejemplo, este es un rango de celdas E2:E15 );
  • En la pestaña "Inicio" de la barra de herramientas, haga clic en el elemento del menú "Formato condicional" -> "Reglas para resaltar celdas" -> "Valores repetidos";
  • En el cuadro de diálogo emergente, seleccione "Repetir" en la lista desplegable de la izquierda y, en la lista desplegable de la derecha, seleccione en qué color se resaltarán los valores repetidos. Haga clic en el botón "Aceptar":
  • Después de esto, se resaltarán líneas duplicadas en la columna seleccionada:


Encontrar duplicados en Excel puede no ser una tarea fácil, pero si cuentas con algunos conocimientos básicos, encontrarás varias formas de abordarlo. Cuando pensé por primera vez en este problema, rápidamente se me ocurrieron un par de formas de encontrar duplicados y, después de pensarlo un poco, descubrí algunas formas más. Entonces, veamos primero un par de métodos simples y luego pasemos a métodos más complejos.

El primer paso es poner los datos en un formato que facilite su manipulación y cambio. Crear encabezados en la fila superior y colocar todos los datos debajo de esos encabezados le permite organizar sus datos en una lista. En una palabra, los datos se convierten en una base de datos que se puede ordenar y realizar diversas manipulaciones con ellos.

Encuentre duplicados usando filtros integrados de Excel

Al organizar sus datos en forma de lista, puede aplicarles varios filtros. Dependiendo del conjunto de datos que tenga, puede filtrar la lista por una o más columnas. Como uso Office 2010, todo lo que tengo que hacer es resaltar la fila superior donde están los títulos y luego ir a la pestaña Datos(Datos) y presione comando Filtrar(Filtrar). Aparecerán flechas triangulares que apuntan hacia abajo (iconos de menú desplegable) junto a cada encabezado, como en la imagen a continuación.

Al hacer clic en una de estas flechas se abrirá un menú desplegable de filtro que contiene toda la información para esa columna. Seleccione cualquier elemento de esta lista y Excel mostrará los datos de acuerdo con su selección. Esta es una forma rápida de resumir o ver el alcance de los datos seleccionados. Puedes desmarcar el artículo. Seleccionar todo(Seleccionar todo) y luego seleccione uno o más de los elementos que desee. Excel solo mostrará filas que contengan los elementos que seleccionó. Esto hace que sea mucho más fácil encontrar duplicados, si los hay.

Después de configurar el filtro, puede eliminar filas duplicadas, resumir subtotales o, además, filtrar los datos por otra columna. Puede editar los datos de la tabla según sea necesario. En el siguiente ejemplo tengo los elementos seleccionados. experiencia Y XP Pro.

Como resultado del filtro, Excel muestra solo aquellas filas que contienen los elementos que seleccioné (es decir, personas en cuyas computadoras están instalados XP y XP Pro). Puedes elegir cualquier otra combinación de datos y, si es necesario, incluso configurar filtros en varias columnas a la vez.

Filtro avanzado para buscar duplicados en Excel

en la pestaña Datos(Datos) a la derecha del comando Filtrar(Filtro) hay un botón para la configuración del filtro – Avanzado(Además). Esta herramienta es un poco más difícil de usar y requiere un poco de configuración antes de poder usarla. Sus datos deben organizarse como se describe anteriormente, es decir. como una base de datos.

Antes de poder utilizar un filtro avanzado, debe configurar un criterio para ello. Mira la imagen de abajo, puedes ver una lista con datos, y a la derecha en la columna. l se especifica el criterio. He escrito el título de la columna y el criterio bajo un mismo título. La imagen muestra una mesa de partidos de fútbol. Requiere que solo muestre reuniones en casa. Por eso copié el título de la columna donde quiero filtrar y debajo coloqué el criterio (H) que necesito usar.

Ahora que el criterio está configurado, seleccionamos cualquier celda de nuestros datos y presionamos el comando Avanzado(Además). Excel seleccionará la lista completa de datos y abrirá este cuadro de diálogo:

Como puedes ver, Excel ha seleccionado toda la tabla y está esperando que especifiquemos un rango con un criterio. Seleccione el campo en el cuadro de diálogo Rango de criterios(Rango de condiciones), luego seleccione las celdas con el mouse L1 Y L2(o aquellos que contengan su criterio) y haga clic DE ACUERDO. La tabla mostrará solo aquellas filas en la columna Inicio / Visitante vale la pena el valor h, y ocultará el resto. Así, encontramos datos duplicados (una columna a la vez), que muestran sólo reuniones en casa:

Esta es una forma bastante sencilla de encontrar duplicados, lo que puede ayudar a ahorrar tiempo y obtener la información necesaria rápidamente. Debes recordar que el criterio debe colocarse en una celda separada de la lista de datos para que puedas encontrarlo y utilizarlo. Puedes cambiar el filtro cambiando el criterio (el mío está en la celda L2). Además, puede desactivar el filtro haciendo clic en el botón Claro Pestaña (Borrar) Datos(Datos) en grupo Ordenar y filtrar(Ordenar y filtrar).

Herramienta incorporada para eliminar duplicados en Excel

Excel tiene una función incorporada Eliminar duplicados(Eliminar duplicados). Puede seleccionar una columna de datos y usar este comando para eliminar todos los duplicados, dejando solo valores únicos. Usa la herramienta Eliminar duplicados(Eliminar duplicados) se puede hacer usando el botón del mismo nombre, que encontrarás en la pestaña Datos(Datos).

Asegúrese de seleccionar qué columna desea conservar solo valores únicos. Si los datos no contienen encabezados, se mostrará el cuadro de diálogo Columna A, Columna B(columna A, columna B) y así sucesivamente, por lo que es mucho más conveniente trabajar con títulos.

Cuando haya terminado con la configuración, haga clic en DE ACUERDO. Excel mostrará una ventana de información con el resultado de la función (ejemplo en la figura siguiente), en la que también deberá hacer clic DE ACUERDO. Excel elimina automáticamente las filas con valores duplicados, dejándote solo valores únicos en las columnas que selecciones. Por cierto, esta herramienta está presente en Excel 2007 y versiones más recientes.

Encontrar duplicados usando el comando Buscar

Si necesita encontrar una pequeña cantidad de valores duplicados en Excel, puede hacerlo mediante la búsqueda. Ir a la pestaña hom e (Inicio) y haga clic en Buscar y seleccionar(Buscar y resaltar). Se abrirá un cuadro de diálogo en el que podrá ingresar cualquier valor para buscar en su tabla. Para evitar errores tipográficos, puede copiar el valor directamente desde la lista de datos.

Si el volumen de información es muy grande y necesitas acelerar la búsqueda, selecciona la fila o columna en la que deseas buscar, y solo entonces inicia la búsqueda. Si no hace esto, Excel buscará en todos los datos disponibles y encontrará resultados innecesarios.

Si necesita buscar entre todos los datos disponibles, quizás el botón Buscar todo(Buscar todo) le resultará más útil.

En conclusión

Los tres métodos son fáciles de usar y le ayudarán a encontrar duplicados:

  • Filtrar– Ideal cuando sus datos contienen múltiples categorías que es posible que deba dividir, resumir o eliminar. Crear subsecciones es el mejor uso para un filtro avanzado.
  • Eliminar duplicados reducirá la cantidad de datos al mínimo. Utilizo este método cuando necesito hacer una lista de todos los valores únicos de una de las columnas, que luego uso para la búsqueda vertical usando la función BUSCARV.
  • yo uso el comando Encontrar(Buscar) solo si necesita encontrar una pequeña cantidad de valores y la herramienta Buscar y reemplazar(Buscar y reemplazar) cuando encuentro errores y quiero corregirlos de inmediato.

Esta no es una lista exhaustiva de métodos para buscar duplicados en Excel. Hay muchas formas y estas son sólo algunas de las que utilizo habitualmente en mi trabajo diario.

En las dos lecciones anteriores eliminamos duplicados. También puedes leer sobre esto. En esta lección implementaremos buscar duplicados.

Esto es necesario para comprender exactamente qué registros están duplicados, de modo que puedan usarse en el futuro, por ejemplo, para comprender las razones de su aparición.

Hay una tarea: en la tabla de origen, seleccione todos los registros que tengan un duplicado.

Como en el ejemplo anterior, usaremos un filtro avanzado. Coloque el cursor en cualquier celda de la tabla. A continuación, vaya a la pestaña "Datos" y haga clic en el botón "Avanzado".

En la ventana que se abre, deje seleccionada la opción "Lista de filtrado en su lugar". En el campo Rango de origen, debe tener una tabla especificada de forma predeterminada. Y también asegúrese de marcar la casilla de verificación "Solo registros únicos" para ocultar los duplicados. Finalmente, haga clic en el botón "Aceptar".

Si ahora observa de cerca nuestro ejemplo, la numeración de las líneas se volvió azul, lo que indica que se ha aplicado un filtro y la presencia de duplicados, y las líneas 9, 10 y 11 simplemente estaban ocultas, ya que son duplicadas y no únicas.

Ahora podemos marcar todas las filas únicas. Por ejemplo, resáltalos con color.

O asígneles una etiqueta separada. Creemos una columna separada "Singularidad" y establezcamos el valor "1" para todas estas filas.

Para asignar el valor 1 a todas las filas, simplemente coloque una en la primera fila y luego haga doble clic con el botón izquierdo del mouse en la esquina inferior derecha de la celda. El valor de esta celda se multiplicará por todas las celdas de la columna.

Ahora solo queda quitar el filtro para poder abrir todas las filas de la tabla. Vaya a la pestaña "Datos" y haga clic en el botón "Borrar".

Todas las líneas que teníamos duplicadas quedarán sin firmar.

Ahora agreguemos un "Filtro" a la tabla. Para hacer esto, selecciónelo, luego vaya a la pestaña “Datos” y haga clic en el icono “Filtro”.

Gracias a esto, tuvimos la oportunidad de seleccionar todos los duplicados a través de un filtro. Haga clic en el icono de filtro en la columna "Singularidad" y seleccione todas las filas vacías de la lista. Haga clic en "Aceptar".

Todos los registros se ordenarán y tendrás todos los registros duplicados a tu disposición.

En esta lección te diré cómo dividir texto en columnas en Excel. Esta lección es adecuada para usted si desea dividir el texto de una columna en varias. Ahora daré un ejemplo. Digamos que tiene la celda "A", que contiene el nombre, apellido y patronímico. Debe asegurarse de que en la primera celda "A" solo esté el apellido, en la celda "B", el nombre y en la celda "C", el segundo nombre.

En esta lección te diré cómo adjuntar un encabezado a cada página de Excel. Esto puede ser necesario si trabaja con mesas grandes. Por lo general, cuando se imprimen, se generan documentos con una gran cantidad de páginas y, para que sea conveniente trabajar con ellos, es necesario guardar el encabezado de la tabla en cada hoja.




Arriba