Encontrar posibles coincidencias entre dos tablas no relacionadas

N/A

Terminado

Publicado

hace alrededor de 9 años

N/A

Pagado a la entrega

Buenas, Existen dos tablas de personas, en la que la información se guarda de forma diferente y no existe ningún campo para relacionarla. Me gustaría conocer aquellas filas en la que haya una posible coincidencia comparando todos los campos comunes para comparar. Digo posible, porque al guardarse de forma diferente los nombres o apellidos - por ejemplo - pueden haberse escrito de forma diferente, por tanto hay que encontrar la manera de buscar datos aproximados (en php se podría utilizar por ejemplo similar_text()) . Es muy importante identificar las posibles coincidencias y que no pase ninguna, y que sea un proceso que dure menos de 5 minutos en procesarse. Preferible en SQL. Si es un script, preferiblemente en bash (linux) o PHP, y que envie un email con las posibles coincidencias. He puesto dos ficheros, uno es el fichero sanctionslist que es un original (es un fichero público) y el otro es el fichero clientlist, que obviamente, es un fichero representativo, pero que no es tiene información real. La información se guarda en Bases de datos MySql. Gracias

ID del proyecto: 12386646

Información sobre el proyecto

14 propuestas

Proyecto remoto

Activo hace 9 años

¿Buscas ganar dinero?

Dirección de email

Beneficios de presentar ofertas en Freelancer

Fija tu plazo y presupuesto

Cobra por tu trabajo

Describe tu propuesta

Es gratis registrarse y presentar ofertas en los trabajos

Adjudicado a:

@marodriguezb

Ningún problema para encontrar esas coincidencias entre dos tablas que no están relacionadas. No creo que sea posible encontrar una solución exhaustiva, que cumpla totalmente los requerimientos, sólo usando SQL. Parece mejor un script en python, que funciona bajo Linux, y que solucionaría completamente el problema.

€16 EUR en 5 días

5,0

(1 comentario)

2,4

14 freelancers están ofertando un promedio de €183 EUR por este trabajo

@jcandioti

He realizado scripts cómo lo que precisan. Haría que corra sobre Linux desde la consola. Sería en PHP utilizando consultas SQL lo más precisas posibles. Por lo que indica la descripción sólo mostraría posibles coincidencias, sin almacenar ni preguntar por coincidencias bien conocidas por el supervisor que corre el script. Desde luego, el grado de coincidencia y la dirección de correo serían parámetrizables.

€98 EUR en 3 días

5,0

(3 comentarios)

4,2

@hmezaA

Hola Ofrezco mi experiencia en prograacion y nases de datos para la unicifcacion de la inflrmacioon que requiere. Tengo mas de 15 años programando y cuento con 5 programadores para terminar a tiempo.

€250 EUR en 14 días

4,7

(4 comentarios)

3,9

@Xanatos34

Hola, soy programador php con experiencia y conocimientos desarrollando scripts para multitud de funcionalidades. Puedo programar el script que usted necesita con el algoritmo más adecuado. Cualquier duda, contácteme.

€66 EUR en 2 días

5,0

(1 comentario)

2,6

@andradesalguero

Saludos! Tengo 10 años de experiencia como webmaster 8 años como diseñador web 5 años como programador de bajo nivel 4 años como administrador de servidores 3 años como consultor dba 2 años como depurador de aplicaciones moviles Los proyectos mas recientes en los que he trabajado son Elaboracion de punto de venta en vb.net con mysql y consultas transaccionales montado de servidor lamp debian y raid 10 por software el oferton guatemala Recuperacion de base de datos dañada mysql ubuntu server mineaqua españa Montado de servidor de correo ubuntu server canarishop españa Creacion de firewall personalizado ubuntu server mineaqua españa Instalacion de bigbluebutton en vps ubuntu server Cualquier consulta No dudes en comentar.

€95 EUR en 13 días

4,4

(4 comentarios)

1,9

@phenobarbital

Puedo construir un ejecutable que mezcle ambas tablas y haga los análisis respectivos directamente en el mySQL usando solamente SQL; genere las coincidencias o incluso las re-inyecte en otra tabla en mySQL y por último, envíe una hoja de cálculo/CSV o cualquier formato deseado, al coreo electrónico del cliente. Dicho ejecutable sería autónomo y se coloca en el CRON o se ejecuta manualmente.

€90 EUR en 5 días

0,0

(0 comentarios)

0,0

@jorgehumbertota

Experiencia en IA y BI, con reporting services, integration services y analysis services de SQL Server. Mineria de datos, metodología en ITIL con los siguientes pasos: Toma de requisitos, desarrollo de prototipo, pruebas de usuario y paso a producción. Tambien se puede utilizar Knime (Open Source) para todo el proceso de BI (carga y descarga de información, reportes y cubos)

€250 EUR en 14 días

0,0

(0 comentarios)

0,0

@ticwebapp

1 Presentación Tras ver las especificaciones del proyecto que demandáis en Nubelo, nos queremos poner en contacto con vosotros para poder colaborar. Para que nos puedas conocer mejor, somos Samuel y Víctor, dos freelance que hemos constituido la start-up “tic web app”, en la cual realizamos proyectos tecnológicos para diferentes empresas. Tenemos experiencia en varios campos del sector IT y estamos especializados en desarrollo web. Como ejemplo, puedes ver nuestro portfolio en el perfil de Nubelo de Samuel o en nuestra web (en el apartado proyectos). A continuación, analizamos tu propuesta para que mostrarte cómo vamos a abordar el proyecto. 2 Requisitos El cliente demanda: “Existen dos tablas de personas, en la que la información se guarda de forma diferente y no existe ningún campo para relacionarla. Me gustaría conocer aquellas filas en la que haya una posible coincidencia comparando todos los campos comunes para comparar”. 3 Tecnología Nos ofrecemos para realizar este proyecto. Nos vemos capacitados para realizar este proyecto ya que hemos tenemos experiencia con bases de datos. Las tecnologías con las que hemos trabajado en la mayoría de nuestros proyectos son: - MySql. - HTML5. - CSS3. - Php. - Javascript. - JQuery. - Wordpress. Puedes consultar nuestro portfolio ya que hemos realizados proyectos del sector y similares a vuestra demanda. 4 Presupuesto El proyecto está presupuestado en 200€. Agradeceríamos que en el caso que no escoja nuestra opción, nos enviara los motivos para ir corrigiendo y mejorando nuestras propuestas, de esta manera ajustarnos mejor a las necesidades globales del mercado. Gracias por atendernos.

€200 EUR en 7 días

0,0

(0 comentarios)

0,0

@nubelo_Gi0TBz5y

si los datos se estan exportando de un archivo o varios archivos .csv se puede iutilizar ETL (extracion y trnsformacion y carga de datos controlada de de Sql server utilizando integration services), con el ETL se no permite que campos repetidos se o diferentes o no validos se ingresen a la base de datos, si este es el caso, por los archivos que adjuntas es lo que puedo persivir, pero si los datos ta estan el la base de datos ya ingresado y tiene tablas diferentes lo mejor es tenerlas relacionadas para evitar la redudancia de la informacion, es decir tener normalizada la base de datos,... pero saber si hay datos repetidos basta con crear consultas a la base de datos dode atraves de inner join puedas comparar datpos de diferentes campo y este te devuelva como resultados los id y campos donde las tablas son diferentes ... pero para poder ayudarte mejor necesito mas informacion de como estan los datos y como se estan manejando y compreder el fenomeno.. proporcioname mas informacion que me permita ayudarte

€250 EUR en 14 días

0,0

(0 comentarios)

0,0

@hjoab

Hola yo tengo un programa ya escrito que hace exactamente eso. Lo escribí en el 2002 en Delphi para Windows. Voy a subir la info en mi perfil para que ud la vea. Deme un tiempo porque no se donde lo tengo. Saludos.

€250 EUR en 14 días

0,0

(0 comentarios)

0,0

@fedebelve

Trabajo día a día con SQL, he encontrado algoritmos que realizan funciones similares a la de similar_text() en SQL. Debería investigar un poco y adaptarlas al requerimiento propuesto. Pienso trabajar con un % de acierto por palabra.

€250 EUR en 14 días

0,0

(0 comentarios)

0,0

@norbertoguzzett

Buenas tardes, imagino que se podrían definir criterios de similitud a evaluar y en base a eso definir un valor de coincidencia admitido. Un script en PHP sobre Linux parece la opción mas interesante ya que en caso de no tener el sistema montado se puede hacer de forma rápida y económica. Incluso podríamos implementar soluciones mas sofisticadas como algoritmos evolutivos o lógica difusa (si aplica) de modo de que el buscador aprenda. Pero eso ya es un paso mas avanzado. El tiempo de búsqueda dependerá de la cantidad de registros pero utilizando MySQL. indexando las tablas y corriendo un stored procedure se pueden lograr tiempos admisibles estimo. Saludos

€250 EUR en 14 días