Data Quality Leganés (Madrid)
- Importante empresa de comunicación de Leganés
- Leganés (Madrid)
- Inscripción cerrada
')}.multiple-items .slick-arrow.slick-prev:before{background-image:url('data:image/svg+xml;utf8,')}@media screen and (max-width:767px){.accordion-handler:after,.accordion-handler.active:after{content:'' !important;font-size:.8rem;width:2em;height:2em;background-size:cover;display:block}.accordion-handler:after{background-image:url('data:image/svg+xml;utf8,')}.accordion-handler.active:after{background-image:url('data:image/svg+xml;utf8,')}}
Entre 2 y 10 años de experiencia
Retribución sin especificar
Tecnología e informática
Técnico
1
10
Contrato Indefinido
Jornada Completa
Duración de la oferta: hasta el 02/02/2019.
El proyecto busca desarrollar un producto innovador tal que permita, entre otros, prestar los siguientes servicios: 1. Consolidación de múltiples fuentes de información en una única base de datos El proyecto busca desarrollar un producto innovador tal que permita, entre otros, prestar los siguientes servicios: 1. Consolidación de múltiples fuentes de información en una única base de datos 2. Estandarización de la información. 3. Limpieza de datos. 4. Validación de datos 5. Enriquecimiento de la información 6. Unificación de datos o Data Matching: Record Linkage y Entity Resolution.
Requisitos del candidato 1. Experiencia en proyectos Big Data. 2. Experiencia en herramientas como: 2.1. Apache Spark 2.2. Pentaho Data Integration 2.3. Apache Zeppelin notebooks 2.4. SparkMlib (Machine Learning Library (MLlib)) 2.5. Lenguajes como Python, R 2.6. Febrl: Para la estandarización de datos, eliminación de duplicados e inferencia de relaciones entre datos. 2.7. Data Matching: Record Linkage, Entity Resolution WHIRL TAILOR, BigMatch. 2.7.1. RecOrd LinkAge Toolbox (TAILOR) 2.7.2. Word-Based Heterogeneous Information Representation Language (WHIRL) 2.8. Inglés. Nivel de comprensión y lectura. 2.9. Experiencia en entornos Linux físicos y virtuales. Valorable 1. Experiencia en integración con las diferentes APIs de Google 2. Python Record Linkage Toolkit 3. MapReduce en hadoop 4. Lenguajes 4.1. Scala 4.2. Java 5. Bases de datos transaccionales: MySQL, PostgreSQL, Oracle, etc. 6. Bases de datos NoSQL.
Contratación indefinida Salario según valía del candidato Jornada intensiva en verano
Para crear una alerta debes iniciar sesión o regístrate
¡Gracias por escribirnos!
A partir de ahora recibirás las ofertas en tu email y/o whatsapp
Si tu alerta la recibes por email comprueba tu bandeja de correo no deseado o spam
Si tu alerta la recibes por whatsapp tendrás que confirmar el envío de ofertas de empleo
En estos momentos no podemos crear tu alerta
Por favor, inténtalo de nuevo transcurridos unos minutos