La oferta ya no está activa. Echa un vistazo a estas ofertas similares:

Data Engineer

Page Personnel

Boadilla del Monte España

Hace 47 horas

Senior Business Intelligence / Data Analyst

Page Personnel

Madrid España

Hace 37 horas

Arquitecto de datos

Page Personnel

Madrid España

Hace 2 días

Data Quality Leganés (Madrid)

  • Importante empresa de comunicación de Leganés

  • Leganés (Madrid)
  •   Inscripción cerrada
Crear alerta
Inscripción Cerrada
  • Experiencia

    Entre 2 y 10 años de experiencia

  • Salario

    Retribución sin especificar

  • Área - Puesto

    Tecnología e informática

    • Técnico de Data Mining
  • Categoría o nivel

    Técnico

  • Vacantes

    1

  • Inscritos

    11

  • Contrato

    Contrato Indefinido

  • Jornada

    Jornada Completa

Descripción de la oferta

Descripción de la oferta

Duración de la oferta: hasta el 26/12/2018.

Funciones

El proyecto busca desarrollar un producto innovador tal que permita, entre otros, prestar los siguientes servicios:
1.	Consolidación de múltiples fuentes de información en una única base de datos
El proyecto busca desarrollar un producto innovador tal que permita, entre otros, prestar los siguientes servicios:
1.	Consolidación de múltiples fuentes de información en una única base de datos
2.	Estandarización de la información.
3.	Limpieza de datos.
4.	Validación de datos
5.	Enriquecimiento de la información
6.	Unificación de datos o Data Matching: Record Linkage y Entity Resolution.

Requisitos

Requisitos del candidato
1.	Experiencia en proyectos Big Data.
2.	Experiencia en herramientas como:
2.1.	Apache Spark
2.2.	Pentaho Data Integration
2.3.	Apache Zeppelin notebooks
2.4.	SparkMlib (Machine Learning Library (MLlib))
2.5.	Lenguajes como Python, R
2.6.	Febrl: Para la estandarización de datos, eliminación de duplicados e inferencia de relaciones entre datos.
2.7.	Data Matching: Record Linkage, Entity Resolution WHIRL TAILOR, BigMatch.
2.7.1.	RecOrd LinkAge Toolbox (TAILOR)
2.7.2.	Word-Based Heterogeneous Information Representation Language (WHIRL)
2.8.	Inglés. Nivel de comprensión y lectura.
2.9.	Experiencia en entornos Linux físicos y virtuales.

Valorable
1.	Experiencia en integración con las diferentes APIs de Google
2.	Python Record Linkage Toolkit
3.	MapReduce en hadoop
4.	Lenguajes
4.1.	Scala
4.2.	Java
5.	Bases de datos transaccionales: MySQL, PostgreSQL, Oracle, etc.
6.	Bases de datos NoSQL.

Se ofrece

Contratación indefinida
Salario según valía del candidato
Jornada intensiva en verano

Etiquetas

  • pentaho
  • big data
  • spark
Inscripción Cerrada


Inscribirme en esta oferta
Inscripción Cerrada

Para crear una alerta debes iniciar sesión o regístrate