La oferta ya no está activa. Echa un vistazo a estas ofertas similares:

Data Scientist/Deep Learning

Page Personnel

Madrid España

Hace 33 horas

Inscríbete
Data Scientist con Machine Learning

Page Personnel

Madrid España

Hace 33 horas

Inscríbete
Consultor Big Data

Importante empresa de consultoría tecnológica e innovación

Madrid España

Hace 33 horas

Inscríbete
Data Quality

Importante empresa de comunicación de Leganés

Leganés - Madrid España

Hace 9 horas

Inscríbete
Analista de datos- Big Data (H/M) Valladolid

Manpower Business Solutions

Madrid España

Hace 33 horas

Inscríbete
Business Intelligence Analyst (M/H)

MANPOWER

Madrid España

Hace 9 días

Inscríbete
Consultor SAS para importante empresa en Madrid

GRUPO SEPRO

Madrid España

Hace 33 horas

Inscríbete
Consultor/a junior Business Analytics

ABASSY CORPORATE PERFORMANCE SOLUTIONS

Pozuelo de Alarcón - Madrid España

Hace 9 horas

Inscríbete
Desarrollador ETL,s - Oracle Data Integrator (ODI)

Software & Maintenance

Madrid España

Hace 33 horas

Inscríbete

Data Quality Leganés (Madrid)

  • Ref: 2413192
  • Importante empresa de comunicación de Leganés

  • Leganés (Madrid)
  • Hace 88 días (Actualizada)
  • 11 inscritos

Jornada Completa - Contrato Indefinido - Retribución sin especificar - Entre 2 y 10 años de experiencia

Cerrada Inscripción

Comparte:

Descripción de la oferta

Descripción de la oferta

Duración de la oferta: hasta el 26/12/2018

Funciones

El proyecto busca desarrollar un producto innovador tal que permita, entre otros, prestar los siguientes servicios:
1.	Consolidación de múltiples fuentes de información en una única base de datos
El proyecto busca desarrollar un producto innovador tal que permita, entre otros, prestar los siguientes servicios:
1.	Consolidación de múltiples fuentes de información en una única base de datos
2.	Estandarización de la información.
3.	Limpieza de datos.
4.	Validación de datos
5.	Enriquecimiento de la información
6.	Unificación de datos o Data Matching: Record Linkage y Entity Resolution.

Requisitos

Requisitos del candidato
1.	Experiencia en proyectos Big Data.
2.	Experiencia en herramientas como:
2.1.	Apache Spark
2.2.	Pentaho Data Integration
2.3.	Apache Zeppelin notebooks
2.4.	SparkMlib (Machine Learning Library (MLlib))
2.5.	Lenguajes como Python, R
2.6.	Febrl: Para la estandarización de datos, eliminación de duplicados e inferencia de relaciones entre datos.
2.7.	Data Matching: Record Linkage, Entity Resolution WHIRL TAILOR, BigMatch.
2.7.1.	RecOrd LinkAge Toolbox (TAILOR)
2.7.2.	Word-Based Heterogeneous Information Representation Language (WHIRL)
2.8.	Inglés. Nivel de comprensión y lectura.
2.9.	Experiencia en entornos Linux físicos y virtuales.

Valorable
1.	Experiencia en integración con las diferentes APIs de Google
2.	Python Record Linkage Toolkit
3.	MapReduce en hadoop
4.	Lenguajes
4.1.	Scala
4.2.	Java
5.	Bases de datos transaccionales: MySQL, PostgreSQL, Oracle, etc.
6.	Bases de datos NoSQL.

Se ofrece

Contratación indefinida
Salario según valía del candidato
Jornada intensiva en verano

Etiquetas

  • pentaho
  • big data
  • spark
  • Área

    Tecnología e informática

  • Categoría o nivel

    Técnicos

  • Nº Vacantes

    1

Cerrada Inscripción


Inscribirme en esta oferta
Cerrada Inscripción

Para crear una alerta debes iniciar sesión o regístrate