Data Engineer (m/w/d)
LegalHero
Berlin3 days ago
Data & AI
Data Engineering
Mid-Level
Hybrid
Summary
Data Engineer (m/f/d) in Berlin focusing on building robust data pipelines and platforms. Requires strong Python, SQL, and experience with modern data stacks like Databricks, dbt, and Airbyte. You'll be responsible for ingestion layers, data modeling, quality, and compliance enablement.
- Location
- Berlin
- Type
- full-time
- Level
- Mid-Level
- Work mode
- hybrid
Was dich erwartet
Du wirst die Data-Ingestion plus Daten-Schichten ownen, die unsere Analytics, Compliance und AI-Arbeit speisen. Du reportest direkt an den VP Engineering, AI und Data.Deine Aufgaben:
- Ingestion Layer: Airbyte (o.ä.) Connectoren, Custom Extractoren wo Airbyte nicht reicht, Scheduling, Retry Semantik, Observability. Move von Full Sync auf Delta wo es sich lohnt.
- Bronze und Silver in Databricks: clean, contracted, monitored. Die Boundary setzen auf der die dbt Modelle des Analytics Engineers aufbauen.
- Schema-Contracts zwischen Backend Plattform und Daten Plattform, die Incidents verhindern.
- Data Quality und Reliability Tooling: Tests, Alerts, Schema Change Notifications, Lineage.
- Compliance Enablement: technische Umsetzung von Löschkonzept, DSAR, VVZ. DPO und VP ownen das Legal Framework, du realisierst es technisch.
- AI Data Plumbing: Evaluation Data, Training Corpora, Inference Logs verfügbar, anonymisiert und reproduzierbar machen.
Was du mitbringst
- Studium oder vergleichbare Erfahrung in Informatik, Software Engineering, Data Engineering oder ähnlichem technischen Umfeld
- Alternativ: 5+ Jahre Erfahrung im Data Engineering oder Backend Engineering mit Verantwortung für Data-Plattformen
- Sehr gute SQL- und Python-Kenntnisse sowie produktive Erfahrung mit modernen Data-Stacks (Databricks, Snowflake oder BigQuery, dbt, ELT-Tools wie Airbyte oder Fivetran)
- Verständnis für verteilte Datenarchitekturen und Themen wie Schema Evolution, Backfills oder Late Arriving Data
- Strukturierte, eigenverantwortliche Arbeitsweise mit hoher Ownership-Mentalität
- Verhandlungssicheres Englisch (C1+) sowie Deutschkenntnisse auf mindestens B1-Niveau oder klare Lernbereitschaft
- Erfahrung mit Databricks-spezifischen Tools, regulierten Datenumgebungen oder AI-/ML-Datenplattformen
- Kenntnisse in Data Governance & Catalog Tools (z. B. Atlan, Alation, dbt Cloud Catalog)
- Open-Source-Beiträge im Data-Umfeld
Was wir versprechen
Arbeitsumgebung & Flexibilität- Office-First Company: Du arbeitest hybrid (3 Tage Office / 2 Tag Homeoffice) und selbstbestimmt – so, wie es für dich am besten passt.
- Modernes, klimatisiertes Büro mit viel Tageslicht
- Zentrale Lage zwischen Gleisdreieck & Potsdamer Platz mit sehr guter Anbindung
- Große Dachterrasse mit atemberaubendem Blick über Berlin
- Freie Getränke, frisches Obst und Müsli
- 100 % Übernahme eines Deutschlandtickets für deine Mobilität
- Dein Hund ist ein Teamplayer? Perfekt! Wir freuen uns über tierische Unterstützung im Büro.
- Corporate Benefits Account mit attraktiven Angeboten & Rabatten für viele Marken
- Firmenevents und Teamevents, weil uns Zusammenhalt wichtig ist
- Betriebliche Altersvorsorge mit 20 % Arbeitgeberanteil – wir denken mit dir an die Zukunft
- Spiel & Spaß nach Feierabend: Nintendo Switch, PS5, Dart & Tischkicker warten auf dich
- Agiles und modernes Mindset – offene Kommunikation – jede Stimme zählt
- Spannende Aufgabengebiete: praxistaugliches juristisches Wissen
- Wir bieten spannende Aufgaben und praxistaugliches juristisches Wissen – du kannst unsere Reise aktiv mitgestalten.
- Feedback ist bei uns keine Floskel, sondern ein echter Gamechanger: Wir setzen auf gemeinsames Wachstum.
Data Engineer (m/w/d)
LegalHero · Berlin