Sanctuary Computer
Publicado el 13 de septiembre de 2025
¿Eres un Data Engineer con pasión por LLMs y pipelines de datos? Únete a un colectivo creativo, trabajando en proyectos innovadores con un equipo flexible y remoto.
* Data Engineer con Python y orquestación (Prefect/Airflow) para LLMs.* Gestionarás pipelines, APIs e integrarás datos complejos.* Ambiente remoto, autónomo, con proyectos de impacto.* 5+ años de experiencia. Salario: $150k-$200k USD.
Somos un colectivo creativo, propiedad de los trabajadores, que innova en todo, desde marcas y comunidades hasta dispositivos IoT y aplicaciones multiplataforma. Compartimos ganancias, liberamos todo nuestro código, creamos nuevas empresas e invertimos en ideas emocionantes.
Trabajamos en proyectos que aportan valor a nuestro mundo, equilibrando el cuidado profundo por el trabajo con una genuina curiosidad por la vida fuera de nuestras tareas.
Actualmente, buscamos un Data Engineer con experiencia en pipelines de datos, orquestación de flujos de trabajo e integración de datos. Nuestra estrategia actual para la ingesta de datos se basa en una aplicación interna que define flujos de trabajo ligeros en código y los ejecuta con colas. Ahora, estamos expandiendo este proceso adoptando Prefect como herramienta de orquestación, lo que nos permite gestionar pipelines para datos estructurados y no estructurados de diversas fuentes, incluyendo rastreadores web y scrapers.
En este rol, trabajarás en una variedad de proyectos de clientes para encontrar soluciones pragmáticas, rentables y de alta calidad a problemas complejos. Tus responsabilidades incluirán:
Monitorear y mantener pipelines de datos, solucionar nuevos errores y abordar la variación de formatos.
Extraer y enriquecer elementos de datos adicionales de diversas fuentes.
Reprocesar y validar grandes conjuntos de datos en flujos de trabajo por lotes.
Diseñar e integrar nuevas fuentes de datos en pipelines existentes.
Alinear e integrar datos extraídos con el modelo de datos de la aplicación central para asegurar consistencia y usabilidad.
Participar en revisiones de código, proporcionando feedback constructivo a tus compañeros y asegurando la adherencia a las mejores prácticas.
Contribuir al éxito del proyecto manteniendo un seguimiento cercano de la velocidad del equipo, el alcance del proyecto, el presupuesto y el cronograma.
Negociar con los clientes para alinear el alcance del proyecto con el presupuesto y el cronograma, si es necesario.
Buscamos a alguien feliz, relajado y fácil de tratar. Flexible en todo, excepto en concesiones que puedan bajar la calidad de su trabajo, que suele ser excelente. Trabaja de forma 'inteligente', gestionando cuidadosamente su flujo de trabajo y escalonando características con dependencias de manera inteligente. Prefiere el trabajo profundo, pero está bien en salir a la superficie de vez en cuando para conversaciones estratégicas de alto nivel.
Creemos que las personas con experiencia o intereses en diseño, arte, música, comida o moda suelen tener un sentido bien redondeado de diseño y calidad, por lo que una variedad de hobbies o proyectos paralelos es un gran plus.
Nuestra escala salarial oscila entre 85 USD por hora y 130 USD por hora, dependiendo de la antigüedad y la experiencia en liderazgo de equipo. Nuestros proyectos rara vez son de menos de 8 semanas a 40 horas por semana. Además, pagamos bonificaciones discrecionales por ir más allá, como capacitar y entrenar a otros, conseguir nuevos negocios, hablar en conferencias, etc.
Preferimos relaciones duraderas con miembros del equipo altamente responsables y comunicativos, por lo que alentamos a los candidatos a esperar compromisos a largo plazo. Un Data Engineer que trabaje de 40 a 45 semanas a tiempo completo puede ganar entre 150.000 y 200.000 USD al año.
Fuerte dominio de Python.
Experiencia con herramientas de orquestación de datos/flujos de trabajo (ej. Prefect, Dagster, Airflow).
Un entendimiento profundo de ETL y transformación de datos para la ingesta de LLMs estándar de la industria (OpenAI, Claude, etc).
Familiaridad con Large Language Models (LLMs).
Habilidad para interactuar con APIs (OpenAI, Google Gemini/Vertex, etc.) utilizando librerías wrapper como Instructor, LiteLLM, etc.
Experiencia práctica en prompt engineering.
Capacidad para trabajar con salidas estructuradas y potencialmente llamadas a herramientas (tool calling).
5+ años de experiencia general en backend (Ruby on Rails, Elixir Phoenix, Python Django o Node Express) y/o desarrollo de aplicaciones nativas (React Native, Flutter, Android, AOSP, Kotlin/Java).
Experiencia con Google Cloud Platform (GCP), particularmente Cloud Run y Cloud Tasks.
Conocimiento de tecnologías de búsqueda, incluyendo embeddings y bases de datos vectoriales para búsqueda semántica, así como búsqueda basada en palabras clave (BM25).
Familiaridad con PySpark para el procesamiento de datos por lotes.
Experiencia trabajando con LLMs, bases de datos vectoriales y otros patrones de aplicación generalistas habilitados por IA.
Experiencia de cara al cliente: trabajando directamente con clientes para recopilar requisitos y proporcionar soluciones técnicas.
Experiencia en gestión de productos: definiendo hojas de ruta de productos y colaborando estrechamente con las partes interesadas.
Experiencia en gestión de ingeniería: liderando equipos, estableciendo dirección técnica y asesorando a desarrolladores.
Nuestro proceso de entrevista comienza con una llamada donde conocerás a algunos miembros de nuestro equipo. A partir de ahí, pediremos a los candidatos adecuados que participen en un ejercicio técnico que ayuda a ilustrar el nivel de habilidad y comodidad.
Es también una excelente manera de ver cómo es trabajar con nosotros y ayudar a personas que quizás no tienen el ‘título correcto’ pero sí la experiencia y el conocimiento técnico para el puesto.
Creemos que hay un mejor equilibrio entre el freelancing y el tiempo completo. Por ello, Sanctuary trabaja de manera diferente a la mayoría:
Transparencia y Propiedad: Publicamos nuestros estados de pérdidas y ganancias a la comunidad cada año, liberamos nuestras mejores ideas y hablamos de negocios y dinero con todos en la empresa. Estamos orgullosos de dirigir nuestro negocio con integridad, y por eso compartimos todo con nuestro equipo y comunidad.
150% Carbono Negativo: Nuestro estudio compensa el 150% del carbono que usamos para hacer negocios cada año, desde nuestra fundación en 2015. Rechazamos trabajos que no están en línea con nuestra moral y animamos a nuestros compañeros a hacer lo mismo.
Moral Sólida: Desde nuestra fundación, hemos rechazado entre 1 y 2 millones de dólares en trabajos que no cumplían con nuestros estándares morales.
Asíncrono y Descentralizado: Utilizamos herramientas optimizadas para una comunicación tranquila y reflexiva, y optamos por lo asíncrono siempre que es posible. Luchamos por mantener nuestro tiempo de concentración.
Remoto: Nuestra empresa es fluida en el trabajo remoto, lo que hace que nuestro lugar de trabajo sea más descentralizado y democratizado en el proceso.
Ideas y Productos: En nuestro tiempo libre de estudio, trabajamos para construir nuestros propios productos de código abierto o internos para diversificar y reforzar nuestros ingresos. Creamos productos tecnológicos asombrosos para nuestros clientes, ¿por qué no para el estudio?
Únete a nuestra comunidad y accede a vacantes nuevas cada semana 🥰
Nunca pagues por aplicar a un trabajo remoto
Esta vacante fue encontrada originalmente en: We Work Remotely