Senior Site Reliability Engineer – Big Data Compute Platform

0
03fa1a86804f124180d3f3e7b69058a8_mobile.png


Job title: Senior Site Reliability Engineer – Big Data Compute Platform

Company: HireIO

Job description: Responsabilidades:

  • Dirigir un equipo global de SRE para la plataforma de datos, distribuido en todo Estados Unidos y Singapur. Responsable de la confiabilidad de todos los principales productos, servicios y motores de consultas de almacén de datos, como Clickhouse, Spark, Presto, Doris, etc.
  • Ejecutar acuerdos de nivel de servicio (SLA): asegúrese de que se cumplan todos los objetivos y acuerdos de nivel de servicio de los servicios de la plataforma de datos de Bytedance. Liderar a los miembros del equipo a responder de inmediato a cualquier interrupción o problema del sistema.
  • Optimización continua del rendimiento: lleva al equipo a analizar profundamente el rendimiento del servicio y los patrones de confiabilidad para identificar posibles cuellos de botella de rendimiento. Implementar medidas proactivas para prevenir las interrupciones del servicio. Trabaje con los equipos de desarrollo para optimizar el rendimiento de la aplicación, asegurando que los servicios funcionen de manera eficiente y esos recursos se utilizan de manera efectiva.
  • Gestión de incidentes: construir un mecanismo de gestión de incidentes sólido. Liderar los esfuerzos para solucionar problemas y resolver incidentes de servicio y postmortems. Coordinar con equipos multifuncionales para administrar y mitigar los eventos que impactan el servicio.
  • Automatización de infraestructura: Lleve al equipo a desarrollar cadenas de herramientas altamente eficientes que cubran las operaciones de implementación y garantía de confiabilidad de extremo a extremo. Automatice los procesos de aprovisionamiento, escala y gestión de infraestructura para reducir las intervenciones manuales y mejorar la calidad del servicio. Desarrollar y mejorar las capacidades del sistema, como la detección de autos-failure, el auto-curado, la ingeniería caótica y realizar ejercicios sistemáticos de desastres.
  • Colaboración: interactúe con los equipos de productos y desarrollo para integrar las consideraciones de confiabilidad y rendimiento en el ciclo de vida del software.
  • Planificación de capacidad y demanda: evaluar y pronosticar necesidades de infraestructura basadas en patrones de crecimiento y próximas iniciativas.
  • Manténgase actualizado: mantenga actualizado con las tendencias de la industria, las mejores prácticas y las tecnologías emergentes relacionadas con la confiabilidad del sitio y la ingeniería de infraestructura.

RequisitosCalificaciones:

  • Licenciatura o superior, en informática, ingeniería o un campo relacionado. Apasionado por la informática y la tecnología de Internet.
  • 5+ de experiencia en el dominio SRE. Más de 2 años de experiencia en gestión del equipo.
  • Más de 5 años de experiencia y comprensión en profundidad de Linux, redes de computadora y bases de datos. Competente en los conjuntos de herramientas de código abierto SRE/DevOps, herramientas de monitoreo de sistemas y plataformas de orquestación de contenedores como Kubernetes.
  • 5 años de experiencia o familiaridad con tecnologías comerciales o de código abierto como Clickhouse, Hadoop, Doris, Spark, Presto y Kubernetes.
  • 5 años+ experiencia en la codificación en al menos un lenguaje de secuencias de comandos o programación, que incluye, entre otros, Python, Shell, Java, Go, etc.

Calificaciones preferidas:

  • Excelentes habilidades de resolución de problemas y la capacidad de pensar críticamente bajo presión. Comience con el estado final en mente y esté dispuesto a tomar un tiro de luna.
  • Fuertes habilidades de comunicación escrita y verbal, con una excelente mentalidad para el cliente. Fuerte sentido de propiedad y fácil de colaborar.
  • Capaz de colaborar efectivamente con socios y miembros del equipo en zonas horarias en diferentes países.

Expected salary:

Location: Los Angeles, CA

Job date: Wed, 06 Nov 2024 23:35:29 GMT

Apply for the job now!

Leave a Reply

Your email address will not be published. Required fields are marked *