SRE Architect – R01548544

Job title: SRE Architect – R01548544
Company: Brillio
Job description: Acerca de Brillio:Brillio es uno de los proveedores de servicios de tecnología digital de más rápido crecimiento y un socio de elección para muchas compañías de Fortune 1000 que buscan convertir la interrupción en una ventaja competitiva a través de la innovadora adopción digital. Brillio, reconocido por sus profesionales de clase mundial, conocido como “Brillians”, se distingue a través de su capacidad para integrar las habilidades digitales y de diseño digitales y de diseño de vanguardia con una dedicación inquebrantable a la satisfacción del cliente.Brillio se enorgullece de su estado como empleador de elección, atrayendo constantemente a las personas más excepcionales y talentosas debido a su énfasis inquebrantable en las tecnologías contemporáneas, innovadoras y proyectos digitales exclusivos. El implacable compromiso de Brillio de proporcionar una experiencia excepcional a sus brillos y fomentar su máximo potencial los obtiene constantemente la certificación Great Place to Work® año tras año.Arquitecto SREDallas TX – 3 días híbridoHabilidades y experiencia requeridasComo liderazgo senior de SRE, dirigirá la implementación, la optimización y el mantenimiento de los sistemas de producción en el sitio del cliente. Trabajará en estrecha colaboración con equipos interfuncionales, incluidos el desarrollo, las operaciones y las partes interesadas de los negocios, para garantizar una alta disponibilidad, rendimiento y resistencia de las aplicaciones e infraestructura. Su experiencia en automatización, monitoreo, gestión de incidentes y optimización de costos en la nube será crítica para impulsar la excelencia operativa y la eficiencia financiera.Responsabilidades clave:1. Confiabilidad y rendimiento del sistema
- Diseñar, implementar y mantener sistemas altamente disponibles, escalables y resistentes.
- Monitoree la salud y el rendimiento del sistema utilizando herramientas como Splunk, Dynatrace, Prometheus, Grafana o plataformas similares.
- Definir y rastrear objetivos de nivel de servicio (SLOS), indicadores de nivel de servicio (SLI) y presupuestos de error para medir la confiabilidad del sistema.
- Realice el análisis de causa raíz (RCA) para incidentes e implementen medidas preventivas para evitar la recurrencia.
2. Automatización y herramientas
- Automatice tareas repetitivas, como implementaciones, escala y monitoreo, utilizando lenguajes de secuencias de comandos (por ejemplo, Python, Bash, PowerShell).
- Desarrolle y mantenga la infraestructura como código (IAC) utilizando herramientas como Terraform, Ansible o CloudFormation.
- Construya y optimice las tuberías de CI/CD para agilizar los procesos de entrega de aplicaciones.
3. Gestión de incidentes y apoyo de guardia
- Lidere los esfuerzos de respuesta a incidentes, coordinando con equipos internos y de clientes para resolver problemas rápidamente.
- Participe en una rotación de guardia para proporcionar soporte 24×7 para sistemas críticos.
- Reduzca el tiempo medio para detectar (MTTD) y el tiempo medio para resolver (MTTR) a través de la monitorización y automatización proactiva.
4. Finops y optimización de costos
- Implemente las prácticas de finos para administrar y optimizar los costos de la nube y la infraestructura de manera efectiva.
- Analice y monitoree el gasto en la nube utilizando herramientas como AWS Coss Explorer, Gestión de costos de Azure o soluciones de terceros (por ejemplo, CloudHealth, Spot.io).
- Identifique las oportunidades para reducir los costos a través de la optimización de recursos, las instancias reservadas, las instancias spot y las políticas de escala automática.
- Colabora con los equipos de finanzas e ingeniería para establecer presupuestos, pronósticos y estrategias de asignación de costos.
- Educar y capacitar a los equipos sobre el desarrollo de los costos y las prácticas operativas.
5. Colaboración y liderazgo
- Actúa como el principal punto técnico de contacto en el sitio del cliente, fomentando relaciones sólidas con las partes interesadas.
- Mentore los ingenieros junior y guíelos para adoptar las mejores prácticas de SRE, incluida la optimización de costos.
- Colabora con los equipos de desarrollo para integrar la observabilidad, la escalabilidad, la confiabilidad y la eficiencia de rentabilidad en el ciclo de vida del desarrollo de software (SDLC).
6. Cumplimiento y seguridad
- Garantizar el cumplimiento de los estándares de seguridad y los requisitos reglamentarios (por ejemplo, GDPR, HIPAA, SOC 2).
- Implementar y hacer cumplir las mejores prácticas de seguridad en todos los sistemas y procesos.
- Realice auditorías regulares y evaluaciones de vulnerabilidad para mantener un entorno seguro.
Calificaciones requeridas:Experiencia:
- Más de 9 años de experiencia en operaciones de TI, DevOps o roles de ingeniería de confiabilidad del sitio.
- Experiencia probada Las iniciativas de SRE líder en roles orientados al cliente o en el sitio.
- Experiencia práctica con plataformas en la nube (AWS, Azure, GCP) y tecnologías de contenedores (Docker, Kubernetes).
- Fuerte comprensión de los sistemas distribuidos, la arquitectura de microservicios y la computación sin servidor.
- Experiencia con la optimización de costos de la nube y las prácticas FINOPS
Habilidades técnicas:
- Competencia en herramientas de automatización
- Experiencia en herramientas de monitoreo y observabilidad (por ejemplo, Splunk, Dynatrace, Prometeo, Grafana).
- Experiencia con herramientas de gestión de configuración (por ejemplo, Ansible, Puppet, Chef).
- Conocimiento de los lenguajes de secuencias de comandos y programación (por ejemplo, Python, Bash, GO).
- Familiaridad con las tecnologías de bases de datos (por ejemplo, MySQL, PostgreSQL, MongoDB).
- Experiencia práctica con herramientas de gestión de costos en la nube (gestión de costos de Azure o CloudHealth).
¿Por qué debería solicitar este rol?A medida que Brillio continúa ganando impulso como socio de confianza para nuestros clientes en su viaje de transformación digital, nos esforzamos por establecer nuevos puntos de referencia para la velocidad y la creación de valor. El equipo DI de Brillio está a la vanguardia de liderar este cargo reinventando y ejecutando cómo estructuramos, vendemos y entregamos nuestros servicios para atender mejor a nuestros clientes.Sepa cómo es trabajar y crecer en Brillio:Declaración de igualdad de oportunidades de empleoBrillio es un empleador de igualdad de oportunidades para todos, independientemente de la edad, la ascendencia, el color, la discapacidad (mental y física), el ejercicio del derecho a la atención familiar y la licencia médica, el género, la expresión de género, la identidad de género, la información genética, el estado civil, la condición médica, el estado militar o veterano, el origen nacional, la afiliación política, la raza, la raza religiosa, el sexo (incluye el embarazo, el embarazo, el niño, la lactancia y la orientación médica relacionada), y la orientación sexual), y el credo sexual.#Li-ch1 \ n\norte$ 80 – $ 85 por hora \ nSepa cómo es trabajar y crecer en Brillio:
Expected salary:
Location: Dallas, TX
Job date: Thu, 03 Apr 2025 22:08:54 GMT
Apply for the job now!