
NetVagas
NetVagas está com vaga(s) de emprego para Site Reliability Engineer Sre Pleno – São Paulo em São Paulo
Cargo:
Site reliability engineer sre pleno – São Paulo
Requisitos:
Sobre a Tec2Cloud
Somos uma Consultoria de Tecnologia parceiros SAP e AWS.
O nosso clima e jeito de trabalhar são guiados pelos nossos valores: paixão por pensar, tecnologia e gente, foco no cliente, empatia, dedicação e respeito!
Estamos à procura de um SRE Pleno para compor o time do nosso cliente, uma empresa multinacional Belga.
Você desempenhará um papel crucial na manutenção da confiabilidade, escalabilidade e desempenho de nossos sistemas.
Atividades:
- Demonstrar fortes habilidades de resolução de problemas para diagnosticar e resolver problemas técnicos complexos com eficiência.
- Colaborar com equipes multifuncionais para identificar e resolver as causas raízes dos problemas do sistema.
- Compreender e aplicar princípios de arquitetura de sistema para projetar e implantar sistemas escalonáveis, confiáveis e tolerantes a falhas.
- Contribuir para o projeto e implementação de melhorias de infraestrutura para melhorar o desempenho do sistema.
- Possuir familiaridade com plataformas em nuvem como Azure, AWS ou Google Cloud.
- Conhecimento e compreensão da implantação e gerenciamento de recursos em nuvem com confiabilidade, escalabilidade e segurança.
- Compreensão ou experiência com orquestração Docker e Kubernetes.
- Implementar scripts e ferramentas de automação para agilizar tarefas repetitivas, garantindo eficiência operacional.
- Colaborar com equipes de desenvolvimento para integrar a automação aos pipelines de CI/CD e agilizar o processo de lançamento, com foco nos princípios de DevOps.
- Utilizar ferramentas de monitoramento para monitorar o desempenho do sistema e dos aplicativos, fornecer insights para aprimorar a observabilidade da solução, configurar alertas e analisar métricas.
- Identificar proativamente possíveis problemas e implementar soluções de monitoramento para garantir a confiabilidade do sistema.
- Compreender os procedimentos de resposta e gerenciamento de incidentes, incluindo a participação em rodízios de plantão.
- Contribuir para a resolução de incidentes, escalonamento e análise pós-incidente (Análise de causa raiz/post-mortem sem culpa) para prevenir ocorrências futuras.
- Assumir a responsabilidade pelos projetos atribuídos, conduzindo-os desde o início até a conclusão.
- Trabalhar de forma independente e colaborativa para fornecer soluções de alta qualidade dentro de prazos especificados.
Requisitos:
- Forte capacidade analítica e de resolução de problemas.
- Compreensão dos princípios da arquitetura do sistema.
- Familiaridade com plataformas em nuvem (Azure, AWS ou Google Cloud) e sua CLI.
- Familiaridade com plataformas e ferramentas DevOps (Azure DevOps, GitHub, Jenkins).
- Experiência com ferramentas de monitoramento (Datadog, Prometheus, Dynatrace, Splunk).
- Conhecimento de procedimentos de resposta e gerenciamento de incidentes.
- Boas habilidades de comunicação em inglês, tanto escrita quanto verbal.
- Graduação em Ciência da Computação, Tecnologia da Informação ou áreas afins.
Diferenciais:
- Certificações em nuvem (Az-900, Az-104, AWS ou equivalentes GCP).
- Certificação CKA ou CKAD.
- Certificação DevOps ou SRE Foundations ou Practitioner.
Contratação no modelo PJ.
Modelo 100% Remoto.
#J-18808-Ljbffr
Salário:
A combinar
Benefícios:
indefinido
Sempre comparecer à entrevista de emprego com um currículo atualizado!
Nunca pague nenhum valor, compre cursos ou serviços que prometam participação em seleção ou contratação.
Não informe dados bancários ou pessoais por e-mail ou através de sites que não conheça.