Post-mortem Jira Ops

26 dezembro 2018 | Artigos, Notícias

Post publicado pela Atlassian originalmente

Grandes incidentes são inevitáveis, e consertá-los é a principal prioridade para quaisquer equipes de Operações ou DevOps. Mas o que acontece após o serviço ser restaurado? As equipes aproveitam o tempo para entender completamente o que deu errado e depois fazem o acompanhamento para evitar que isso aconteça novamente?

A realidade é que muitas equipes não o fazem. Post mortem de incidentes não são concluídos ou fornecem apenas uma análise superficial das causas subjacentes.
Sem a análise adequada e correções profundas, os incidentes repetidos são comuns em nossa indústria. Mais de 60% das equipes da nossa pesquisa de opinião do Jira Ops disseram que gostariam de melhorar seu processo pós-morte ou como aprendem com os incidentes.
Esse é o motivo do porque estamos felizes em anunciar postmortems para Jira Ops, disponível hoje, como a melhor maneira de aprender e melhorar a partir de cada incidente.

Nunca perca um postmrotem

Equipes tipicamente preparam um documento post-mortem com uma discussão inocente sobre o fatores contribuintes por trás do incidente. Mas sabemos que criar manualmente a documentação postmortem pode ser um incômodo e fácil de esquecer.
No Jira Ops, você é imediatamente solicitado a criar um documento post-mortem no Confluence quando o incidente for resolvido. Por padrão, o Jira Ops criará um novo espaço de incidentes e uma página pai no Confluence para coletar todos os seus postmortems em um só lugar.

O template post-mortem contém as áreas-chaves que asseguram que todos os aspectos do incidente sejam analisados e compreendidos:

Resumo – uma visão geral do incidente, incluindo detalhes importantes copiados de tickets do Jira
Timeline – eventos-chave durante o incidente, usando a linha do tempo do Jira Ops
Análise – abrange cada estágio do incidente: lead-up, falha, impacto no cliente, detecção, resposta, recuperação e recorrência.

Causa-chave – a causa principal do incidente, costuma ser determinada por um exercício de Cinco Porquês
Lições Aprendidas – o que a equipe identificou que pode ser feito diferente numa próxima vez
Ações – links para ações paliativas no Jira, para endereçar causas chaves e lições do incidente

Essas seções são desenhadas como prompts para sua equipe garantir que cubram os pontos-chaves de cada incidente e devam ser modificados como precisarem. Por padrão, todos os incidentes do Jira Ops exigem um post-mortem para ajudar a garantir que sua equipe nunca perca um. Se você tiver um incidente de gravidade baixa e quiser pular o post-mortem, poderá fazê-lo na lista de incidentes ou no próprio incidente.

Tenha uma visão completa da timeline do incidente


A timeline de incidentes do Jira Ops postmortems é uma mão na roda, que agrupa todos os eventos chaves de um incidente em uma única lista cronológica. No passado, sem uma maneira de facilmente buscar a informação de diferentes ferramentas usadas durante um incidente, levaria horas para as equipes formularem um cronograma compreensivo.

Quando você cria um postmortem com Jira Ops, a timeline do incidente é automaticamente incluída como um macro na página de postmortem do Confluence. A timeline fornece registros exatos para todos os eventos importantes do incidente, como mudanças de status, mensagens importantes no Slack, alertas do Opsgenie, comentários de clientes no Statuspage e atualizações manuais pela equipe de incidentes.

Atue e melhore a partir dos incidentes


Depois que sua equipe analisar o que aconteceu e tiver uma ideia clara das causas principais, é essencial acompanhar essas tarefas e garantir que elas sejam concluídas em tempo hábil.
Após você ter publicado seu postmortem, você pode criar issues do Jira diretamente da página do Confluence ao selecionar o texto de cada ação e clicar no botão “Criar uma issue no Jira”. Essas issues podem ser agendadas no backlog da sua equipe de desenvolvimento e revisadas para garantir que eles sejam concluídos.

Com postmortems no Jira Ops, você pode transformar um processo manual e ignorado em uma poderosa força para aprendizado e melhoria em cada incidente.

Leia mais em:

Atlassian Executive Forum – Review

Na última terça-feira, dia 26, e-Core e Atlassian promoveram mais uma edição do Atlassian Executive Forum. O evento tem como objetivo reunir CIOs e Líderes que utilizam as ferramentas Atlassian, gerando o compartilhamento de boas práticas e soluções que tornam equipes...

Retrospectiva 2018: um ano para ficar na história

Expansão da e-Core Não poderíamos terminar o ano de 2018 sem falar em expansão. Desde março de 2017, quando a e-Core expandiu o espaço da sua matriz na capital gaúcha, o crescimento seguiu de forma constante. Só neste ano, foram mais três novos escritórios,...

Share This