Observability : O Que É E Para Que Serve?
Convidados
Bruno Pereira
CEO @ Elven Works
Carlos Costa
Gerente de SRE Cloud e Qualidade de Software @ Cogna
Explore o episódio
Desde que as APMs chegaram para suprir uma demanda por sistemas de monitoração de performance, o mercado entendeu a importância dessas ferramentas de gestão e viu novas possibilidades para ir além: e é aí que surge a observability (ou observabilidade). O conceito de observability se sustenta em três pilares: métricas, rastreabilidade (traces) e logs de eventos. Mas no que ela difere das APMs? O que é e para que serve? Na análise detalhada de informações técnicas essenciais na identificação de problemas e suas soluções. No entanto, a ferramenta sozinha não funciona com autonomia: é preciso um time dos bons para lidar com essa tecnologia e saber interpretar as análises geradas. No cenário atual do mercado, tem muita empresa papando mosca nesse sentido, e deixando passar grandes oportunidades de monitoração. O que é preciso para colocar a observability na prática de verdade? Nesse episódio do #PPTNãoCompila, Wellington Cruz recebe as feras Bruno Pereira, CEO da Elven Works, e Carlos Costa, Head de SRE e Performance de Aplicações da Keeggo, para explicar melhor o tema. Participantes: Bruno Pereira: https://www.linkedin.com/in/bruno-pereira-elven/ Carlos Costa: https://www.linkedin.com/in/carlos-costa-chucknorris-28802028/ Disponível também no Spotify: https://sptfy.com/MMNO Outras plataformas: https://linktr.ee/pptnaocompila Acompanhe nas redes Instagram e Twitter: @pptnaocompila LinkedIn: https://www.linkedin.com/company/pptnaocompila Produção: Voz e conteúdo | https://www.vozeconteudo.com.br - @vozeconteudo
- Introdução à Observabilidade em Nuvem
- Jornada Profissional e Conexão Negócio-Tecnologia
- Gestão de Complexidade e Qualidade Técnica
- A Importância de Entender o Monitoramento
- Ajustes e Custos na Arquitetura Cloud
- Boas-Vindas e Pauta do Podcast
- Apresentação de Carlos Chuck Norris Costa
- Apresentação de Bruno Pereira e Jornada Cloud
- Desafios da Observabilidade em Arquiteturas Distribuídas
- Momento Descontraído
- Chamada para Ação e Encerramento da Primeira Parte
- Fundamentos da Observabilidade e Transformação Tecnológica
- Diferenciando Observabilidade e Monitoramento
- Evolução Histórica do Monitoramento e Ferramentas APM
- Gerenciando o Volume de Dados e Qualidade
- Case Real: Desafios de Observabilidade em Startup
- Observabilidade: Luz sobre o Oculto
- IA na Observabilidade: Hype vs. Necessidade Humana
- Priorizando o Básico: 'Feijão com Arroz'
- Evitando Atropelos e Marketing em Observabilidade
- Maturidade, Processos e Pessoas Essenciais em Observabilidade
- Ferramentas vs. Expertise Humana na Resolução de Problemas
- Colaboração Dev-Infra e Gestão de Alertas
- Plano de Ação para Cada Alerta
- Gestão de Ativos e FinOps na Nuvem
- Conflito de Interesses dos Provedores Cloud
- Consequências de Más Práticas na Engenharia
- Débito Técnico e Agilidade Mal Interpretada
- Arquitetura Apropriada e Evitando Complexidade Excessiva
- MVP vs. Qualidade e Arquitetura Mínima Viável
- Amadurecimento do Mercado e Cultura de Qualidade
- Anúncio Patrocinado: Vemverse.io
- MLP (Minimum Lovable Product) e a Confiança do Cliente no Produto
- Design de Software Evolutivo e Logs de Qualidade
- Observabilidade como Fonte de Insights de Produto
- Estudo de Caso: Seguradora e Erros Específicos
- Métricas de Negócio e Impacto em Valor
- Resposta a Incidentes: Impacto no Negócio
- O Profissional Híbrido: Conectando Técnica e Negócio
- Formação Interna de Talentos SRE
- A Análise Como Diagnóstico Médico (Conhecimento de Negócio)
- Propósito da Tecnologia e Paradoxo da Disponibilidade
- Anúncio Patrocinado: Klever.io
- FinOps e o Dilema dos Incentivos dos Provedores
- Custo Inesperado e Decisões de Arquitetura Cloud
- Complexidade do Multi-Cloud e Estratégias
- Escolhas de Cloud: Alinhamento Estratégico e Equipe
- Lock-in: Quando é Justificável?
- Stacks de Observabilidade: Open Source vs. Proprietário
- Padronização e Portabilidade da Coleta de Dados
- Conselho: Escolha da Stack de Observabilidade
- Os Três Pilares da Observabilidade
- Golden Signals e Processo de Resposta a Incidentes
- Comunicação Eficaz em Crises e Simulação de Incidentes
- Guia para Gestores de TI: Início da Jornada em Observabilidade
- Fechamento: Reflexões e Convites Futuros
- Agradecimentos Finais e Chamada para Ação
eu gosto de pensar que opcionalidade é o monitoramento da área da nuvem né com todos os pontos de vista todos os as fontes de dados Talvez né que você precisa para resolver o problema no arquitetura Nativa em nuvem E é isso que as empresas agora principalmente as startups estão entendendo que é lá na ponta que eu tenho que fazer as coisas bem feitas para quem seja viável quando eu comecei eu fui beber de Formação eu só queria ter que me case Mas você vai chegando numa idade em que você começa a aprender sobre o negócio e você começa a fazer o link né de negócio com tecnologia mágico Acho que cada caso perde sua análise específica mas acho que a empresa tem que ter esse ponto de manter a complexidade a mais baixa possível e o conhecimento técnico do time o melhor possível naquele provedor [Aplausos] pessoal primeiro ter essa visão né entender cara que acompanha o cara produto não adianta você vai começar a monitorar se você não sabe o que que você tá monitorando aí você tá passageiro do carro nada de ferramenta vai ajudar [Música] tem alguns exercícios que a gente vai ter que fazer para entender para ter esse meio termo nesse ajuste né de ter uma nuvem que eu tenho mais workload que tem mais features e outra que eu tenho que mantê-la porque o suporte dela é melhor é mais barato enfim tem umas contas para pôr na mesa assim muito bem muito bem meus amigos do PPT não compila estamos aqui para mais um episódio E hoje é dia de pauta técnica e temos um cara que mais de todas as artes marciais aqui Bruno Chuck Norris na mesa conosco hoje cara obrigado pela presença muito boa hoje nós vamos falar sobre observa bilhete observabilidade como que tratamos a questão da monitoria dos ativos de tecnologia no mundo Cloud e muitos outros assuntos que a gente vai tratar aqui também sobre escolha de nuvem como você deve começar assunto de observabilidade enfim tem muitos assuntos aqui que a gente vai trocar uma ideia aqui que estão relacionados a esse inclusive qualidade de software desenvolvimento de software etc então para tratar esse assunto comigo hoje aqui está comigo na minha frente Carlos Chuck Norris Costa ele é gerente de sre cloud e qualidade de software na cogna certo e dá um oi para galera aí tudo bem Exatamente isso são três disciplinas mas a missão da missão cumprida É isso aí é que eu falei para você no começo cara se eu tivesse da minha empresa eu ia dar todas gerências para ele porque os problemas já se resolvia antes de chegar no cara por causa de medo mas ela se fala mas ela se fala então tá certo legal obrigado pelo por aceitar o convite vem compartilhar aqui eu que te agradeço Eu que agradeço fico feliz legal obrigado e aqui do meu lado direito Bruno Pereira [Música] observabilidade certo vou dar um oi para galera obrigado pessoal Prazer pela oportunidade aí da gente conversar como Wellington comentou né a gente tem uma jornada muito focada em Cloud The Voice já 13 anos eu comecei com o Cláudio 2009 a gente pegou todas as gerações né cara que ele começou com nuvem que era uma VM livre tem shift etc e tal até o cenário que a gente tá agora que é super arquitetura distribuída um problema complexo de resolver não tem como trabalhar com nuvem hoje sem pensar forte não precisa habilidade Então a gente tem todo prazer aí de conversar sobre assunto e é um ponto que eu acho que é que é fundamental a gente ter visão que e pra nuvem vai te pedir uma competência nesse tema porque senão você vai vai achar que você tá com um nível de maturidade legal quando você vai perceber você tá sofrendo com problemas básicos né então observabilidade tem que estar muito em linha com a sua estratégia de nuvem tem que ter uma visão pra esse tema enfim temos um cara de de arte macete a minha competência aqui que queira mais de temas da Terra média Senhor dos Anéis gosta do pessoal gosta do gandalfenciou aquele cara aqui aparece quando o problema tá tá complicado ali daqui a pouco sobe de novo né então seguinte alguém tinha com essa curiosidade geek também também sou sou super fã do assunto show de bola Obrigado galera pela presença de vocês já compartilhando aqui agora no começo do episódio a camiseta do PPT não confio para vocês a gente já começar o episódio com o pé direito se você que tá assistindo a gente quiser uma camiseta como essa coloca aqui embaixo no comentário quero minha camiseta e compartilhe esse episódio que a gente vai começar a distribuir novamente as camisetas do PPT não com pino então compartilhe aí com a galera se você ainda não é inscrito no canal se inscreve aqui procura a gente nas redes sociais e vamos lá com esse papo com esses caras aqui que tá sensacional Bora valeu [Música] [Aplausos] mais uma pauta técnica que é o que a galera sempre pede aqui no PPT né a gente fala sobre vários tipos de assunto falando sobre o produto sobre tecnologia as transformações digital mas a galera curte mesmo é a técnica né E hoje vamos falar aqui de observabilidade e para a gente começar a detalhar esse assunto eu queria dar um passinho atrás com vocês né antes de falar do que é o servability e as necessidades acho que a gente tem que dar um contexto do porque observar o habilite né a gente tem passado aí por um momento de transformação de tecnologia que a gente está sendo levado por um grande monte de computação distribuída né antigamente a gente trabalhava com grandes servidores grandes aplication server onde você fazia monolitos gigantes em bases gigantes né e com times gigantes trabalhando no mesmo ativo né então geralmente você monitorava simplesmente o ambiente para ver se não tô por memórias não topou o disco etc isso tinha que se escalasse de comprar mais um caminhão de máquina e botar do lado daquela máquina o mundo agora é diferente né Então até porque o processo de software passou a ser diferente passou a ser mais granular naturalmente a tecnologia passa a ser mais granulado e mais distribuída né e dentro desse contexto nasce aí a nossa conceito de observabilidade e de transações que são que passam por vários ativos digamos assim né Eu queria já passar na bola para vocês Qual é a grande diferença de observabilidade e monitoramento que a gente antes acho que essa pergunta introdutória de todo mundo pode observabilidade que eu gosto de fazer uma até surgiu recentemente numa sessão Nossa lá do programa de Formação essa rede depois a gente comenta um pouco mais sobre isso mas eu gosto de chamar o a opção habilidade do monitoramento da era da nuvem no qual você não monitora mais um alvo estático né que você comentou servidores um prêmios e tal cara você tinha aquele servidor que ia durar 35 anos tem garantia enfim é um parque que é mais estático né Você vai para nuvem você vai para um cenário que o alvo é móvel né você tem que procurar coisas que são bem mais voláteis né quantidade de servidores os endereços e tudo é muito mais dinâmico opcionalidade seria uma técnica que permite que a gente lida com esse cenário né não mágico aquele cenário estático né mas eu diria que assim a personalidade ela engloba uma monitoramento que você tem na verdade mais de um tipo de monitoramento então eu gosto de pensar que opcionalidade é o monitoramento da área da nuvem né com todos os pontos de vista todos os as fontes de idade Talvez né que você precisa para resolver o problema numa arquitetura Nativa em nuvem e eu ainda vou um pouco a lembro eu diria que observabilidade a monitoração tá dentro da observabilidade então a monitoração Eu costumo dizer que você monitora a o consumo otimização de um de um de um servidor de um banco é e a observabilidade ele te fala mais do que se ele fala poxa segunda-feira entre meio-dia e 2 horas eu sempre tenho um consumo acima do esperado em determinado sistema né então eu costumo dizer que observabilidade te traz em sites tá então e o objetivo dela é tornar o acurácia e a precisão dos técnicos muito maior então uma vez que eu sei que eu consigo olhar pela observabilidade comportamentos tendências que não estão visíveis né que eu tenho que fazer cruzamentos de métricas técnicas com métricas de negócio aí começa a ter insights Então observabilidade veio com essa necessidade a gente parar de ser estático você mais proativo mas enfim tem muita história para contar né da monitoração para observabilidade aqui antigamente em monitoração você tinha antes do ano 2000 você não tinha praticamente monitoração né entre 2000 e 2010 Aí sim você tem muita monitoração Nativa então sistemas operacionais bancos de dados Midway tinham suas métricas nativas e eles davam instrumentação Nativa quem é que não leva de um animal Então você tinha entre 2000 e 2010 é uma grande busca por métrica é quem era consultor naquela época sofria porque tinha que fazer instrumentação os perfis de monitoração não estavam preparados para isso E aí você tinha que enriquecer a monitoração que tinha lá você tinha que sentar com o cara que era de mim fala cara você precisa colocar mais essas métricas aqui né enriqueceu a instrumentação de 2010 para 2020 você tem um bundas das Ferramentas de APM da Matriz nasceu em 2005 fevereiro de 2005 Happy dynamics nasceu no dia primeiro de abril de 2008 então no final aí da década de 2000 Elas começaram a ganhar corpo então elas vieram com muita força em 2010 até 2020 são um grande potência eu não sei como a gente sobreviveu eu não consigo olhar como era antes no passado sem uma PM cara impressionante é uma coisa que tipo como é que a gente viveu até 2010 sem isso impressionante exatamente mas quem passou sabe como como progrediu né porque progrediu e aí Wellington é interessante que é isso muda de 2000 a 2010 eu tinha que buscar a métrica Agora eu tenho muita métrica e eu não sei o que fazer com isso na verdade você pega cliente isso que você fala assim Chucky cara eu meu servidor meu backup aqui não tá funcionando ou estourou o disco e ninguém viu tá cheio de médica que não tem um processo e que não tem gente olhando
[Música]
um custo absurdo por logs por médicos e tal então realmente vira um cenário que você tinha que fazer muita força para extrair dados né Para Um cenário que você tem que escolher Quais são os dados não adianta também ter log ser um log de má qualidade né tem acho que virou uma uma cidade de abundância porém com desperdício né acho que isso é um ponto que que tem acho que isso foi uma transição realmente enorme né fase pré-apm que não tinha quase nada né porque o Edgar passou por aqui também falando de micro serviço
era parceiro Red né cara você ficava falando como que eu construa algo que pluga num jmx alguma coisa que você vai ter uma cara um esforço de desenvolvimento fosse para lugar alguma merda pra poder coletar e era era assim você tinha que dedicar um tempo para isso não ficava uma visibilidade quase zero na operação era bem limitada e com a PMs e um monte de coisa que surgiu depois né tem questão de centralizador de Logus né que acho que ganhou mesmo o mercado quando veio mais que sete cara se tornou um negócio assim presente em muita empresa né Essa questão né de métricas um pouco mais avançadas com a PM depois Bistek login um pouquinho mais à frente o tracing né foram coisas que hoje em dia você tem um volume de dados uma riqueza muito maior porém cara a galera que tá operando produtos nuvem hoje não sabe como resolver o problema com isso tudo assim sem ver várias empresas que tem o problema da opcionalidade bem resolvido e não falta mais ferramenta falta sabedoria de como conectar as pontas né acho que isso ainda é um problema que eu acho bem pouco resolvido embora assim as ferramentas para isso já estejam aí né Eu tenho um caso de uso que eu posso até ilustrar esse caso cara recentemente estava dando uma ajuda para um amigo de uma Startup que ele tinha lá um ativo rodando um pé quente e tal determinados momentos ele tinha pico de uso e tinha gargalo de desempenho e não sabia exatamente aonde aí pô tem um amigo que arquiteto vou perguntar para ele cara não tinha instrumentação de nada eu falei cara impossível você saber se é quérico tá travando se acesse mutano se você não tá tendo escala do tubetes primeira coisa é instrumentar essa parada toda né recomendei que ele usasse o steck The lastic como nuvem foi cara faz lá o pacote médio não precisa ser o básico mesmo eu te ajudo a experimentar né aí sumitamos frontiend instrumentamos com a PM no BCM colocamos a gente no servidores com bernets para poder captar ali logo de ambiente etc instrumental o banco né capturar ali Quest etc joga tudo lá no famoso quibana Fizemos lestezinhos lá pô Maravilha dá para ver agora onde tá cara estourou a Estância em disco em três dias impressionante ele fez o básico ali com um pouco disco né Aí ele me liga e falou cara não tô conseguindo acessar mais para ver o que tá acontecendo acho que foi uma semana mais aí cara beleza manda o login aí que eu vou dar uma olhada aí cara não parou de funcionar tudo porque aí depois você vai no na área de Diagnóstico lá do próprio Leste o disco cheio que ele foi foi empilhando empilhando empilhando pilhando estourou o disco né Aí você tem que ir lá e fazer o ciclo de vida né tipo cara vamos manter três dias de log é faz o Live Strike E aí beleza se você quer entender um padrão curto né Tipo você quer entender como o teu padrão de de comportamento durante o dia beleza três dias é uma amostragem boa mas é o que vocês falaram Se você quer ter uma visão para cruzar com Insight de uma janela de tempo maior Se prepara para gravar logo né não é pouca coisa né E você tava no oculto Né tava não tava enxergando Eu costumo dizer que observabilidade monitoração traz tudo que tá nas trevas para a Luz chega você divina e cuidado você pode achar uns monstro lá que tava escondido no escuro que você não sabia né aí tem tem uma expectativa né até uma das descrições que eu faço às vezes com Como que o pessoal fez marketing dessas soluções você escuta por exemplo Ah não isso aqui faz com inteligência artificial como parece que não precisa de ninguém operando aquilo ali para funcionar o que não é verdade assim você tem muito problema que sem alguém sabendo como que você loga pelo que que você pesquisa depois Era um negócio não vai né no automático né E tem de fato essa questão né é um ambiente elástico um ambiente que você cara você tem que saber pelo que você vai procurar porque só de você mandar logo né ah que vocês vlog Monte logo aleatório cara não quer dizer que você vai ter o dado que você precisa né então é uma das coisas que eu acho que o mercado hoje tem uma expectativa com relação a obviabilidade APM que sempre é de você perceber o problema antes teria acontecer e você evitar antes a monetração básica era perceber rápido um problema que já aconteceu ou sei lá tópico CPU agora existia a expectativa de ser preditivo e tal só que a galera acha que como fala de intensa artificial acho que não é vira a chave tá lá cara Minha experiência é por mais que você tem time bom implementa e tal até você ter sensibilidade mesmo do quanto de logo que você precisa de quais são as métricas ficaram seis meses a um ano com um time bom é o tempo que você demora para ter de fato algo que você fala cara percebo quando tá degradando antes de cair Enfim acho que leva um tempo para amadurecer Mas você vai ver o que que a galera fala para fundo de vicie né cara porque o pessoal tava muito no romance né Ah parece que não precisa mais de um ser humano de um especialista te ajudando e você vai next next finish tá com tudo observado e nunca vai ter um disco cheio né Enfim acho que a expectativa do pessoal agora tá começando a cair na realidade tem que ser pragmático tem que trabalho que vai levar um tempo para amadurecer E aí sim você vai chegar no resultado que você espera acho que como toda a tecnologia tem que ter A modelagem no cara que conhece a parada né Tem um Hype esse toco era inclusive um dos itens que eu queria tocar na pauta tem um Hype de inteligência artificial no observability acho que eu imagino que aí queria ter saber opinião de vocês mas acho que isso vem muito da grande quantidade de dados tudo que tem muita quantidade de dados e padronizado e organizado Teoricamente você consegue treinar um modelo para detectar possíveis padrões de comportamento né então pô você tem um elastic ali cheio de de documentos conseguiria treinar [Música] um anel ali para fazer algum tipo de diferença mas exatamente o que você falou se não tiver alguém que saiba definir o modelo do que que tem que ser treinado e o que que tem que ser detectado não vai ser uma luz divina né que vai descer e resolver o teu problema de falar o que tem que ser feito né talvez pela quantidade de informação que você tem algumas coisas você consegue até fazer um treinamento etc mas não vai nada vai substituir o cara que vai fazer essa análise saber o que precisa ser treinada e Ação precisa ser feita né preparação também né da ingestão de logs você pensando formatação Quais são os sistemas e tudo isso é na origem não produz bons logs na hora que você agregou lá na frente vai continuar sendo ruim né Então existe um pouco isso e assim o que que por exemplo é uma abordagem que eu acredito que aí não é precisa necessariamente de Inteligência Artificial pensando o feijão com arroz bem feito né a gente vai muito na visão do Sr Golden sing ela tem esse tráfego erro pega com relação por exemplo com eu fui pegar que dados que você quer ter para ver fica um problema aconteceu você faz um trabalho básico que não precisa de Inteligência Artificial pegar por exemplo percentil do tempo de resposta mas ela tem se você for pegar a curva de tendência comparando por exemplo a gente tem na nossa plataforma uma abordagem assim então já um breve já vai mas assim cara só para falar que dá para resolver com feijão com arroz um negócio que já é interessante se você acompanha na janela de tempo como que tá o tempo sentiu 90 por exemplo verso do Playstation 50 tem que ser um comportamento normal só dessas curvas descolarem alguma coisa que não tem Inteligência Artificial nenhuma nisso você já consegue perceber não me agradação com algo que você consegue fazer rápido não não cientista de dados para resolver aquilo ali então acho que o momento que a gente tá pelo mercado brasileiro que é o que eu tenho mais contato é de fazer o feijão com arroz bem feito com relação a uma piscina de chegar naquele platô de maturidade que você pega um problema relativamente rápido você tem as fontes de idade que vão apontar aonde que o problema foi perceber depois onde que ele surgiu depois ele fez uma corrente bem feita e vamos ver como é que a gente consegue esticar para aplicar alguma coisa bacana porque senão a gente ficar no eu faço uma comparação que às vezes o pessoal tá falando de ir para a lua né fala não vou levar para o benet Então cara o cara para ir para Lula tem que chegar no Texas primeiro senão não vai chegar na base de Alcântara no mínimo para conseguir lançar teu foguete e eu acho que não precisa habilidade a gente está no momento do mercado que existe uma warners grandes existe um Hype grande porém o pessoal tá querendo queimar etapa em vez de fazer primeiro feijão com arroz bem feito Falou cara vamos garantir que os problemas simples aqui com ele lenta monte de coisa que cara não precisa de nada de machine learning para para detectar Você percorre isso primeiro depois que você já resolveu os problemas mais simples de um jeito confiável aí ver como que você consegue pegar uma degradação Como você consegue perceber um possível problema meia hora antes né resolver mas acho que o pessoal já está querendo queimar etapa muito influenciado pelo Hype pelo marketing que rolou em cima dos produtos que parece que não precisa ter alguém diferente fazendo e que sei lá vai comprar aquela solução vira a chave o problema tá resolvido é maturidade uma Shirlane o Iah é uma maturidade que que as empresas que a gente não tem ainda né então assim para você ser um faixa preta você vai ter que passar pela faixa branca tô falando do judô né que eu conheço um pouquinho mais você tem que passar pela branca laranja verde roxa marrom e aí chega na preta e isso que o Bruno falou é importantíssimo eu fui pré-venda nesses quatro últimos anos é técnico de voz enfim eu vendi ferramentas também né licença e desenhos de soluções de Sr e observabilidade e cara você vai numa empresa que o cliente fala eu tenho um app dinâmico e eu tenho problema de disco cheio e ninguém vê eu tenho estou gastando horrores e não vejo valor é exatamente as empresas hoje não vê valor numa incrível ferramenta dessa caríssima inclusive porque eles não maximizam os eles não fazem o básico o arroz com feijão e a gente eu vou bater na tecla também porque eu concordo com o Bruno porque hoje você tem a ferramenta o que falta é o perfil as pessoas com o conhecimento adequado e o processo tem que ter um processo eu peguei empresas que tinha alerta lá gritando e eu perguntei pro operador cara e aquele vermelho ali né fazer nada não aquilo lá é normal né para fazer nada por isso que eu cheguei tá vermelha ali ninguém nunca fez tá vermelho o vermelho não deveria ser vermelho porque senão de tomar ação ele não é vermelho certo ou alguém deveria estar tomando uma ação e ele é vermelho e não portanto alguma coisa tá errada Cadê o processo que diz que aquele tem que ser vermelho e qual é a ação para aquele vermelho que você não tá fazendo né Aí ele falou não mas não tem Ah então não tem processo Então você pega muitos clientes que realmente não tem o arroz com feijão o básico pessoas que têm preparo para isso que você precisa ter pessoas com conhecimento e o processo o processo de monitoração que é muito negligenciado quando alguém compra uma uma ferramenta já peguei clientes dizendo o seguinte cara eu tenho essa ferramenta está ler ela ela para estar resolvendo tudo eu falei cara me desculpa ela vai falar para você que uma consulta tá ruim ela vai te mostrar a consulta mas você precisa do dba para olhar a consulta e falar ah é uma varredura integral que tá acontecendo aqui eu preciso criar um índice seletivo é uma pessoa que faz isso a ferramenta ainda não faz isso Quem sabe no futuro ainda pode ser que aconteça não sei mas hoje você precisa no fator humano para fazer análise mas é muito mais máximo de quem saiu lá na Décadas atrás que não tinha isso né Você tinha que ficar olhando três para saber qual que era a consulta que era ruim hoje a ferramenta te dar na tua cara que é ruim né Aí tem um trabalho importante também depois a gente pensa é não dá para resolver esse problema nem só do lado da infra monitoração alteração Nem só do lado do desenvolvimento né Acho que até tem que ter um ótimo ponto de partida do desenvolvimento pensar Cara o que que eu preciso o que que são os eventos importantes da minha aplicação como que eu exponho bem bons halfies como que eu exponho bem os vlogs né se você tiver um bom trabalho de preparação dos vlogs na largada na hora de você procurar depois fica bem mais fácil né E existe esse ponto que o carro de comentou que é super importante da sensibilidade do monitoramento né que assim você pega um negócio que a gente já é do ambiente né Principalmente cara que você vê a monetração 2.000 Alerta cara é impossível de você ter alguma coisa acionável em cima naquilo Mas você fala cara ou eu vou cortar 99% aqui e falar que acha que não é importante ou ter de fato uma tentativa de pegar aquilo ali que tava no volume absurdo ou resolveu automaticamente ou enfim porque não dá a gente você tem muito Alerta e tudo é urgência nada é urgência você começa a ignorar quando você pega por exemplo um time que não tá tão experiente ainda com relação a monitoramento um dos erros que eu acho que são frequentes certo essa sensibilidade a pessoa achar que ela vai conseguir pegar tudo ter essa resposta começa a ter um volume de alarmes absurdo E aí cara sendo como você não tem uma ação e aí uma das coisas que eu gosto bastante da visão do sri para cada incidente né Cada Alerta que você vai ter você tem que ter um book do que que é a resposta para aquilo você tem uma coisa que ainda Precisa de uma ação manual precisa ter alguém lá sei lá reiniciando um serviço alguma coisa começa com uma ação manual daqui a pouco tenta fazer um selfier em alguma coisa mas ela é muito isso um alerta tem que ter o que que você faz para resolver aquele Alerta isso é bem bem estético cara eu gosto de pensar cara vamos pegar o que que hoje uma abordagem que eu gosto bastante de ter a gente operava isso na época da revendel é a gente gosta de um conceito que a gente chama de Matriz de resiliência nada muito sofisticado uma ideia aqui até o shopping Fight tinha lá uma documentação sobre isso a ideia que você para cada produto você vai conhecer Quais são as aplicações e serviços que aquele produto precisa para funcionar Vamos pensar que é seu e-commers que a sua pi mobilete e tal cara do que que é aquele produto é composto o que que eu preciso ter rodando para funcionar isso parece meio Óbvio Mas você vai chegar num ambiente que não tá bem monitorado ninguém sabe do que que precisar pode desligar ou não às vezes o cara fala não desliga se ninguém reclamar em uma semana é porque não tá sendo mais usado esse é o teste padrão né desliga aí Da onde veio o grito Ah deve ser aquela área ali comentado né a gente tem que fazer isso e nessa transição né do ombros para nuvem E aí essa pegada sem habilidade é um primeiro ponto é existia na época do White né ficou muito pessoal pegou um ranço Mas tinha várias ideias importantes Ali você vai beber né que eu sou catálogo do que você tem né aplicações serviços e tal a gente precisa de algo parecido com isso né para nuvem não sei porque elas têm agora conta de nuvens tem um self-service shadowhite absurdo por aí se não tiver alguma fonte que você consulta para saber o que que eu tenho hoje rodando o que que eu preciso monitorar cara vira um negócio aleatório você vai começar sei lá pluga um APM e vai começar a olhar um alerta de forma aleatória sem você perde o controle né você não fica no controle do processo quanto mais fácil você criar recursos melhor tem que ser o seu processo de gerenciamento porque senão você aperta totalmente o controle né Tá aí o finopse que nasceu dessa necessidade para isso porque tá tão fácil subir uma máquina numa nuvem que o deve sobe esquece e você continua pagando anos ali dependendo do do porte na empresa representa uma pequena fração ali do uso de nuvem mas desperdício né e Acontece muito né então ter esse processo de gerenciamento do que é criado que de fato tem workload tá ligado que ela não recebe request a dois anos né ela tá ligada ali simplesmente por causa disso né Eu acho que a grande sacada da da ocerobilidade do cruzamento dessas informações é isso sabe pô eu tenho uma máquina que está insaciável ela tem um IP E aí eu vou olhar os logos do meu Fire nada vai perceber para que que está fazendo ali né Por que que é isso tá ligado Acho que isso é a grande a grande sacada que a gente não poderia ter alguns anos atrás né E um ponto de atenção não deixem os ventos das nuvens serem os gestores do fenômenos por favor não deixe a raposa ser a gestora dos meus ovos
era um parceiro de menos de etc né de nuvem a gente fala cara você pode ter uma ferramenta x que vai te dar lá top 10 ações para otimização Cara isso aí nunca vai ser completo nunca vai olhar porque assim de verdade no discurso vai aparecer aqui tem interesse você usar se seguir cara mas não tem interesse Real em você otimizar o extrema tua conta de novo ele quer que você consuma o máximo possível e essa questão de Fato né da autonomia do self-service não veio junto com o controle né com uma visão de acho que foi para um extremo né E outra coisa que começou a acontecer bastante e aí as duas coisas conectam bastante então sem habilidade finopse e tal que você não tem um inventário Centralizado você não sabe tudo é que você tem todos os ativos você não consegue otimizar curso você não consegue inclusive saber é por exemplo é cara será que a máquina precisa desse tamanho uma das coisas que não tinha época de pandemias que chegou um padrão de comportamento ruim como tava sobrando muito dinheiro muita gente tava contratando começou a ter um padrão que eu acho que é muito ruim que é de economizar horas de desenvolvimento falar cara não utiliza isso aqui não faz uma nova feature coloca uma máquina maior Coloca mais máquina era essa conta primeira ela vem vem em dólar e ela vem de um jeito que cara você vai ter que fazer um esforço Américo lá na frente em vez de consertar já na largada que quando você conhece aquela base de código que você consegue fazer um teste de carga né então acho que a gente em alguns aspectos excesso de Capital piorou em engenharia das empresas que elas passaram a ser negligente com algumas coisas que a conta chega depois né Eu percebo eu não sei se vocês têm Essa visão também mas de alguns anos para cá a gente passou por um momento de Muita ansiedade e de um certo atropelo ali da das boas práticas de desenvolvimento e arquitetura etc por uma leitura errada do que era entrega ágil e etc né então a gente passou por um momento que a gente não falava muito sobre por exemplo débito técnico como fazer esse tipo de gestão de débito técnico e é exatamente isso que eu falo Bruno não cara faz aí implementa está não está performatico Põe mais máquina porque é rápido para por mais máquina e tal tudo em busca de você em tese buscar uma entrega mais rápida e mais ágil ali né só que é o que eu sempre falo a complexidade ela não muda de lugar o problema você só Empurra ele para frente ele não se resolve sozinho né e eu acho que atualmente as empresas têm olhado com isso com um pouco mais de seriedade é agora acho que assim chegou num ponto que a conta tá chegando né porque muitas empresas levantaram capital fizeram aquele ponto que era muito mais focado em crescimento e não gerar lucro né cara agora não tem mais capital disponível é ou a empresa vai abrir ou ela vai fechar né então ou ela fica não num ponto de de saúde técnica financeira e tal cara ela não vai sobreviver então Acho que sim Acho que em vários aspectos do mercado nuvem engenharias que a gente vai ter uma amadurecimento bom agora menos de de repente tá naquela cara a última onda tecnológica aquela Sei lá a última versão das Ferramentas X é muito mais cara que que meu time é capaz de usar com maturidade o que que é a complexidade adequada até papo lá de micro serviço ficou claro né Por exemplo cara tem muita empresa que realmente não adianta ela querer ir para service container etc e tal que cara é uma complexidade que ela não tá é preparada né Por exemplo vai pensar você vai para nuvem vai marcar tudo as cerdas um time que está acostumado a monitorar máquina virtual cara você tem que procurar vlog procurar de um jeito muito diferente então assim acho que é sair um pouco do Hype e ver meu time meu negócio do que que ele precisa o que que de fato vai fazer uma diferença no meu modelo de negócio caso contrário escolhe mais técnica careta mesmo que teu time vai conseguir dominar e cara tem problema nenhum com isso assim Acho que esse tipo de coisa parecia que enfim o certo era sempre tá na porta da Inovação mas cara tem muita empresa quer fazer um fe o arroz bem feito mesmo e acho que nesse movimento para nuvem Tem muita gente que tá com arquitetura que é mais complexa do que o seu time consegue manter vocês o cara quer começar com front-end e uma API com 3.000 serviços já com isso com um service Discovery tudo cara para que agora né Para que fazer isso Qual é a necessidade de você ter isso hoje né então às vezes é resolver na engenharia de software né o Roger pressman ele tá na nona edição né do livro dele que ele faz isso há 50 anos E ele fala que você precisa analisar o software bom quando que o seu software está bom o que que é considerado o software bom para produção para o seu usuário né E quando você desenha a arquitetura você não precisa desenhar melhor arquitetura tem que desenhar arquitetura boa para atender o seu usuário naquele momento então ele fala muito isso e eu aproveitei o gancho para falar dessa parte de engenharia que você falou sobre o ciclo de desenvolvimento e ainda deu aquela raipada quando aquela hora começou a brincar com Agile com ágio aí veio Safe né aí o pessoal confundiu o ágio agilidade com velocidade e começou a cortar coisas importantíssimas principalmente com questão de qualidade de software funcional e não funcional que é onde entra teste de segurança teste de performance e o negócio foi tão foi tão grave que você conversava você fazia revisões você percebia que as histórias não vinham nem com requisitos não funcionais por exemplo é esse botão aqui quando apertar o cliente vai ficar esperando por quanto tempo qual é o lá no design quando vocês fizeram estuda pesquisa o cliente quer quanto que retorna em quanto tempo né não tinha então a engenharia de software sofreu com isso e arquitetura também né cara arquitetura eu acho que foi a maior zona de conflito desse modelo ágil né hoje eu acho que as coisas estão se acomodando mais né porque eu mesmo fazia muito aqui de fazer muitas piadas em reunião a galera esqueci quando ele vai lançar um MVP que tem um v de viável ali no meio sabe então cara é um produto é o mínimo do produto que você tem que pegar mas ele tem que ser viável e tem que ser completo né dentro da limitação que está fazendo então tipo produto mínimo viável não é um produto mal feito que eu vou colocar no mercado para testar existe essa essa leitura ruim né e também eles têm que fazer uma meia culpa nós arquiteto sempre pensamos na melhor solução possível e às vezes fica um pouco inchado para um produto que tá começando sabe então acho que foi as duas áreas que eu vi que tinha uma zona de ficção muito grande o cara tá pensando num produto pequeno para fazer rápido quer pular etapa de desenvolvimento de de requisito funcional não funcional e o arquiteto que quer fazer o bug Khalifa do bairro aquela obra de arte né cara e agora eu percebo que o time de produto ele tá evoluindo nesse sentido principalmente porque as startups começaram a perceber que se você não cuida do produto bem feito desde o começo no momento que ele começa a crescer ele fica inviável E aí tem que parar de fazer do zero né É duas vezes o trabalho então pô começa direitinho de uma forma estruturada escalável que eu possa manter meu desenvolvimento a partir dali mas começa de forma sólida né porque senão uma hora bicho gambiarra em cima de gambiarra o produto morre e ele não pode evoluir E aí você vai ter que fazer do zero e aí isso vai acontecer exatamente no momento do crescimento da empresa e do crescimento do produto você vai entender você vai perceber que você fez até agora você tem que jogar fora então esses caras estão percebendo que isso é importante e do lado da arquitetura a gente tem falado muito agora de arquitetura mínima viável né que é pô é um bebê beleza talvez não precisa ser burcalifa agora vamos fazer um sobradinho feito aqui arrumadinho que depois eu consiga fazer uma estrutura parruda sustentável para eu colocar andarem em cima de andar mas por quando eu tiver construindo o décimo andar já tem gente morando no quinto dá para fazer dá para fazer então acho que as duas está chegando numa zona de acomodação sabe tipo o time de produto entendendo do da necessidade de começar um desenvolvimento de software de qualidade desde o começo e o time técnico de engenharia de arquitetura não querendo ser o querer fazer a Monalisa logo de cara né mas agora que a gente está percebendo é o shift left realmente tá acontecendo mas pela dor não porque as pessoas entenderam né faltou a cultura né Peter dunker fala cara a estratégia come da Cultura como estratégia no café da manhã isso então se você não tiver cultura se tiver a melhor estratégia ela vai morrer e aí eu faço a analogia com o futebol né a Argentina ganhou né mas nas copas passadas o Messi sempre foi a melhor estratégia mas o time não tinha cultura para jogar com com o Messi e a gente viu a Argentina perdeu as duas últimas copas né E essa copa ela entendeu que ela precisava jogar para o Messi e a gente viu os jogos muito bons pelo menos assim eu que gosto de assistir jogo bem jogado e a Argentina muito bem melhor final de copa que eu já assisti que eu tenho nem pensar em qual que foi a segunda é unânime então esse final maravilhoso que legal porque a gente pode tirar daí que a cultura como a estratégia no café da manhã e é isso que as empresas agora principalmente as startups estão entendendo que é lá na ponta que eu tenho que fazer as coisas bem feitas para quem não não seja viável para me tornar o meu produto inviável para não tornar o custo enviar com você que tá vendo esse podcast da hora tá vendo um monte de problema aqui que a gente tá colocando né e Quer uma ajuda aí na sua empresa faz o seguinte entra no site aqui dance que a gente pode te ajudar vem-me verso ponto aiou nós somos uma empresa relacionada à arquitetura de soluções a modernizações de aplicações também atuamos na frente Devotos para ajudar vocês a serem extremamente ágeis então dá uma olhada no nosso site que vai estar aqui embaixo e lá você vai poder ver um pouquinho da nossa história do nosso profissionais e aproveitando se você for um profissional da área de tecnologia que tá a fim de trabalhar numa empresa legal monte de colegas gente boa e tecnologia de ponta manda o e-mail para people care@memberres.io [Música]
tem uma um cara que é parceiro nosso que ele atualmente tá trabalhando com 20 ele ficou muito mais tempo executando o produto ele usa uma abordagem que eu acho interessante que é invés do MVP que seria aquela coisa descartável Você joga fora buscar o que eles chamam de mlp né que seria o mínimo Lovato né porque aí você começa a colocar um negócio assim cara para o cliente ficar feliz assim engajado aquele negócio ali vai confiar você tem que ter algumas características tipo tem que ser rápido né assim essa questão do querer MVP que a gente pensa em algo descartável você vai ter que reconstruir Você não vai colocar tanta preocupação com relação a desempenho com relação a confiabilidade né só que você exatamente não quer isso que você comentou na hora que a empresa tá começando a tracionar você tem que parar tudo vamos arrumar a casa não dá você tem que fazer ele esquema do restaurante A cozinha tem que sempre tá limpa né não pode estar Naquele esquema que você vai ter que parar ali seria mais ou menos futebol Vamos trabalhar com a cozinha suja se o restaurante começar a fazer sucesso a gente lava a cozinha não cara às vezes pro restaurante continuar cheio Tem que estar limpa né E aí se você coloca de Fato né aí pegando o produto de sucesso né que tiveram um cara um engajamento um crescimento penal pega um exemplo aí do airbnb alguns outros que sim cara são empresas que hoje já são super bem sucedidos já são mais do que viáveis rentáveis e tal você pega um cenário que cara tem que ter uma experiência de uso que de fato cara fala cara isso aqui é perfeito isso aqui eu confio né eu falava um pouco com o pessoal você pega o Sr vai ser cara beleza vamos catálogo lá de 40 Capítulos do texbook mais de 40 capítulos cara aquilo ali não queria ter que olhar aquilo ali pode ser cara vou desenvolver aqui e tal só que se você não sabe como criar um produto confiável que ele fala de monitoramento fala de boas práticas de arquitetura fala do monte de coisa vai chegar uma hora que para tornar o seu produto confiável você vai ter que parar todo o desenvolvimento vai ter que re usar a casa só que não é tão difícil você já começar aqui falando não precisa ter aquela arquitetura fantástica que vai demorar um ano para colocar em produção você pode fazer alguma coisa um pouco mais interativa Mas de repente usa Abstrações usam o modelo que se permite começar rápido sem ter nenhum Trader off importante daqui a pouco você vai para o modelo mais mais sofisticada na visão da arquitetura engenharia tem várias formas de chegar lá você pode simplificar um pouco como que você vai gerenciar Logos inicialmente como você vai monitorar como você vai fazer suas pipeline Mas você sabendo que o salto daquele modelo simplificado que resolve bem entregar o serviço depois você consegue tornar estado da arte sem ter que refazer tudo isso Isso é uma arquitetura evolutiva né é diferente de você simplificar a solução para agilizar entrega de você negligenciar a solução né usando o exemplo que você deu uma coisa é você ter uma gestão de log simplificada de uma maneira mais simples outra coisa você falar não vamos subir sem log que é o que muita coisa que a gente via Inclusive eu queria pegar esse gancho que a gente tá falando de produto e ligar com o que você falou lá no começo o cheque que você tem sites a partir de observabilidade né então se você começa por exemplo um produto que está iniciando você não sabe exatamente qual o comportamento dele você não sabe exatamente qual é a demanda Então você consegue através de requisitos não funcionais de pico de consumo pico de Quest latência etc de repente extrair até em sites de produto né em relação a isso demanda comportamento de consumo etc exatamente eu vou te falar um Case de uma seguradora uma grande seguradora do nosso país é eles estavam conhece algumas conhece algumas eu sei que você conhece eles estavam com uma dificuldade que eles queriam entender Por que que um determinado produto deles não estava tinha muita Eles não sabiam se estava Perdendo ou não mas eles não estavam satisfeito com a o dinheiro que trazia daquele produto e vamos lá uma grande tem uma grande ferramenta lá que eles utilizam também mas enfim começamos a olhar os as métricas E aí a gente viu lá uma taxa de erro lá da dos produtos estava todos os produtos estavam sendo todas as métricas eram consolidadas não estavam separadas por produtos não foi a primeira coisa que a gente a gente notou então a gente ajustou essa instrumentação para que ela fosse por produto e aí sim no produto a gente viu aí a gente viu o seguinte Poxa então aquele produto que está reclamando Olha a taxa de erro que no todo a taxa de erro eles ignoravam é uma taxa de 0,0 alguma coisa isso não dói quando a gente deu um derrudal no produto aquela taxa de erro era grande considerando só o único a taxa amostral daquele produto o erro tava muito dentro daquele produto vamos investigar Ok tempo de resposta muito ruim da aplicação já tava atingindo o time malte que aqueles configuraram e casava com a reclamação das pessoas dos caras que faziam cotação né porque a reclamação era eles ligavam falar o sistema não tá funcionando eu não tô conseguindo fazer cotação eu tô perdendo dinheiro aqui concorrente o cara do outro lado da linha falava assim cara mas tá 99,99999% disponível não tem problema todos os produtos funcionando esses 0001 era desse produto era esse produto então nós conseguimos colocar a lupa naquele produto entender qual que era o problema o produto tava com dificuldade mesmo de tempo de resposta lentidão eles tiveram que fazer uma análise naquele produto e isso só foi possível com essa análise mas se você fizer instrumentação correta e colocar isso na mão do dono do produto ele vai ter em sites ele vai ter a informação lá entendeu então ele vai ter isso ele vai ter conseguido fazer análise até preditiva E hoje eles conseguem até depois que nós fizemos o trabalho eles conseguem saber o seguinte cara se uma hora eu fiz eu deixar de fazer tantas cotações eu tô perdendo X dinheiro então isso é riquíssimo isso é de muito valor com isso daí na mão cara você consegue investimento de qualquer executivo você fala cara olha o que você tá perdendo eu só quero comprar uma PM sabe o cara faz a conta fala É acho que paga eu acho que beleza né teve um outro caso interessante que a gente participou no caso era um Varejista que tinha lá uma hipótese né que tinha oportunidade no naquele modelo do retira na loja né compra retira na loja aperta da sua casa e tal e aí tinha também um grande problema de monitoramento não era muito problema de Up time só que o problema é que assim up time é uma meta que é importante claro se não tá indisponível nada mais vai funcionar só que tem que ver a qualidade também do dado que tá vindo aí por exemplo o pessoal começou a perceber duas coisas importantes e que só com foco em produto com foco em resultado mesmo você consegue aprofundar e entender então se você colocar um cara puramente monitoramento ele vai falar não cara tá bom desempenho tá bom é que começou a perceber cara tinha muito problema de dados né que você pegava para o frete daquele produto X por um local Y cara tinha frete que era r$ 700 r$ 100 tava respondendo up time rápido etc e tal porém cara planilha de preço planilha de configuração cara o cliente não vai comprar um negócio assim e outra coisa que foi percebido E aí só em imersão de produto pessoal ainda na loja esse modelo do Retiro na loja você vai falar não bacana vamos o cara já tá com um inventário de loja grande e tal chega na loja o camarada que quer responsável por entregar o produto para o cliente lá não era comissionado por isso E aí que que acontecia chegou o cliente estava tentando retirar o produto dele ele concorre com o cliente que tá entrando na loja para querer comprar um produto novo que vai comissionar aquele vendedor então se você vem você é vendedor você vai escolher o quê se você não calibrar os incentivos do processo por mais que você tenha conseguido fazer uma transação levar tudo certinho cara O fluxo vai quebrar em algum ponto que talvez não seja sistema Talvez o negócio tá todo up mas essa de fato pegar métodos que também são bem ligadas ao produto entender a chamada do cliente como um todo ver onde que você tá tendo uma ruptura Cara isso aí não substitui uma pessoa de produto que entenda do negócio que vai procurar informação assim vai pegar soldado de api só dados de logs etc não vai perceber que cara por algum motivo a planilha de configuração de frete cara tá dando 10 vezes mais caro do que deveria o produto que custa r$ 200 não vai pagar 700 para entregar num outro estado Então acho que esse tipo de coisa que também conecta super com o tema de opcional habilidade e vai no nível de sofisticação que é de fato pensar que você já percorreu o caminho tá disponível tá com uma latência boa e tal mas vamos entender se o produto está funcionando bem aí você começa a olhar esse tipo de métrica que é cara essa experiência que eu tô querendo trazer para o meu cliente né de tira na loja troca evolução etc e tal tem que estar modelado direito no negócio e cara se eu tenho uma planilha de preço né que eu subo todo dia lá para configurar aquilo ali cara tem que revisar aquilo também não adianta e eu acho que isso é mágico nesse mundo que nós estamos falando aqui né porque a gente já quebrou uns anos atrás a barreira do desenvolvimento e operação que era uma barreira ti né Devotos já foi Hype hoje se estabilizou fala-se muito em Sr e etc e isso se consolidou mas eu acho que a próxima grande muro que a gente vai quebrar é exatamente isso que você falou Bruno não adianta eu trabalhar métricas exclusivamente técnicas se eu não olho para métricas que também são operacionais e você falando isso aqui eu já arquiteto né Já tô pensando aqui poderia fazer por exemplo tô monitorando o serviço de frete né Eu consigo eu vou monitorar latência eu vou monitorar site do payload desse cara porque não eu posso ter lá tipo média de custo é uma informação eu sei quantos por cento de erro não tenho tempo de resposta e eu tenho uma média de tempo de de do valor do frete é do valor do frete talvez até a comparação Quanto que é o frete vs o valor do da compra né e isso é o percentual Porque pô pera aí apareceu aqui 2% que o frete tá saindo maior que o preço do produto tem alguma coisa errada aqui isso também é observar exato e isso é sexy e isso que se leva eu gosto de ouvir exatamente quero saber se o servidor tá cheia não tá ele quer ouvir se o negócio dele tá vendendo se não tá qualquer média eu tive um papo recente tem um outro tema que cara nesse mundo aí de CRF a gente vê que tá um pouco fora do radar Mas agora tá começando quando conecta um pouco mais com o produto o negócio as coisas começam a aparecer que é o tema da resposta incidente é um instinto responsável aconteceu um problema Pô eu preciso da visibilidade pra quem precisa ter pode ter que rodar interna pode ter o cliente final e tal e o que que eu faço sobre aquele qual que é o meu processo para responder não determinado incidente né se eu tenho eventualmente né Por exemplo um se leva lá que ele é avisado Olha o banco te dá de talento cara vai pegar uma técnica Ele quer saber esse cara continua fazendo pics Não continua fazendo a gente tem que ter a capacidade de traduzir aquilo ali num termo que o cara vai entender Qual que é o impacto real porque cara já ganhou um técnico ninguém mais quer ouvir o cara não quer saber na minha talento cara tô perdendo venda por isso tô tendo alguma ruptura de negócio né E isso essa camada é que traduz um determinado problema técnico em algo compreensível por uns tempos de negócio que isso tá muito ligado a você desenhar um processo de resposta incidente né acho que isso é um tema cara se não pega alguém na empresa que percebe o problema e corre atrás isso fica fora do radar Total isso é uma coisa que Inclusive a gente tem conversado bastante em outros episódios que a gente fala de mercado etc que tem sido um papel que tá cada vez tecnologia tá difícil para [ __ ] há muito tempo né até contratar a gente técnica etc já é muito difícil no Brasil hoje por falta de profissionais uma formação enfim a gente tem vários episódios que a gente fala disso mas esse cara mosca branca que é o karatêmico que consegue fazer a leitura de negócio para o que tá acontecendo técnica Esse cara é mais difícil ainda e é esse cara que deveria ter essa visão né Bruno tipo cara eu tô com um problema de banco de dados está lento ele tem que entender o processo que tá em volta desse banco de dados Tecnicamente mediu os impactos mas também entender do negócio para saber o impacto e faturamento em custo operacional e custo de pessoal etc e ele tem que ser esse cara que vai fazer o intermédio com steak holder e com a liderança técnica sabe inclusive para priorizar Falou galera tem que resolver esse problema de porque isso aqui tá custando tanto hora para o negócio né então é o cara que vai priorizar para o cara técnico que vai fazer isso e também é o cara que vai chegar para o silevel eu falar cara eu preciso de orçamento para corrigir esse problema de banco porque está perdendo tanto dinheiro e você tá estressando Equipe técnica em relação a isso sem essa tradução você vai falar para o cara do seu banco tarante vai falar e daí e o contrário também para a equipe técnica pra gente o cara não tá conseguindo fazer a transação ele fala aí esse é um ponto que você comentou que cara tem algumas ideias sobre isso a gente é depois que a gente começou esse programa aberto de Formação s.r a gente começou a ter alguns padrões interessantes por exemplo ele começou a ter um conjunto de empresas que pela escassez de profissionais e começa a falar cara eu vou formar hein galera da base e começou a aparecer um padrão legal que eu acho que é super interessante você pega uma pessoa que ela era de um time de crescimento será que você suporte a cliente que já não tem aquele cara de medo o pessoal técnico não quer falar com o cliente ele é assim muito raro aquele cara ali tem a visibilidade de produto tá a maioria quer ficar a mão no teclado ali enfim é isso aí a gente começou a perceber que você pega um pessoal que tá acostumado a falar com cliente que ele entende Qual que é a dor você traz para esse camarada ferramental né de monitoramento absolutamente para ele saber o que que ele resolve com aquilo esse camarada tem duas vantagens muito boas ele conhece o negócio da empresa melhor do que o desenvolvedor Com certeza conhece a dor do cliente e ele normalmente se ele fez uma transição de carreira ali se a empresa deu oportunidade para ele ele vai ficar mais tempo naquela empresa do que aquele cara deve que às vezes cara a gente fica um ano o cara mal é mal entendeu o negócio da empresa foi para uma outra né então acho que esse tipo de coisa quando as coisas que eu tento começar bastante com o pessoal é maturidade em tecnologia uma das coisas que você precisa sempre é time engajado que conhece o teu produto esteja a fim de resolver aquele problema Você vai qualificando então as empresas têm que ter essa maturidade de eu preciso formar a minha força de trabalho o máximo que eu puder porque aí você ganha um engajamento um carinho da pessoa com a empresa você pega uma pessoa que ela só tá ali procurando a próxima vaga para ganhar 20% a mais você não vai conseguir ter então tenho visto um padrão interessante tem mais empresas com essa consciência né vou formar pessoas de produto eu vou formar pessoas de Engenharia e quando você Pega alguém que cara Ficou ali um ano atendendo chamada atendendo o cara dor de clientes só revendo levando bordo ali essa galera consegue fazer uma conexão muito melhor com o que que te faz tá impactando o negócio da empresa e como que ele resolve Então isso não padrão que eu tenho visto interessante acho que que é um caminho legal para muitas empresas né pegar essa galera do atendimento que tem ambição de algo maior prepara elas não ter um dia que ela vai ter um carinho com relação ao teu negócio e com o teu cliente que o teu time técnico muitas vezes não vai ter e você fica muito mais esclarecido você tem muito mais domínio quando você fala de negócio quando você aprende o negócio é não vou dizer para a galera que tá começando agora que é outro é outro tempo né quando eu comecei eu fui beber de Formação eu só queria até que me quis mas você vai chegando numa idade que você começa a aprender sobre o negócio e você começa a fazer o link né de negócio com tecnologia mágico né cara é mágico é desde 2010 2009 com DIU e a Kiara um abraço para ele um abraço pro hospital que a gente fazia teste de performance junto é Tinha algumas empresas que fazem um teste de performance de olho cego pegava as funcionalidades gravava o robô e testava que que a gente fazia um centava e perguntava cara me explica sobre esse sistema que que ele faz Qual objetivo se ela tem histórico de problema Qual é a taxa dele de no mês Onde que ele é mais executado menos executado então a gente fazia todas as perguntas conhecia as funcionalidades fazia algumas navegações exploratórias para conhecer antes de começar a de fato construir Os Robôs então isso a gente já fazia lá atrás então assim a gente quando tinha que fazer quando eu chegava no resultado do teste de performance para fazer análise já conseguia fazer uma análise muito com muito mais acurácia com precisão porque você conhece esse negócio Eu costumo fazer a analogia de que conhecer o negócio conhecer bem ter domínio do que você tá fazendo é igual um médico cara médico ele vai te olhar vai te perguntar vai fazer aquela aquelas perguntas iniciais se você bebe Se você fuma você tem né e depois ele vai te pedir exames certo e depois que ele pede exame ele cruza com que ele pegou na nas perguntas iniciais tem o nome técnico disso mas eu não vou arriscar isso Obrigado depois que ele faz essas perguntas ele cruza com os resultados cara ele ele consegue fazer um diagnóstico Preciso né E se não tá preciso ainda porque tem mais exames que precisa ser feito cara nosso trabalho é igual é igual então não dá para fazer um trabalho no sistema conhecer o sistema o nosso o nosso relatório ali o log é o resultado dos exames é exatamente essa receita colesterol tá alto ou não é a mesma coisa e eu acho que cara a tecnologia ela é muito fria por si só uma coisa que eu falo muito que se você olhar a tecnologia só pela tecnologia ela não tem propósito aí fica uma coisa muito romântica dizer isso mas não é não é isso não é do ponto de vista só de propósito mas de dar efetividade do seu trabalho sabe você tá olhando a performance de uma cuere por exemplo possa quarta lenta rápido onde é utilizada essa aquare qual o resultado dessa cor que que saque faz para o negócio isso tem toda a diferença na tua análise né se você tá olhando um aquário tipo de pôr o cara tá trocando o Avatar do do perfil dele isso é um peso está fazendo uma quera que termina uma transação de pedido ou da folha de casa de programa de pagamento ou dar uma folha de pagamento tem um outro peso né já falaram isso nesse podcast eu não me lembro exatamente depois eu vou deixar os créditos mas por exemplo quando você fala de Uptime eu tenho os 99999% de Up time para quem tomou o erro é 100% erro né então não adianta você olhar para pô mas eu tô com serviço 99%.
é para quem tomou o erro lá na ponta que não conseguiu fazer a compra ou o cara que tá tentando fazer um outro serviço por exemplo numa seguradora de saúde por exemplo o cara até marcar um esse cara tentou marcar o exame ele teve 100% de erro esse cara tá lá na tua margem de 999% mais para ele para aquele cliente para que ele contexto ele tomou 100% de erro e essa é a beleza da observabilidade né ela vai buscar exatamente esses essas pessoas essas esses casos né esses vieses que estão escondidos quero falar com você agora que ainda não conhece a Kleber kleber é uma empresa que já tem mais de 3 milhões de usuários em 30 países com 30 idiomas diferentes que tem trazido Soluções em blockchain criptomoedas e ativos digitais o objetivo da Clever é te dar liberdade financeira para operar nesse mercado de cripto então se você acredita nisso se você acredita nessa Liberdade você já Pensa como a Kleber vai conhecer os caras é clever.io estão contratando também pessoal para trabalhar com cripto com blockchain então se você tem interesse se você tem com respeito nessa área procura Cléber se você gosta de criptomoedas se você opera no mercado você precisa conhecer a Kleber precisa conhecer as soluções da Kleber então o endereço está aqui embaixo no vídeo para quem não tá no YouTube é cléber.o Vai lá vai conhecer que realmente é o mercado sensacional
eu queria voltar no assunto Wellington rapidinho a gente tá falando de nuvem eu guardei o assunto aqui mas a gente começou a falar de outras coisas de observar habilidade e monitoração na nuvem né finopse Mais especificamente eu trabalhando agora na educação na cogna Eu percebo que isso é muito comum né as nuvens elas dão muito incentivos para educação né Isso é excelente tá é um ponto muito positivo A questão aqui é só aquilo que a gente tava conversando né não deixa que eles façam sinopse para você porque não tem como eu vou dar uma citar um Case aqui não vou citar o nome das nuvens mas a nuvem ai a nuvem B tem um produto lá a cogna usa o moodle para algumas sistemas e a gente tava tirando ele de um primer para nuvem nós testamos em duas nuvens eu fui eu não estava na cogna ainda eu era fornecedor da Colina de teste de performance eu fui chamado pelo diretor de arquitetura e falou que me ajuda faz um teste lá e vamos ver se se se atende os mil mil requisições por minuto essa era a missão tinha que atender mil requisições por minuto então desenhamos o teste igual para as duas nuvens nas mesmas condições nas mesmas formatações guardando as suas proporções de configurações entre um e outra e testamos nenhuma das duas atingiu 1000 requisições por minuto né a nuvem atingiu 500 requisições por minutos e a nuvem B nem 250 e nós fizemos análise e eles também fizeram as duas nuvens fizeram o diagnóstico deles as recomendações deles eram subir mais máquina subir cara eu falei o diretor perguntou Mas e aí o que eu faço vamos testar eles estão pedindo para subir máquina Vamos ver até onde vai só para ver onde é o custo Mas eu meu time já tinha feito análise era código a gente sabe que 90% dos problemas de desempenho é código ok deixamos mil requisições por minuto não é nenhum bicho mas para o mudo que o mundo tem umas particularidades ele é um pouco mais ele é mais chato mais antigo não tá tão novo enfim Mas deixamos eles aumentarem é a nuvem Ah e a nuvem Fizemos o teste ficou inviável o custo praticamente o custo de de 7 8 meses que a cogna pagaria para atingir mil requisições por minuto não foi não que que nós fizemos ajustamos fizemos um até porque alterar muita coisa no mundo e não ia dar tempo nós fizemos meio a meio né colocamos alterações no código E deixamos eles aumentarem algumas coisas que fazia sentido principalmente o banco o banco mas não tudo que eles queriam Ok terminamos foi isso que aconteceu reduziu quase 60% 70% mais queriam de custo mas a mensagem aqui o case que eu tô passando é é impressionante quando tá na mão deles é aumentar a máquina então fico alerta para quem é quem trabalha com finopse quem trabalha com muita oração é observabilidade tem que a gente tem que ter um perfil de um cara desse dentro do time para tomar conta disso é tipo você dá sua dieta para o dono da do restaurante montaria para mim o dono do restaurante pega mais um né e assim vai indo e cara Os caras estão no papel deles né você não quer mexer em código eu resolvo ter problema com a máquina é só abre a carteira e eu acho que para algumas empresas Talvez seja ok mas é o que você falou precisa ter alguém que conheço o interesse da empresa estratégia da empresa e defina se isso é o que ou não exato né exato tem que ter alguém que olhe fala não pera aí não é bem por aí que a gente cair a gente vai resolver esse problema não problema raiz vamos vamos tratar isso para não ter desperdício de recurso etc né Aí tem alguns exemplos aí que são interessantes teve um até um estudo de caso que foi publicado acho que esse ano os técnicos todo mundo conhece né pesquisa de pergunta e resposta de desenvolvedor e tal cara Teve um caso lá que eles preferiram simplificar arquitetura simplesmente dando não sei quantos Tera de memória pro banco para não ter que fazer uma arquitetura Ultra complexa que seria bem mais complicado cara por causa dele resolveu perfeitamente o problema né cara você vai pensar por isso aí tá em alguma cartilha ali de boas práticas não não tá você vai falar não reduz outra dependência no banco faz uma arquitetura mais horizontal o cara vê lá bicho O que é gargalo aqui o que de fato vai fazer por colocar memória suficiente para sempre tá em memória o dado que você precisa o cara resolveu o problema deles e esse tipo de coisas que cara o cara tem que ter na game para saber Cara o que que é O Traidor que eu quero assumir o que que eu vou procurar e tem um outro problema que eu enxergo com relação a nuvem cara velocidade lançamento novos serviços é muito rápido assim é impressionante quanto que cada evento né pode ser o reinvente pode ser o do Google Então cara surge muito serviço novo o Billing desse serviço não é algo que a gente está acostumado a medir não é você entendeu bem no começo tá desenvolvendo a plataforma colocar em produção a gente cogitou para dados de telemetria faz todo sentido você ter um banco de dados times né assim ajuda bastante a gente usar lá o da Amazonas e cara trabalha com armas desde 2009 então assim eu já tenho alguma experiência calculadora e tal cara a gente fez uma estimativa que indo para a produção cara tava bem no começo ainda pouca atração poucos clientes e tal a gente chamou que o custo daquele serviço e 50 $100 mesmo foi Pô bacana não é melhor do que colocar no posts aqui legal cara a gente errou a estimativa 30 vezes cara ele chegou no terceiro quarto dia vendo qualquer tipo cara isso aqui vai custar 1.500 $2000 e cara com quase nada difícil cara Impossível aí você vai ver quais são as métricas que tem de Bering lá bikes escaneados os negócios cara como é que eu vou saber sem botar para funcionar e algumas coisas assim a gente sabe tinha já essa incerteza Falou cara vamos colocar vamos deixar num ambiente aí controlado e tal enfim um pouco acesso ainda mas a gente falou cara precisamos voltar atrás no nosso caso isso custou pra gente mas três semanas de desenvolvimento Falou cara coloca lá começa a medir poderia ter sido algo que a gente ficou sei lá um ano desenvolvendo e a dor para corrigir depois fosse muito maior né Mas qual foi a mensagem Clara ali Elas têm uma métrica que pode trazer um curso relevante para você e você não tá acostumada a medir e cara bate essa escaneado daquele serviço x você nunca fez aquilo depende do tamanho do piloto depende como que você manda depende tanta coisa cara antes de você ter algo tangível que você possa colocar para rodar você não consegue fazer E aí essa Cultura a gente faz como você falou se não tiver uma pessoa com esse perfil analítico que entenda a beleza o que que é aplicação como que ela é consumida que tenha esse dever de casa de proteger a conta da empresa é talvez isso fosse para produção e você percebido dois meses depois fechou em voz lá [ __ ] ficou tão cara então isso é uma competência que as empresas poucos têm que formar e que cara é a gente acaba tendo que medir coisa que a gente não tava acostumado mas se não é ataque tá ligado né não resolve o problema de todo mundo né às vezes eu tenho um caso interessante para comentar com ele sobre isso recentemente fui fazer um teste com aquele Não cara é o disco gerenciado do System rodar um serviço Super simples não era uma imagem docker já padrão já pré Build do vendar precisava Só jogar um yemon lá dentro que eu jogava por variável em ambiente configurar o serviço e a partir dali eu queria gravar os arquivos né como um ponto de montagem dentro do docker foi [ __ ] não vou subir um coobernet para isso né pô aí não dá para botar disso e tal para plugar no flagrante tem que ser o fster beleza [Música] foi gerando esses arquivos fazer um tireim para ir para o PS3 etc só que aí tem tem um ciclo ali que você fica dois quatro oito dias né é para os vídeos que a gente produz aqui por exemplo para poder ir subindo isso para lá só que você precisa você não pode trabalhar direto com as três né você tem que ter um trute de disco com aio rápido né para poder fazer leitura por extenso Depois estabilizou você sobe depois pro PS3 e tal cara foi acumulando 24 48 horas no terceiro dia eu falei Caraca bicho Hum como assim tanto e aí o que você falou tantas variáveis ali aqui não é tão Claro quanto você vai gastar outra coisa que me surpreendeu também load balancer Gate cara tem tipo 5 6 variáveis de fluxo de dados quantidade de requisição Uptime você não tem não tem como você prever Quando você vai gastar num load Bear simples por exemplo é muito difícil então fica a dica aí Não não deixe o dono do restaurante controlar sua dieta no final certeza que é importante né tem sei lá de serviço e quando você trabalha com minha energia de vocês vocês vão um tempinho né as três principais né Cada uma tem mais de mil Sky né que são itens que podem você pode ser cobrado cara a gente tem condição de entender e acompanhar 50 desse assim o resto são coisas que a gente só vai ter experiência rodando em produção e que cara pede uma dinâmica de fazer exatamente isso que a gente aqui as empresas não fazem né Coloca alguma coisa no ambiente de teste é de carga simula algum volume ali só que isso claro que vai ter é um overger no tempo que você vai colocar em produção porque você vai ter um giz de teste tuning interação só que se você não cria essa mecânica para você conseguir utilizar lá na frente depois que tá em produção há seis meses cara ninguém mais nem lembra daquela base de código então isso é bem e aí você paga um preço bem complexo e tem um outro ponto que realmente eu gosto de falar com o pessoal que é o seguinte eu acho o tema do multi Cloud cara arquitetura para um único produto multicolor quase sempre é muito mais encrenca do que a solução então acho que já vi por exemplo arquitetura que é o transacional tá numa nuvem analítica na outra dá para ter OK mas uma arquitetura multiplay de maneira geral ela é complexa né só que é isso se eu for pensar Você tem sei lá 200 serviços na nuvem tem uns 10 20 ali são os mais comuns que tem uma paridade entre cada nuvem e seus concorrente né máquina virtual banco gerenciado podcast streaming e tal e normalmente essa paridade acontece com um serviço que são componentes básicos de arquitetura e serviços opensos silenciados se você fica com essa abstração fala cara eu vou querer usar o daemon bebê só tem na Amazon é a mesma coisa tem lá no Google né então dá para ter uma arquitetura esquece até um tema que você deve ter com frequência né como você desenha algo que não acho que é pensar em algo agnóstico a nuvem faz sentido que você acaba trazendo uma complexidade pesado Porém você vê com que profundidade Você tá indo com aquela nuvem Ou pelo menos estar consciente de que se você casar com aquela nuvem que isso vai ser um processo que vai ficar ali durante uns quatro anos cinco anos se tiver consciente disso fez o plano faz sentido problema nenhum mas assim essa questão de você ficar no meio do caminho falar não vai ter uma arquitetura aqui que eu posso migrar para qualquer nuvem embora para outra cara isso acaba pegando aquele mínimo o máximo Beleza então eu vou ficar só usando máquina virtual bala serviço de de Jack Store você vai ficar com uma criatura que é longe de ser ótima provavelmente não vai ser a mais barata que você pode e será que você vai sei lá de uma hora você vai migrar para outra nuvem Então esse equilíbrio entre o quanto que você vai para algo específico de uma nuvem só você fica potável arquitetura multiplicar isso é um tema que acho que ainda não foi amplamente discutido e que muita complexidade inclusive reside aí né pessoal isso é uma pauta recorrente aqui no podcast sempre fala do o quanto você tem que ser um arquiteto puramente onde você fala só de componentes não fala de produtos né então vou falar tipo de uma aplicação containerizada falar de um coobernet um docker e container ali sem falar especificidades de produto que podem me trazer vantagens né mas que por um outro lado pode me trazer um determinado louquinho pra solução né E a minha visão sobre isso isso não é um episódio vocês são até convidados que a gente falar sobre multi Cloud e os três offs que isso traz na arquitetura né Mas isso não é uma decisão só técnica né isso tem uma decisão estratégica né Porque na minha visão eu falo isso já já vi arquiteto que ele me matar por causa disso mas tem login se justifica pelo retorno por trás tenho aqui que se justifica por exemplo não somos patrocinados apesar que eu gostaria um abraço Google você vai ter um datalei que tão performático e conversar pega um modelo de negócio que é forte investimento em mídia que que a eficiência do investimento em mídia é um diferencial Você vai precisar jogar aqueles dados do teu Gear 360 por um bigware alguma coisa então assim se o teu modelo de negócio ele tem uma forte conexão com algum parceiro pode ser qualquer um que seja cara a praça é isso e negocia e melhor de termos tem problema nenhum o problema é não levar em consideração todos os aspectos e tomar uma decisão que de repente te agrada um lado e não de repente não não com outro outros stakeholder importante da empresa isso concorda que não é uma decisão puramente técnica muitas vezes Inclusive a relação entre as partes e tal talvez você consiga uma negociação muito melhor com alguma das números porque já tem alguma afinidade né isso por si só pode ser um motivo para você escolher ficar ali de cara se você faz essas coisas às vezes até uma paz que vem para o time ele falou cara beleza então agora eu sei que vai ser tal parceiro tal opção vou especializar meu time naquilo ali é a pior coisa é você ter um time que ele não tá treinado na tecnologia nas técnicas que ele vai ter que trabalhar isso vai estar sempre Junior Com relação àquelas técnicas E aí cara por mais que seja um time bom ele vai ficar patinando ali um tempo que você não quer né então é inclusive esse ponto né de fazer uma escolha já é um ponto importante cara vamos escolher em vez de ficar em aberto ali discutindo eteramente ele Ah não daqui a pouco a gente pode ir pra tal lugar não acho que essa escolha é bem feita é algo que traz uma tranquilidade maior para o time mas tem que ser bem feita Vou por um pouquinho de pimenta nesse molho aí tem as questões Como suporte que pode mudar de uma hora para outra eu tô vendo isso agora na empresa onde eu tô E aí se não é multicloud a gente estaria muito amarrado cara sabe assim então tem tem algumas exercícios que a gente vai ter que fazer para entender para ter esse meio termo nesse ajuste né de ter uma de ter uma uma nuvem que eu tenho mais workload que tem mais features e outra que eu tenho que mantê-la para porque o suporte dela é melhor é mais barato enfim tem umas contas para pôr na mesa teve um estudo de caso primeiro ano da pandemia acho que foi isso que aconteceu cara cresceu lá o zoom absolutamente e arquitetura do zoom cara Não lembro agora em detalhes ela tem um esquema no qual ela tem uma sensibilidade muito clara o quanto que ela paga de data transfer e às um esquema que é amplamente multicloud ela consegue por exemplo uma radiografia x cara que eu vou rodar em hora com o Cláudio que eu consegui uma negociação aqui de da França que é muito mais barato a criatura foi desenhada pensando nisso né Falou cara eu consigo ter uma portabilidade consigo ter um tri legal fazer o cara projetou para isso acho que isso de fato também não gosto de ficar é preso num único fornecedor acho que isso tem que ter uma visão de qualquer abstração que você vai ter Pode ser que seja container pode ser máquina virtual então mas é legal você pensar cara e beleza Qual que é o meu plano B né se deu alguma coisa acho que isso tem que ter sempre uma perspectiva mas é acho que existe esse ponto e existe cada empresa tem uma maturidade boa com relação a qual que é o nível de competência técnica do que que o time conhece por exemplo pega uma empresa que é que Microsoft não tem espaço cara lá até pode rodar perfeitamente em armas mas talvez ela tenha uma afinidade tão melhor com aquela outra né então Acho que cada caso Pede sua análise mas acho que a empresa tem que ter esse ponto de manter a complexidade a mais baixa possível e o conhecimento técnico do time o melhor possível naquele provedor isso para mim né é um fator que seria importante Se eu tivesse por exemplo um que desempatar eu pensaria Cara o que que meu time é tá mais capaz de trabalhar Quais são os serviços que ele conhece e tal isso para mim né manter a complexidade e o nível técnico do time especializado seria um fator que eu sempre levaria em consideração Mas a gente nunca pode ficar Refém de um de um parceiro qualquer né Isso é uma decisão que você cada caso é um caso né não tem não tem muito jeito né então eu já vi casos onde a gente tinha um locking extremamente justificável por exemplo com isso acontece muito em eu vejo muito em ferramenta de dados ali compras ferramentas de tabler por exemplo são ótimas ferramentas de exploração analítica etc às vezes justifica você ter algumas plataformas que fazem sentido você tem algum tipo de louquinho por exemplo que é líder em CRM etc eventualmente justifica você desenvolveu mas os seus fortes inteiros em outro lugar né às vezes se justifica Às vezes o retorno é tão bom o litro é tão bom que você né É uma opção viável de acordo com a estratégia da empresa mas já vi outros casos também que são decisões completamente erradas por exemplo eu já vi aplicações web Frontier de back end é totalmente dependentes de da plataforma da pp endini por exemplo feito em cima de um stk proprietário de uma única nuvem né sendo que você poderia fazer no pensar só dá tão bem quanto numa plataforma contém realizadas às vezes até ser [Música] só que o teu código tá todo viciado com stk proprietário de uma nuvem outro exemplo
se amarra todo o teu código tem uma um suporte pesado tem licenças então cada caso é um caso né mas isso daria um episódio só sobre isso e estão convidados aqui para a gente falar de ter um papo sobre isso um dia mas sobre observabilidade acho que a gente esqueceu de falar um negócio que acho que é interessante pelo menos perguntam muito para mim tá Open steck opensers ou steck e totalmente licenciada ou híbrida Então também não tem uma resposta pronta mas temos cases que podem nos ajudar né Tem um Case da Globo que é um Case público na internet eles publicaram ou o Marcelo Pereira que é o líder lá de Sr abraço para ele que ele é novo ele é fenomenal fez todo toda toda e aí você percebe que que funciona né tem o seu custo de ter um pessoal especializado Né tentanor baixíssimo né para manter esse galera esse é um ponto cara eu conheço bem que eu fiquei três anos lá dentro inclusive na época Marcelo piranha já tava lá chegou a trabalhar perto do meu time mascos lá cara eu acho que cada empresa e até a Globo tem uma escola de fazer software que é bem própria né cara tem uma competência fora da curva essa questão de plataformas internas para reduzir complexidade cara tem um nível de maturidade que o cara eu como consultor já passei por umas 400 500 empresas raramente você vê algo que é tão Sabe aquele negócio que não é ambicioso é o extremo assim é o feijão com arroz muito bem feito de suru cara é muito muito bom e o que que é engraçado você pega um cara que já passou pelo globo.com principalmente alguém que tenha passado perto do Pas lá do tsuru staclog e tal cara nunca vi uma galera para saber exatamente no centavo quanto que custa cada giga de log não sei o que tu vai falar para o cara não manda logo ali para o stac donets não não isso aqui não o cara às vezes ele fica com uma obsessão tão grande de pagar o mínimo por dia que às vezes a empresa nem é prioridade aquilo naquele momento mas assim é uma escola de software de que por exemplo foi lá que eu aprendi uma vez a fazer teste de carga né que eu tava desenvolvendo num produto lá que era bem acessado por outros aplicações tinha um cenário que se eu não aprender a fazer teste de checar e cara eu ia passar vergonha com os caras Falei pô passa vergonha eu não quero né então vamos aprender e de fato acho que existe isso né Eu já vi software bem feito com steck super Open só se isso precisa que a empresa em vista assim qualificação manda o pessoal pra ele isso não adianta você falar que é o pensa só se a pessoa vai ter que se virar Isso é complicado e eu já vi também mecânica Inclusive eu já vi conflito entre as escolas já vi por exemplo uma empresa que eu trabalhei uma galera que veio de um ferramental service bus music software de 70 cara fazendo software muito muito bem e os cara que era da escola pensou se shita lá não que isso vai usar esse negócio aí para não vamos escrever tudo na unha aqui eu acho que você tem que conhecer as escolas tem que começar com as pessoas entender o que que o time conhece como que ele é capaz de colocar código de produção eu não acho que tenha certo ou errado contanto que você perceba que tem maturidade ali Falou cara sabe colocar em produção sabe colocar um bom processo de engenharia saber observar essa monitorar cara dá para fazer software bem feito com a n stecks diferentes e às vezes o pessoal é técnico ao extrema às vezes eles têm muita aquela questão lá se não é minha steck não serve e tal mas muita gente tem tem um bandeirismo aí então a paixão envolvida mas eu acho que o os bandols de observa bilhetes já bem arranjados São relativamente recentes né porque até pouco tempo atrás configurar a gente na mão subiu um elástico na mão configurar com grafana quibana na mão eles prometeu tudo isso na unha né agora eu não sou exatamente desse mercado mas acho que o acho que o primeiro começou a fazer mais barulho com esse tipo de buda foi o elástico que cor né Isso começou a fazer o mundo todo o que que começou a acontecer né começou a ter um crescimento horizontal da PM que antes assim o APM era aquele esquema você coloca um agente ali você conecta métrica sabe inquilinha de código que tal enfim mas também que você influencia o Gran time você já é um ponto importante depois que começou até essa esquema de steck log né o próprio Leste que começou mais com log depois ele começou a ter uma estética oficial ele te completa foi o bit que ajuda a levar logo de qualquer lugar totalmente E aí começou a ter de fato essa esse crescimento horizontal no qual cada componente cada produto desse quer ter a jornada completa seja escuta muita questão do alemã tá tudo ali mas é um ponto em crescimento nem esse próprio ponto que seu computador pintando ele conheça uma galera testando já fazendo teste em produção variando mesmo é muito pouca gente né mas é um negócio que as pessoas interessantes porque assim como muitos anos atrás a gente tinha uma certa portabilidade de aplicação Java pega uma aplicação web o cara tava num de bosta dava para rodar tranquilo a mesma coisa não não era válida para monitoramento absolubilidade Agora você começa a padronizar com a tua coleta pode ser com openâmetros você pode analisar o seu dado aos seus blogs Então onde você quiser isso acho que é bem interessante que traz um poder de barganha iniciante você fazer uma migração numa peneira no negócio complexo e arriscado agora cara a coleta tá resolvida você vai ter basicamente o dado inclusive podendo ser testado em paralelo em mais de um provedor traz um poder de negociação que acho que é bem interessante eu tô animado com o que a gente tem de perspectiva para os próximos dois anos acho que vai se tornar uma realidade é um mercado amadurecendo com isso mas para quem ainda tem dúvida é a dica que eu dou é olha para dentro de casa se você se o teu negócio é um negócio que não exige ter pessoas de tecnologia com profundo conhecimento vai para steck e paga contrate fornecedores que possam te ajudar né cuidado com com os fornecedores mas vai na steck paga elas não devem nada você trabalhou numa empresa que Dana Trace né Foi um sucesso vários cases lá a empresa que não é no começo né A empresa que não tem uma PM hoje ela tá tá no escuro e não sabe eu queria aproveitar esse teu gancho tinha que já te mandei uma pergunta para a gente já começar a puxar as considerações finais Aqui passa rápido a gente nem percebe Tá vendo pois é o cara que é um gestor de ti ou um líder de ti e quer começar a trazer esse assunto e observabilidade para dentro da empresa né acho que duas perguntas são essenciais para esse cara sair desse Episódio com com uma luz e com conhecimento para ajudar ele no dia a dia primeiro Quais são os principais componentes que ele deveria ter para iniciar observabilidade já falou aqui do APM né Outra característica logo Centralizado né como que ele consegue ter esses testes etc o que mais ele precisa para isso que tem alguns outros componentes que aí são dependentes da arquitetura né comprometeus etc um certo período monitorar a transação de serviço etc mas nem sempre a realidade da arquitetura do cara então quais são os componentes mínimos que ele deveria ter começar a pensar em observabilidade e quais são os primeiros passos para ele olhar para isso considerando que é um cara que tem um teste de monitoria ali dos Servidores básicos ele tá ouvindo esse episódio ele quer começar a evoluir legal por onde ele começa vamos vamos ser um pouco agnóstico a ferramenta né Vamos para o conceito né vamos vamos resgatar aqui os três pilares log métricas e três então ele precisa é coletar Logos né os logs são fornecidos pelos é hora contém S toda ferramenta tem né log métricas né para ficar bem claro que quer uma métrica métrica é um dado que você tira uma foto do dela numa linha do tempo né tira uma foto do consumo de CPU A cada dois segundos Isso é uma métrica precisa de métricas e três Trace de eu vou dar um exemplo aqui o hora que eu tenho três se o profile de uma aplicação é um Trace que ele dá detalhes do processo do da Trans Action né então precisa de três é onde entra o APM onde entra a PM então em uma PM Na verdade ele consegue ele tem essas três oferece todos os pilares mesmo os pilares aí ele precisa do log centralizado ele precisa de um processo de monitoração então Poxa tem esses esses dados eu tenho essas métricas esses Logos eu faço o quê então eu preciso de alguém especializado em monitoração para saber que é eu preciso ter o conceito de eventos o que que esses eventos estão acontecendo em cada camada né o banco de dados tem seus eventos o evento pode se tornar um alerta um alarme perdão né E esse alarme pode ter três situações né que ele tá normal que ele tá em perigo ele já tá estourado ou seja isso é processo ele precisa de um processo de monitoração do perfil como eu falei e a ferramenta e É pode ser open oper-se ou paga né nas pagas ele pode ter um APM pode pode até fazer uma um conjunto APM com uns hábitos da vida que é muito bom na parte de infraestrutura e uma ferramenta de Dash porque algumas apms as ferramentas de teste ainda deixam a desejar né tem algumas ferramentas são mais sexys como grafana pelo menos essa é a minha visão tem uns dados um visual assim muito interessante para se level mas diria que era isso se eu tiver faltando alguma coisa por favor me completa o pessoal primeiro ter essa visão né entender cara o que que acompanha o cara produto não adianta você vai começar a monitorar se você não sabe o que que você tá monitorando aí você tá passageiro do carro nada de ferramenta vai ajudar então de fato tem esses Pilares né do métricas Logos e né o conceito que o Google não é ser chama né para para essas métricas que o APM traz são os Golden signos né que você pegar latência tráfego e erros três são isso na linha do tempo tem um quarto lá que a saturação só que saturação é um momento que um pouco mais avançado você tem que pegar para cada produto se é a quantidade de usuário se a quantidade de transações enfim aí tem pouco isso né E isso que você comentou de processo acho que o que conecta bem essa visão né Você tem um processo de monitoramento alguma coisa vai alarmar você tem sensibilidade para isso ficar resolvido impecavelmente você ter a empresa fazendo gerando valor com aquilo ali é o processo de resposta da incidente que é o que que você faz com aquele Alerta que chegou você tem algum book que seja uma pessoa vai notificar Alguém tem que ter um parceiro com essa notificar olha cara o teu serviço aqui que eu dependo caiu o que que eu faço se a gente tem uma super sofisticação observabilidade e eu não tenho nem o feijão com arroz da resposta incidente eu acabo tendo muita visibilidade e não tem resolução né então acho que isso isso o que que a gente percebeu cara eu vejo algumas empresas que ficaram falando de Open telemetria você vê que cara não precisa habilidade o cara tá no capítulo 20 ali só que você vai ver [ __ ] a resposta incidente acontece no incidente temor ao rum tudinho sabe o que fazer teu time tem foco ali sabe cara tem umas coisas que são meio básicas tipo qual que é o papel tem tem por exemplo um modelo que é do egeot tem outro que é do oxigênio que é cara tem um instante encomenda tem um cara que é o subject expert que o cara que faz o Trouble shoot etc e tal cara tem empresa que não tem nem isso mapeado fica ruim improviso aquilo e aí que que a gente faz cara isso não é difícil de você montar você vai pensar [ __ ] tem um acidente no produto x quem que é preciso comunicar pro pessoal alguém que faz pics botar alguma coisa aqui regulatória eu tenho né então acho que esse ponto né da resposta incidente é garante que você conecta todos os pontos Cara você sabe o que que você vai fazer Teve um caso que eu conversei com um camarada que ele trabalho da empresa que operava o sócio-torcedor do Manchester City do Manchester United percebe no nível da encrenca o cara falou ele era Sutil da empresa cara quando aconteceu um problema crítico que o sócio-torcedor o cara não estava conseguindo comprar o ingresso operar e tal ele ficava na uma para fazer essa orquestração com marketing como que se comunica como que se faz na rede social cara coisa que você não quer improvisar e que não é complexo você pensar cara aconteceu um problema sócio-torcedor do Manchester City não tá conseguindo comprar o ingresso dele como que Eu comunico cara você pega qualquer se leva você colocar uma reunião de uma duas horas no mínimo um feijão com arroz com relação ao que você faz como que você comunica traz ali assessoria de imprensa cara é rede social é ficar mais normais isso não é difícil resolver mas a maioria das empresas não tem isso no papel gera um improviso na hora que você menos quer que quando você tá coincidente crítico rolando então que que os dois centavos é para colocar não se limite só esse ponto da observabilidade que é muito ferramental muita engenharia super importante sem olhar o que que você vai fazer para cada incidente importante no produto que você tem que é pode ser tão simples quanto você tem um cara que que o camarada que percebeu incidente que ele faz na sequência como que ele resolve E como que ele comunica né que às vezes a comunicação é tão importante ou mais do que eu resolver um acidente em si porque se você deixa o camarada lá que se leva eu esperando saber se o teu banco te dado está impedindo alguma coisa ou não cara a temperatura só vai aumentando né você vai daqui a pouco o cara fala [ __ ] E aí fica todo mundo no WhatsApp todo mundo no improviso quando você Define um processo documentado ali simples você traz uma tranquilidade uma comunicação que todo mundo fica com uma temperatura ali tranquilo sabendo o que que tá acontecendo Então isso é um ponto que a gente tem percebido algumas empresas que investiram muito em observe e não definiram nem o básico né prepararam um time aí vai ser cumprir o problema se você não sabe fazer com ele depois você aí gerar frustração né E isso cara por incrível que pareça um negócio bobo cara mas pega o aquele negócio que tem 30 andares você vai ter umas duas vezes por ano você vai fazer aquele ensaio de incêndio não vai descer lá então a mesma coisa vale a gente ensaiar o que que acontece num acidente cara vamos fazer provocar um ver como é que fica a tratativa E aí o cara é pega o cara que deve Coloca ele numa situação dele que faz um turbo chute e pega um processo de comunicação com quem que se comunica isso às vezes para suavizar a percepção do problema todos os clientes em volta tarem tranquilos se você comunicou bem É o que que tá acontecendo você ganha mais tempo e credibilidade para construir a solução que vai ser definitiva né então isso é um ponto que eu vejo um pouco de carência que a gente tem que tentar trabalhar para preparar mais os times para isso Ou ela então sempre você me permite talvez a gente pode ter deixado alguns gestores de t e meio confuso pela quantidade de coisas que a gente falou mas é importante pensar no seguinte é como eu fui pré-venda se eu não falar isso aqui cantor vai me dar um vai ficar triste comigo primeiro definir estratégia na estratégia é onde eu estou para onde eu vou e como que eu vou então gestores onde eu estou se é um caso verídico se eu não tiver nada nada absolutamente eu não tenho monitoração nenhuma e eu preciso e muito pouco tempo ter monitoração pelo menos de servidor então é para onde eu vou eu preciso eu não tenho nada preciso de monitoração pelo menos um servidores nas bases de dados é o que ele quer tá como que eu vou ah não sabes põe os hábitos contrata duas pessoas boas e sabes toda Dando um exemplo verídico do que aconteceu porque para ele não precisava de APM é o problema dele era era aquele momento era tirar a empresa do zero Ele entrou na empresa e estava Zerado ele Chuck do zero tô no zero Tá ok põe os hábitos contrata duas pessoas durante 6 meses você faz coloca o processo de monitoração de servidor e banco depois você vai para uma próxima fase baby então definir primeiro a estratégia é super importante E aí tem os seus passos intermediários para não chegar na melhor arquitetura do mundo né vai resolver primeiro o seu problema mais aparente ali mais meus amigos poderíamos ficar mais duas horas falando sobre isso aqui porque o assunto da da que é um assunto Central que puxa vários várias brands né com certeza a gente conversar mas acho que a gente conseguiu dar uma um bom ver viu aqui do assunto Acho que vamos ter continuação disso daqui vão poder falar observabilidade baseada em amigo serviço por exemplo a gente poder aprofundar em prometer existe como tratar logo Centralizado com transexuais Isso aqui vai longe 2023 promete tenho certeza Agradeço o convite é muito legal conhecer já o pptidão um tempo foi bacana participar do programa aceitar o convite de vir aqui compartilhar um pouco com a gente a história da cogna Obrigado cara bacana Agradeço também o Wellington oportunidade é um assunto que assim a gente de fato tem como falar uma semana disso aqui você fala com paixão né e assim Acho que é a gente precisa para elevar a maturidade justamente de mais canais trazendo esse tipo de discussão e cara sem preconceito assim você pode estar no nível x você quer ir para o próximo passo é coisas que te permitam aí nessa jornada acho que esse tipo de discussão ajuda uma galera que de repente está tendo esse contato pela primeira vez ai progredir então super cara recomendo aí que o pessoal acompanha o canal e que você segue para morrer nesse tipo de discussão que para alguém que tem um objetivo da engenharia que é que é sofisticada ela precisa ter um caminho para começar essa jornada né cara começa com alguma coisa que vai fazer aquele nivelamento né coloca ela beleza eu sei que eu vou procurar que eu vou estudar e acho que discussão qualificada né com a gente trazendo uma visão agnóstica em relação a Player tudo Acho que é algo que ajuda muito a ter essa visão em muitas empresas que estão cegas com relação a tecnologia em engenharia Qual que é o próximo passo que ela pode dar então Parabéns aí pelo canal e obrigado pelo obrigado obrigado pela pela presença de vocês aqui compartilhar com a gente quem quiser conhecer um pouco mais leve a gente tem uma presença forte em redes sociais conteúdo que tem página LinkedIn pública sempre e a gente tem um programa de Formação Sr que é bacana que tanto pega pessoas que já estão no mercado querem ir para um estágio adicional de tem um programa para isso e tem programa para transição de carreira quem tá de repente naquela área que era do nó que era aquela visão que quer ir para uma visão operação a gente tem bastante isso também e com frequência a gente faz assim como se a gente também tem um canal no YouTube a gente faz com frequência webinar de tal a gente até precisa marcar um pra gente discutir essa Rei até chegar então tipo tem várias oportunidades em conjunto cara segue a gente principalmente LinkedIn YouTube nosso canal tem bastante coisa e é muito aquela visão zero PPT muito mal na graxa a gente fala só porque aqui não adianta velho rápido ele fala disso só de assuntos que são aquela engenharia que às vezes você não sabe com quem você conversar a gente como tá nesse mercado há um bom tempo faz uma cura dele de chamar bom os times GSR e boas pessoas de engenharia para caramba colocar a luz em temas que às vezes não são tão discutidos você não sabe nem com quem que você conversa para pegar mais informação sobre aquilo então a gente tem tem produzido bastante conteúdo então programas educacionais LinkedIn YouTube é o que a gente tem feito aí de iniciativas para tentar educar o mercado e também chegar nas empresas numa pegada mais qualificada na educação acho que é sempre uma forma que a gente chega de uma forma mais nobra né do que do que simplesmente focando em mídia e tal Eu Prefiro chegar de uma forma que você gera valor primeiro ensina se tiver oportunidade para aquilo você vai você vai ser convidado né então muito bom beleza e quem quiser conhecer melhor o Chuck vai estar o link do link aqui embaixo assim procura quiser treinar kung fu kickboxing qualquer coisa é observa demais show de bola tamo junto meus amigos obrigado pela presença de vocês Espero poder compartilhar o microfone com vocês mais vezes que tem muito assunto pra gente poder conversar muito obrigado teza obrigado aí então Obrigado Chucky papo super prazer estar com prazer você que acompanhou a gente até aqui obrigado se inscreve no canal dá um joinha aqui embaixo procura a gente lá nas redes sociais compartilhe esse episódio para alguém queira conhecer mais sobre o assunto Valorize sempre o criador de conteúdo não importa o PPT não compila Ou qualquer outro podcast qualquer criador de conteúdo que traga informação para você contribui alguma coisa na sua carreira valoriza esse criador de conteúdo que é importante para todo mundo Obrigado pessoal pela audiência obrigado meus convidados um abraço até a próxima valeu
[Música] [Aplausos] [Música]
Episódios Relacionados
1h 26minSAP: Estratégia e Uso do ERP Corporativo
Marcelo Salles, Cláudio Fontes, Rômulo Barbosa
17 de dez. de 2025
1h 11minO melhor de 200 Episódios: Especial Inteligência Artificial
Juliano Dutra
26 de nov. de 2025
1h 28minSQL vs NoSQL: Tudo o que você precisa saber
Valdir Scarin
27 de ago. de 2025
2h 0minIA na Prática: Insights da NVIDIA para Startups e Devs
Jomar Silva, Fernando Adriano Machado, Rômulo Barbosa
16 de jul. de 2025
