A Arte de Torturar os Dados: Entendendo o que são Viéses | PPT Não Compila Podcast
Convidados
Luís Rúdi Afonso Silva
🎙️ Será que os dados mentem ou somos nós que os forçamos a confessar? Neste episódio do PPT Não Compila, Wellington Cruz recebe mais uma vez o mestre Luis Rudi para uma conversa indispensável sobre o universo dos dados. Partindo de um gráfico polêmico que viralizou na internet, mergulhamos de cabeça no conceito de viés de dados. Discutimos como a interpretação humana, a falta de contexto de negócio e o famoso "jeitinho" podem distorcer a realidade e levar a decisões completamente equivocadas, seja no marketing, na política ou na sua empresa. 🧠 Prepare-se para uma aula sobre pensamento crítico aplicado à tecnologia! Luis Rudi descomplica o que é o Índice de Maturidade Analítica , explica por que "correlação não é causalidade" e apresenta o conceito de Data Literacy como a chave para criar uma cultura de dados verdadeiramente eficiente. Falamos sobre os perigos dos "indicadores melancia" e como uma governança de dados robusta, com papéis e processos bem definidos, é o único caminho para construir confiança e gerar valor real a partir da informação. 🚀 De Data Mining a Produto de Dados! A conversa vai além e explora como as empresas podem sair do caos analítico e evoluir. Usando analogias com cozinhas e supermercados, detalhamos o que é um produto de dados e como criar uma esteira que permita tanto a experimentação segura quanto a entrega de insights confiáveis em escala. Se você quer entender por que o futuro é Data-Centric e como parar de brigar com os números e começar a tomar decisões melhores, este episódio é para você. Dê o play e participe da conversa nos comentários! #Dados #DataScience #BusinessIntelligence #ViésDeDados #DataLiteracy #GovernançaDeDados #ProdutoDeDados #PodcastBrasil #Tecnologia #PPTNãoCompila Convidados: Luís Rúdi Afonso Silva: linkedin.com/in/luisrudi/ Spotify: https://bit.ly/4nhxzwk Youtube: https://youtu.be/OKFfLTRET0A Outras plataformas: https://linktr.ee/pptnaocompila Acompanhe nas redes Instagram e Twitter: @pptnaocompila LinkedIn: https://www.linkedin.com/company/pptnaocompila Produção: Voz e conteúdo | https://www.vozeconteudo.com.br - @estudiosvoz
- Interpretação de dados e vieses
- Introdução ao episódio e tema
- Detalhes do tema: Viés de dados
- Interlúdio musical
- Exemplo de viés: Thiago Nigro
- Índice de Maturidade Analítica (IMA)
- Estágios do IMA
- Manipulação e desonestidade em dados
- Senso crítico e estatística
- Causalidade vs. correlação
- Falácia da causalidade
- Viés e pensamento crítico (ex: Thiago Nigro)
- Discrepância na interpretação de métricas
- Alinhamento conceitual e decisões
- Desafios de medição e manipulação de métricas
- Governança de dados e cultura organizacional
- Maturidade em dados e Data Literacy
- Dados qualitativos vs. quantitativos
- Patrocínio: Clever
- Evitando viés não intencional
- Viés sob pressão e Dunning-Kruger
- Conhecimento generalista vs. especialista em dados
- Definição e importância da Data Literacy
- Comparativo: Arquitetura vs. Ciência de Dados
- Contexto de negócio na ciência de dados
- Governança e democratização de dados
- Níveis de análise de dados
- Novas tecnologias e contexto de negócios
- Comparando vieses: Nigro e Pizza Index
- Pizza Index e senso crítico
- Desinformação e delírio coletivo
- Comparativo: Dados vs. Narrativas
- Viés político e comportamento humano
- Neutralidade dos dados e influência humana
- Definição de Data Literacy (aprofundamento)
- Os 5 C's da Data Literacy
- Data Literacy: Esclarecimento do termo
- Experiência e viés na análise de dados
- Erro de usuário na manipulação de dados
- Produto de dados e regras de negócio
- Desafios de sistemas e arquitetura data-centric
- Soluções: Open Standards e Data Centric
- Interesses comerciais e 'lock-in'
- Problemas de integração e Data Centric
- Patrocínio: VemBS
- Data Mining e correlações inesperadas
- Data como produto: Qualidade e confiança
- Ambiente de experimentação vs. produção
- Metodologias e normas de dados
- Produtização de dados e gerenciamento de risco
- Analogias culinárias e Data Kitchen
- Encerramento e chamada à ação
Às vezes a desonestidade ela é simplesmente a ignorância. É a mesma coisa que uma pessoa chegar lá e falar assim: "O esse modelo não tá assertivo e nem sabe nem o que que é assertivo. Menos idade, menor é a renda". Claro, naturalmente. Então, se é naturalmente eu poderia chegar à conclusão de que quer ter renda, fique velho. E eu faço com que a tomada de decisão seja feita, não meu viés do que é melhor ou pior para mim, mas só que eu faço ali o número e demonstrar o que realmente tá acontecendo, eu consigo tomar melhores decisões. As pessoas precisam falar dados, as pessoas precisam entender a dados e precisa ter decisão menos baseada em feeling. Muito bem. Muito bem, meus amigos. do PPT não compra. Estamos aqui para mais um episódio e hoje eu tô aqui com esse cara de novo. Obrigado meu amigo. Esse de novo, eu não sei se foi de mais uma vez, não acredito ou se foi realmente, pô, uma coisa sincera, né? Sincera de coração. Obrigado por estar aqui novamente. Um prazer sempre tá aqui. Ué, meu amigo Luiz Rud, cara, o cara dos dados para mim, é o cara dos dados. É, né? Fico feliz com com essa essa referência, cara. você é o participante, cohost, participante, etc., que você é quase sócio do podcast, que tem mais fãs, cara. Nossa, na verdade eu sou amigo aqui do L, então é sempre um prazer estar aqui. Obrigado aí para todos que gostam também do meu trabalho, cara, porque tem uma comunidade que te segue e eles participam muito pipetando com pila e a galera dá um feedback sempre muito positivo de quando você tá aqui. Que legal, fico feliz. Então, já aproveitando aqui, se você tem algum tema de dado você quer que a gente discorra aqui, já vai lá nos comentários e coloca: "Well, Rud, quero ouvir sobre tal tema". Pra gente fazer um episódio aí sobre esse tema que você quer ouvir mais. Isso aí. Então, deixa já aqui no nos comentários do episódio, seja no Spotify, seja no YouTube, já comenta aqui. A gente sempre faz um episódio um a um aqui, porque a gente sempre dá uma uma distorcida no na pauta, né? a gente fala sobre dados, fala um pouco sobre filosofia, fala sobre comportamento humano, etc. Gosto muito dos episódios com com meu amigo Rud. E hoje a gente vai falar sobre um assunto que é muito interessante e que faz parte do contexto da da pauta de dados como um todo, né, Rud? Mas a gente nunca entrou num detalhe específico que é o viés de dados, né? Será que a gente consegue de fato torturar os dados para ter informação?
Será que a gente gostaria? Será que a gente consegue tipo e o o quanto o dado ele é uma ciência exata, o quanto ele é plausível de interpretação, né? Eu acho que é um ponto interessante pra gente discutir aqui, né? Com certeza. E já dando um spoiler, eu acho que tem uma pecinha aí no meio da equação que eu acho que ela é um ponto muito sensível, né? Começa com ser e termina com humano.
Eu acho que sim.
Então, a gente vai conversar aqui sobre o que é ciência de dados, sobre o que é análise de dados, estatística, como tudo isso funciona, como funciona a interpretação de dados, eh como que a gente consegue torturar os dados até ele trazer um viés o que a gente gostaria e até o contrário, né? como que às vezes a gente pode ter uma visão sobre aquele dado com uma lupa menor do que deveria e talvez levar uma informação menor eh ou distorcida sobre sobre aquele dado. Acho que a gente vai ter uma discussão muito boa aqui e tô ansioso para falar sobre isso, Rud.
Certeza que vai ser um ótimo episódio.
Eu não vou pedir para você se apresentar porque você dispensa apresentações, né?
Mas dá um oi aí pra galera. Oi, pessoal.
Isso. Muito bom. Vamos lá, o episódio tá muito bom. Valeu, bora.
[Música] [Aplausos] [Música] [Aplausos] [Música] Vou começar, meu amigo Rud, sobre um comentário que eu fiz no LinkedIn. Inclusive você tá aparecendo bastante no LinkedI lá seus comentários, tá? Eu tô tentando ser mais ativo, sabia? Tá certo? Porque eu sempre fui muito leitor e eu tinha preguiça de colaborar. Falar: "Pô, po, posso colaborar mais? Tô tô tentando ser um pouco mais ativo, sabe? Porque eu nunca fui muito favorável de redes sociais me expor, eu gravo um podcast, mas tudo bem.
Mas enfim, né? É, eh, tem um post do um cara que eu gosto muito de seguir, que Caio Gomes.
Ele é Chief Data Officer e é um cara que coloca muito boa, muito coisa, coisas muito relevantes sobre data. Legal. No, no, no, no, no LinkedIn. Vou deixar o link pro perfil dele aqui, caso vocês queiram. E ele comentou uma outra publicação de um cara que eu talvez não recomende tanto assim, mas os meus advogados falaram para eu não dar minha opinião sobre ele, que é um cara chamado Thiago Negro, também conhecido como Primo Rico, né?
Eh, e ele postou, cara, um gráfico, eh, que mostra o percentual de renda.
Eh, é um gráfico em três, é um gráfico em três eixos, tá? Eu vou, eu posso até colocar, pedir para colocar o gráfico aqui na no vídeo, tá? Então, anotem aí, pessoal da produção, para colocar aqui.
Eh, é um gráfico em três eixos. O primeiro eixo é a idade de homens, pessoas do sexo masculino, eh, plotado no eixo Y, a renda média eh anual.
E e aí você tem quatro linhas. Essas essas quatro linhas são homens solteiros, homens casados, eh não, perdão, eu falei que eram todos homens, né? Mas não, são homens solteiros, homens casados, mulheres solteiras e mulheres casadas. E a linha dos homens casados, ela é muito mais proeminente na questão de renda, né? E aí o nosso amigo Thaago Negro, ele posta simplesmente esse gráfico e coloca uma mensagem: "Quero ficar rico case", né? Aí o Caio Gomes, ele fez um tweet que eu vou ler o o é bem curto, mas é é bem esclarecido. Eu vou até depois citar o Caio Gomes nesse nesse episódio na publicação, por caso ele possa assistir, mas eu vou ler na íntega o comentário dele. É vi esse tweet do Thiago, Thiago Negros e percebo que a compreensão da matemática da casualidade é pouca é pouco conhecida. Ele está pegando uma correlação que acontece por cofundidores comuns e está usando como origem da decisão. O pior, a maioria das empresas faz isso para confiar unicamente nas suas as suas as suas decisões, unicamente partindo de uma correlação de BI. Analytics casual é é coisa séria. Pouquíssimo a gente sabe fazer isso de forma correta. Aí eu brinquei nesse nesse comentário que eu falei, se você plotar num gráfico a quantidade de cerveja consumida versus a renda média da população, se você isolar o grupo da Alemanha e da Téquia, você vai acreditar que beber cerveja em grandes quantidades vai aumentar a sua renda média. Na dúvida eu continuo tentando, né? Então, Rud, eu queria te perguntar pelo seguinte. A gente tem um grande ditado que a gente costuma dizer que é possível torturar os dados até eles te dizerem exatamente o que você precisa que seja dito. O que você tem a dizer sobre isso? Bom, o que eu posso dizer que não é somente Thiago Negro ou, enfim, o Caio que você falou, Caio Gomes, Caio Gomes, eh, que já abordaram esse tema, seja numa perspectiva de, pô, não use os dados de uma maneira errada ou usando os dados de uma maneira errada.
Vou dar um exemplo aí que em breve a gente vai entrar novamente em campanhas políticas e tudo mais. É só ver as estatísticas que a galera utiliza em campanha política, sempre para embasar o seu viés de confirmação, para poder garantir ou dar munição através dos dados para garantir que o seu viés político tá tá OK. Então, é normal as pessoas utilizarem o o os dados eh de uma maneira equivocada para poder garantir ali uma sustentabilidade da sua opinião, tá bom? E aí eu gosto muito de um índice que existe, que é índice, índice de maturidade analítica ou IMA, que é de um instituto chamado Capra, acho que é Capra Institute, acho que é isso. E ele separa em cinco níveis o índice de maturidade. Tem o negacionista, né, que é a negação em dados, que é a pessoa que não dá valor, né, ou a empresa ou a área ou a estrutura que não dá valor aos dados.
tipo, eh não importa o que os dados digam, o que importa é minha intuição, meu feeling. Infelizmente mesmo em 2025 tem muita empresa que tá nesse estágio, tá bom? Conheço algumas, infelizmente conhecemos, tá bom? Eh, aí depois que você sai desse estágio aí de negação, você vai pro estágio de curiosidade.
Então aí você tem os curiosos em dados.
você vai testando algumas coisas, vai falando assim: "Pô, deixa eu ver, deixa eu tentar usar o dado aqui para tomar uma decisão". E aí, nesse momento que eu entendo que você tá aprendendo a usar os dados em que você ainda não tem uma literacia ainda boa em ter ali uma fluência em dados, você acaba nesse nessa curiosidade fazendo com que os os dados eles baseem uma necessidade sua, tá bom? Eh, mas ainda não tem uma escala. Depois você evolui para eh a tentativa, né, que você já tem um certo uma certa estrutura e você já quer começar ali a escalar decisões baseadas em dados, eh que aí você ainda tá dentro do muito do viés de confirmação. Uhum.
Até que você chega no famoso data driven. Olha só, somos orientados por dados, nossas decisões são orientadas por dados, mas até mesmo nessa camada desse índice de maturidade analítica, o dado ainda é muito utilizado para confirmar suas opiniões. E aí tem um quinto estágio que aí é o mais de insight driven, que é mais voltado à estratégia, que aí os dados eles realmente pautam a minha estratégia e eu não uso mais o o os dados para provar o meu resultado ou justificar que eu estou indo bem. Eu uso os dados para em cima de métricas saudáveis garantir que eu tô cumprindo a minha estratégia. E aí que eu saio dos vieses que existem, né, que pode ter aí o viés de ancoragem, o viés de eh de confirmação que a gente já falou, tem mais alguns outros viéses, eu elimino esses vieses e eu começo a ter realmente uma alfabetização de dados boa pra minha tomada de decisão. E aí o que eu posso falar é que as empresas que estão no quinto estágio desse índice de maturidade analítica são poucas. Eu particularmente não conheço nenhuma. As pessoas que estão nesse estágio C também não são muitas, até mesmo na área de dados, tá? Então é muito normal você ainda encontrar pessoas que elas querem manipular os dados ou enforcar os dados para trazer ali a confirmação da sua opinião, né? Eh, e aí tem aquela massa, né? Se os dados não me mostram o caminho, vamos com a opinião e que seja minha. Ponto, né? Eh, então precisa existir um acuturamento. Eh, e a gente tá vendo que inclusive no topo da pirâmide social para que haja uma melhor transparência no uso dos dados e na tradução desses dados pra massa, que muitas vezes é manipulada, OK? Eh, para que a gente realmente tenha uma fluência em dados dentro da das nossas organizações, mas principalmente dentro da nossa sociedade, tá? Eh, eu tenho amigos de esquerda e de direita e de centro também, tá?
Eh, eu gosto de me posicionar aí para ninguém me me cancelar. Eu gosto de me posicionar eh contra o governo, certo?
Então, me coloco sempre oposição, não importa quem. Exatamente. Então, o o que que o que que eu gosto de ver nas campanhas políticas? Os indicadores que o pessoal fala, tá? E até tem algumas eh propagandas, me esqueci, acho que até de um grande banco, nem vou citar qual, que ele fala assim: "Nós temos 89, tô dando um número fictício, mas era um número alto, 89 de e% de aprovação dos nossos clientes." Aí ia ver as estatísticas, 15% adoram o banco. Aí os outros 70 e e 80, não, 74% é são imparciais, não odeiam. Tipo, eu só eu só tolero o banco, só tol o banco, tipo, não é bom nem é ruim. E aí, qual que é a evidência? 89% dos nossos clientes eh são favoráveis, né, ou não são contra o banco. Olha só. Então, mas a propaganda seria diferente se falasse não contra, né? Não, mas mas falar que a prova tem um tem um tem um que de de de Mas olha a manipulação, ó. Vamos lá. Se eu tenho eh 75% que são eh são imparciais, na verdade 74% que são imparciais, 15 que são favoráveis, concorda que os outros 11% são não favoráveis? Sim.
Então a minha diferença entre o que é favorável e não é favorável é muito pequena. Eu poderia falar numa outra perspectiva que eh não vou fazer a conta agora aqui de cabeça que 85% da minha base de clientes não gosta do do banco, por exemplo. Sim. Não, mas é assim, ó. Se 11% aprova o banco, você tem que falar que 11% aprova o banco. Se a grande se 70% eh, [ __ ] o banco, não tô lá porque eu preciso. Você não pode dizer que esses caras aprovam. tem uma desonestidade intelectual na leitura do dado e às vezes concordo, mas às vezes a desonestidade ela é simplesmente a ignorância. É a mesma coisa que uma pessoa chegar lá e falar assim: "O esse modelo não tá assertivo". e nem sabe nem o que que é assertivo. Assertivo não tem nada a ver com o que tá certo e tá errado. Assertivo tem a ver com a clareza da explicabilidade do falasse, por exemplo, cara, eh, 95% das pessoas que me conhecem me amam. Cara, eu tenho certeza que eu tenho poucas pessoas que me odeiam na vida. Eu acho que espero que que sejam nenhuma, né? Mas eu tenho certeza que são, se existirem são poucas, né? Mas eu não posso te dizer que 95% me ama, né? Eu tenho uma camada das pessoas que são mais próximas e que eu sei que me amam, mas 90% das pessoas talvez me tolerem, me convivam comigo, etc. Agora, se eu considerar que quem não me odeia me aprova, tá errado. É uma interpretação incorreta. Então, mas é uma interpretação baseada no seu julgamento, é uma interpretação baseada eh nos seus critérios, não é uma uma interpretação baseada nos dados. Então, mas aí que tá, eu estou interpretando de uma forma deturpada aquilo que os dados não estão dizendo. É isso. E tem uma máxima, tem até um livro, poxa, eu depois eu tenho que pesquisar e vou ver se eu te passo, mas que fala que a estatística não é uma uma disciplina para eh como que eu posso falar, para trazer clareza. é uma disciplina para poder eh comprovar o que você quer. Por quê? Porque os números eles podem ser manipulados de uma maneira e você pode achar ali algumas algumas correlações para defender o seu ponto de vista. Por isso que a gente eh para conseguir ter ali eh um pouco mais de transparência nos números, a gente precisa primeiro gerar senso crítico, certo? As pessoas precisam desenvolver a sua capacidade de ter pensamento crítico. Não é porque um número é jogado lá que você vai acreditar. Primeiro, às vezes os números comparam eh um uma coisa com outra que não tem nada a ver, certo? Então eu falo assim, eh o grupo A eh eh se ama e o grupo B se odeia. Eu não posso eh utilizar percentuais para poder comparar, entendeu? Por quê? Porque eu tenho que comparar o que se ama com que se ama, o que se que se odeia. Sim.
Então, por exemplo, eu posso ter lá um grupo que 15% se odeia e 20% se ama, certo? Mas dos 15% que se quanto se amam? porque às vezes pode ser o mesmo percentual do do outro grupo, não é? Eh, eu concordo. E e aí é uma questão de interpretação de uma estatística, mas a estatística em si, ela ainda não está tão deturpada.
tá tá muito deturpada, porque você compara duas coisas que não estão em ordem de grandeza equivalentes. Sim, mas você mas você não compara isso na sua interpretação. Se fosse você compara porque aí você vai est utilizando essa estatística para provar, por exemplo, que um grupo ele é mais ofensor do que o outro grupo, sendo que os dois grupos eles podem ser igualmente ofensores, tá?
Lógico que a gente tem que tomar muito cuidado com todas essas interpretações, mas o que eu quero dizer assim, sempre tragam os números para um mesmo racional. Então, por exemplo, a gente comentou aí que na postagem a gente tinha homens solteiros, mulheres solteiras, homens casados e mulheres casadas. Vamos trazer aqui à luz eh de uma análise imparcial, OK?
Posso fazer um adendo para você comentar?
Porque ele falou um pouco da matemática da casualidade, né, que é o que é um vetor, né, o que causa e o e o resultado, né? Então ele fala sobre as pessoas que casam t maior renda. Vamos inverter, vamos fazer um um caso eh que fica claro e natural pra gente. Qual que era era era qual que era o range lá?
Era, ele tinha a idade, idade, o eixo X era idade, o eixo Y era renda. Renda. E aí você tinha quatro linhas que que eram os grupos, os quatro grupos. É uma coisa que eu eu não vi não cheguei a ver o gráfico, mas provavelmente quanto menos idade, menor é a renda. Claro, naturalmente. Então, se é naturalmente eu poderia chegar à conclusão de que quer ter renda, fique velho. Então, ó, eu eu quero pegar esse ponto.
Exatamente. Se eu fizer a mesma coisa, vamos colocar porque aí fica mais natural pra gente entender aquilo que é casual e o que é sintomático.
Se eu fizesse esse mesmo gráfico, pegasse homens, é, homens e mulheres com com diabetes ou sem diabete e eu plotasse num gráfico com que o eixo X fosse a idade, o índice de incidência de de diabetes e para grupos de homens e mulheres, eu poderia chegar à mesma conclusão, já que pessoas mais idosas ficam diabéticos mais facilmente por causa do avanço da idade, eu poderia chegar à conclusão como ele fez de que quer ficar velho, fique diabético.
Con eu eu inverti o eixo, concorda?
Então, concordo. E aí, olha só, olha só.
Então, quer dizer que se você comer muito doce ou beber muita cerveja ou beber muito álcool, porque isso também acaba gerando um uma um estádio de diabetes, né? Eh, acho que é isso. Não sei se é, mas enfim, tem isso. É, então, olha só, eu acelero a minha velice e aí eu vou ganhar mais dinheiro. Olha só que conclusão maravilhosa. Exato.
Exatamente. Ou seja, e da mesma forma que eu posso concluir que se eu ficar diabético, porque existe existe o tipo de diabetes de tipo um, se eu sou diabético, eu vou ficar velho mais rápido, isso não existe, porque o tempo ele é constante. Sim. Então, eu distorço a interpretação que ele fez. de que se eu quero ficar rico, eu tenho que casar e não a interpretação socialmente correta, que seria que pessoas que tem mais renda tem mais condições de casar e ter uma família. Então ele inverteu essa lógica de uma forma completamente esdrúxula. É, e assim é é éis é complicado a gente às vezes trazer essa perspectiva, porque talvez isso garanta ali um um viés de confirmação para para ele, por exemplo, que ele pode estar passando, por exemplo, por um momento que ele já se casou recentemente. Não sei se que é exatamente isso, né? Mas aí, por exemplo, antes dele se casar, ele era solteiro. Examente. Isso e ele já é rico há um um bom tempo.
Exatamente. Ou será que ele casou e ficou rico? Então aí, aliás, ele casou, se reparou e ficou menos rico. É, então esse pode ser uma outra questão pro pro indicador. Tinham homens divorciados lá dentro.
Misteriosamente ele omitiu essa omitiu porque e será que os homens divorciados estão dentro do grupo dos solteiros?
Porque aí eu vou lá e como a pessoa divorciada, ela perde o seu poder de capital, certo? tanto o homem como como a mulher, eu vou lá e abaixo a média do do solteiro por causa disso. Então, existem muitas questões que o pensamento crítico vai ajudar a entender ali os dados de uma maneira eh imparcial, porque aí a gente tem que fazer a análise da maneira mais pura possível.
Existe uma máxima, né? Eh, a gente, você fala que eu sou pastor, mas eu vou usar uma referência bíblica, mas não, não sou pastor não. Agora o nosso ouvinte que acompanha o vosso vídeo, tá vendo? Por chama o nosso amigo, tem uma história bíblica, pastor Rud, tem uma história bíblica que fala que lá os apóstolos iam falar sobre Jesus e sobre as leis, tudo para alguns povos. Mas teve um povo que eram os bereianos de Bereia, que tudo aquilo que os os profetas, né, os apóstolos falavam, eles faziam o quê?
pegavam a Bíblia lá, o Pentateuco, que são os cinco primeiros livros, e todos lá os outros livros do dos profetas, e eles validavam se o que tava sendo dito tava escrito, ou seja, eles pegavam com o conhecimento que eles já tinham e toda a informação nova que eles recebiam, eles validavam com a base de conhecimento que eles tinham para saber se aquilo era realmente verdade. O que falta para o povo brasileiro, mundial como um todo, porque isso acontece nos Estados Unidos, acontece em todo lugar, é à luz do que tá sendo falado, você pega essas informações e você traz para um pensamento crítico básico em cima da sua base de conhecimento. Vai lá comparar com os dados, por exemplo, que você tem dentro do seu contexto. Vai verificar se aquele estudo faz sentido.
vai comparar A com A, B com B, vai disseminar ou destrinchar ali aquele número para entender se aquilo ali realmente faz sentido, tá? Tava numa discussão recente para poder aferir se o resultado de um de uma determinada área tava OK ou não tava OK. Então tinha uma área que monitorava que falava que eles estavam abaixo do do resultado, mas só que os números deles eles estavam acima do resultado. Veja, é uma diferença às vezes de 0.5 pontos percentuais, mas que dá uma diferença grande no Mas o o o thrash de resultado nos dois casos era o mesmo? Então era para ser variava a medição ou a interpretação de estado era diferente? Então era para ser. E aí eu fui, como governança de dados destrinchar o número. Então eu tenho lá um índice que é composto por um numerador e um denominador. E eu fui analisar o denominador. O denominador de um considerava mais coisas do que o outro. Uhum. E aí eu quando eu fui entender as diferenças, eu vi. Poxa, por que que você não tá considerando isso? Ah, porque na no meu sistema não tem isso. Beleza, mas mesmo assim o número deveria dar mais próximo.
Eh, por que que você tá usando o conceito X e não o conceito Y? Ah, por causa disso, disso, disso. E aí a gente foi entendendo que o número ele não que ele foi manipulado, não foi manipulado, mas o número ele estava dentro de um contexto que não era o correto pro indicador. E aí quando a gente e a interpretação de resultado mudou isso.
Então, mas aí o que que acontece? Eh, não foi uma coisa de má fé. Mas era uma coisa que foi feita e em cima dos parâmetros passados direcionaram a análise a criar a área a criar um indicador mais favorável. Uhum. Quando o entendimento foi feito, por isso que eu falo assim que a parte cultural de data literacy é muito importante, o número foi ajustado e as coisas estão equiparáveis. E o correto era o positivo ou era o negativo? no negativo. E aí eu vou falar para você, olha só que que análise interessante. O fato de estar negativo não quer dizer que é ruim, porque eu poderia est aportando um número positivo, mas só que no final isso vai me trazer uma certa acomodação, porque eu já atingi a meta. Se eu tô andando, mostrando número negativo, isso vai me dar mais capacidade de tomar novas decisões para que o meu número fique positivo. Sim. E aí é é é a tomada de decisão por dados. Exatamente. Então, quando eu tiro o meu viés e eu estou à base da luz do que o dado transmite e aí novamente trazendo a questão de problemas de qualidade, vão ter alguns tratamentos necessários, mas quando eu equalizo os conceitos e eu faço com que a tomada de decisão seja feita não no meu viés do que é melhor ou pior para mim, mas só que eu faço ali o número eh demonstrar o que realmente tá acontecendo, eu consigo tomar melhores decisões. E aí aquilo e o último estágio que eu falei lá do Insight Driven, você ia ser direcionado a insightes e e tá pautado numa estratégia, porque aí o número ele vai refletir a sua estratégia, as suas decisões vão refletir nos números para embasar sua estratégia e não o inverso do que geralmente acontece. E tecnicamente como que a gente gere isso, Rud? Porque, por exemplo, a gente tá falando de medição de resultado de desempenho entre áreas, né? Eh, geralmente as metas executivas ela vem como dizendo resultado positivo, resultado negativo, etc. Isso dá margem à interpretação. A equação do numerador e do denominador, como você colocou, ela pode ser criativamente criada pelo gestor da área, pode ser criativamente manipulada. É, pode, assim como estamos falando de de resultado que tem um um interesse pessoal semelhante, a gente pode estar falando de métricas como essa, por exemplo, dentro de um conceito estratégico da empresa de evolução de produtos, desempenho de produtos, etc., que pode, talvez, não pela pelo interesse pessoal, mas talvez pela falta de compreensão do processo do negócio e da ampla eh quantidade de variáveis que a gente tem no mundo de dados tá sendo mal interpretada e a informação que o dado tá gerando talvez tenha uma imprecisão, né? Ó, eh, vamos trazer aqui para um contexto que você vai se lembrar, né?
PMO tradicional, que você tinha lá os projetos e você tinha que mostrar se estava verde ou vermelho. O que se criou nessa época? Os indicadores melancia, que por fora tavam verdes, mas por dentro estavam vermelhos. Por quê?
Porque eu criei um subterfúgio para conseguir mostrar uma coisa verde, mesmo n cenário estando caótico. Vermelho ou verde, tudo depende do ponto de vista que você olha. Exatamente. É como se fosse um arquiteto dos indicadores, né?
Tudo depende, tá? Eh, mas o ponto é que assim, isso mostra algumas fraquezas, certo, das culturas corporativas, que é a falta de capacidade dos executivos pensarem em estratégia e definirem métricas estratégicas, tá? Porque geralmente tem um outro termo muito conhecido no mercado, indicador confet, que é o indicador que você atinge, mas que não quer dizer nada. por exemplo, ah, tem que atingir eh 10% de aumento de receita. Não importa se essa receita aí vai te trazer o dobro em prejuízo. Deixa eu pegar esse teu gancho. E aí que eu acho que tem um gap, porque eu acho que o papel do executivo é falar isso, é falar, ó, área X, eu quero 10% de receita e 5% menos de custo. Área Y, eu quero 20% a mais de receita e sem redução de custo. Eu acho que estrategicamente para um cara que é CEO ou para um cara que tem que coordenar as áreas da empresa, faz sentido ele estar nesse nível de abstração. Mas quem define o que é o percentual de receita, o que compõe isso e o que compõe o custo para para entrar nesse indicador? E como que eu garanto que as empresas utilizam o mesmo o o mesmo parâmetro para tudo, tá? é uma área de governança de dados, é uma área de governança corporativa, porque alguém tem que definir a regra do jogo, porque tem, mas é um desenvolvimento de cultura, tá? Imagina, eh, só para complementar, se eu tiver fazendo um campeonato onde cada time define a regra do próprio jogo, o campeão é inválido, no todo mundo tem que tá rodando pela mesma regra.
Concorda? Concordo. Eh, vamos fazer uma analogia, aproveitando que tá rolando aí o Mundial de Clubes, né? Eh, pensa que eu vou precisar ter uma área de governança e não necessariamente de dados, pode ser uma área de governança corporativa, OK? Que é como se fosse a FIFA, ela é o órgão que estabelece as regras, OK? Dentro da de da minha organização, eu vou ter que ter representantes dessa lei que vão arbitrar ali o que acontece, que são juízes, OK? Então vou precisar ter pessoas filiadas, né, de uma maneira matricial ou hierárquica, a essa entidade de governança que vão estar ali garantindo que o jogo esteja acontecendo nas regras corretas, beleza? E eu vou ter os times, que são as áreas de negócio, jogando o jogo e fazendo com que o, mediante a performance, o resultado delas, o jogo ali tenha ali os resultados e no final das contas pode ter ali uma área ou um time que tem uma performance melhor do que o outro, OK?
Então, a gente precisa ter os três níveis ali de organização, a instituição, né, mais governamental, os representantes legais dessa estrutura e os jogadores. No final das contas, se você for ver, um jogador, ele fica melhor se ele treinar e se ele estudar as regras para poder ajudar. O juiz fica melhor se ele se capacitar e ele treinar. E a instituição, ela tem que estar se modernizando para que as regras estejam cada mês mais fluídas e consigam garantir que aquele esporte seja tem engajamento e seja útil ali dentro da sociedade. O que eu quero dizer com isso assim, que hoje não existe dentro das organizações, né, geralmente eh tem um uma galera que fica um pouco mais isolada fazendo ali o os eh balances core cards, aquelas coisas mais antigas.
Eh, tem algumas organizações que implantams, mas geralmente começam muito de uma estrutura mais botle up do que realmente top down. E as que começam top down ainda tem uma curva de aprendizado bem morosa para conseguir alcançar, mas que eu digo assim, são poucas a as organizações que têm isso de uma maneira estruturada, que depois é difundida para toda a hierarquia da companhia. Por isso que eu falo assim, é uma jornada que precisa de capacitação. Governança de dados ajuda no quê? Segmentar por domínio, OK? Que eu acho que é super importante. Consegue o quê? A cada domínio eu estabeleço quais são os kipi as métricas mais importantes dentro daquele domínio. E aí a gente consegue para cada Kipi e para cada métrica, eh, mapear quais são as regras de dados mesmos aplicadas para que aquele número não tenha uma distorção e para aquele número seja aquele número independente de quem fomente aquele número. OK? E a gente começa a trazer também a parte de responsabilização sobre aquele indicador, quem que é o, quem que é o steward, quem que são os custodians daquele dado para garantir que ele seja atualizado de uma maneira recorrente, tá bom? Então assim, falta ainda muita maturidade nas companhias para que isso seja estabelecido. Minha experiência, geralmente a galera faz um plano de 5 anos, dá certo, depois não revisitam isso. Às vezes algumas outras estruturas eh foram para um modelo mais ágil, e eu gosto do modelo ágil de squads e tudo mais, mas se perdeu um pouco das amarrações estratégicas para poder gerar valor através dos produtos. Eh, muitas empresas ainda não conseguiram fazer a mudança de projeto para produto e aí ficaram alguns gaps que os indicadores eles não consegue materializar a estratégia se tem estratégia, porque as coisas nesse mundo vu essas coisas toda aí, nem sei se já inventaram outro termo, mudam bastante e a estratégia que antes era pensada num longo prazo começou já não fazer mais sentido. Então assim, eu acho que são muitas variáveis e eu só entendo que as coisas vão estabilizar com um programa de aculturamento. As pessoas precisam falar dados, as pessoas precisam entender a dados e precisa ter decisão menos baseada em feeling, porque senão a gente tem esses absurdos aí.
É, e é que aí a gente tá a gente acabou entrando para um para um para um para um assunto que fala um pouco mais sobre metas e e questões que envolve até um pouco do que é qualitativo, o que que é quantitativo, porque se for pro qualitativo, aí fodeu, aí a interpretação é é muito mais ampla, né, e menos exata, etc. Mas ainda tem também ciência por trás para você conseguir, né, estabelecer. Ex. Mas é é mais subjetiva do que o próprio quantitativo, né? E e se a gente já tem criatividade no quantitativo, a gente abre uma margem ainda maior pro qualitativo.
Quero falar com você agora que ainda não conhece a Clever. Clever é uma empresa que já tem mais de 3 milhões de usuários em 30 países com 30 idiomas diferentes, que tem trazido soluções em blockchain, criptomoedas e ativos digitais. O objetivo da Clever é te dar liberdade financeira para operar nesse mercado de cripto. Então, se você acredita nisso, se você acredita nessa liberdade, você já pensa como a Clever, vai conhecer os caras, é clever. estão contratando também pessoal para trabalhar com cripto, com blockchain. Então, se você tem interesse, se você tem conhecimento nessa área, procura a Clever. Se você gosta de criptomoedas, se você opera no mercado, você precisa conhecer a Clever, precisa conhecer as soluções da Clever.
Então, o endereço tá aqui embaixo no vídeo. Para quem não tá no YouTube, é clever. Vai lá, vai conhecer que realmente é um mercado sensacional.
[Música] O que eu quero perguntar agora para você, a gente vai até entrar num pouquinho no campo de ciência de dados, que eu sei que não é onde você atua hoje, mas eu sei que você bate uma bola também nessa nessa área que você conhece bem, né? Mas tem pessoas muito mais habilitadas do que eu, mas não tenho tenho certeza que minha pergunta não vai ser nenhuma pós-graduação de ciência de dados. Tá bom. Como é que como é que o cara que tá na empresa ele consegue modelar o problema para ele conseguir de fato entender o contexto e ele não fazer, por exemplo, uma cagada dessa como o Thiago Negro fez? Porque a gente tá falando de você falou que sou advogado mesmo, né? Eh, eu talvez não segui todas as instruções, mas um abraço, Thiago Negro, vem gravar com a gente aqui uma vez que não não vem não.
Tchau. Eh, eh, como é que eu como é que eu faço para garantir que eu entendi o contexto, tô considerando todas as variáveis e modelar de fato um cenário onde eu não esteja enviezado sem saber, entendeu?
que é uma coisa eu enviezar propositalmente para provar um ponto, que é o que a gente já estressou bem nessa primeira parte. Perfeito. Mas eu posso sem querer estar considerando só uma face do cubo e não contextualizando o problema como um todo e chegar numa conclusão precipitada por falta de modelagem do contexto, eh, que talvez não reflita de fato a realidade da análise daquele dado. Você você pegou o que eu quis dizer? Peguei.
Eh, você já foi colocado num cenário de pressão várias vezes? Eu trabalho em TI, meu amigo, desde 18 anos. Trabalha. Mas aí pensa no cenário de pressão que você tá tentando achar um bug. Sim. Certo. Você tá tentando achar o problema ali. Hot fix em produção, sala de guerra.
Perfeito. Sala de guerra. E aí você acha um um vislumbre do que pode ser, mas você não tem a certeza, uma hipótese. O que que você faz? Eu testo. Então você testa, mas muitas vezes pelo cenário de pressão ou então até mesmo nesse seu teste, você vai ser enviezado a a validar aquela sua hipótese. Eu vou sempre pelo caminho feliz. Sempre vai pelo caminho feliz. O que que eu quero dizer com isso? Eh, muitas vezes a gente não tá capacitado culturalmente e até tecnicamente para e a gente não tem a a possibilidade de ter tempo, OK, para conseguir analisar todos os contextos. Então, o que acontece às vezes é que a gente vai usar até aquele efeito Danny Danny Krueger, é que é o que você em pouco tempo acha que você já é o expert do negócio, você acha que você sabe para [ __ ] e quando você aprende um pouco mais, você sabe que você não sabe [ __ ] nenhuma. É, é isso. Então, o que que acontece é como que a gente consegue analisar tudo, vai ter que passar por esse efeito aí. Então, vai ter o picolá que, ah, eu sei. E aí depois quando você amplia sua visão de de negócio, amplia o seu contexto de análise, você entende que você não sabe de nada. E aí você começa a ampliar o seu conhecimento naquele tema até você conseguir ser imparcial, você consegue ter uma fluência em dados naquele tema. Então, o ponto que eu queria trazer é assim, eh, você tem que melhorar em dois eixos, o generalista e o especialista. No generalista, você tem que ampliar o seu contexto de negócio.
Lembrando que ciência de dados, né, e aí trazendo pro contexto de que cientista de dados é todo que faz alguma ciência em cima de dados, você aumenta a sua necessidade de conhecer o contexto que você está. Então, o cientista de dados, seja ele o engenheiro, o agente de governança, o agente de qualidade, o de metadados, o próprio engenheiro de machine learning, quem faz ciência de dados aí com análises estatísticas mais avançadas, ele tem toda a parte técnica, mas ele precisa ampliar o seu contexto de negócio, senão ele vai ser o técnico lá dos anos 1900 e bolinha, que era o cara que não conseguia ter habilidade de comunicação. você precisa ter uma habilidade de conhecer o negócio, se comunicar, fazer perguntas certas para você ampliar o seu contexto. Então, reconhecer as possíveis variáveis estão envolvidas num determinado processo que já resultado. Perfeito. E aí é esse a amplitude de conhecimento que eu falo que você aumenta a parte de cima do T do seu conhecimento que você amplia o conhecimento generalista. E você precisa ter um conhecimento mais especialista em análise de dados, que é o quê? você começar a desenvolver o seu senso crítico para aplicar técnicas de análise que você consiga realmente ser mais profundo na análise diagnóstica descritiva, preditiva ou prescritiva que você tá fazendo, porque senão vai ser uma eh eh se eu só aumentar a minha especificidade ali da parte de de baixo do T, o que que vai acontecer? Eu vou ter muita técnica, mas pouca aplicabilidade. E se eu aumentar só a parte de cima, eu vou ter muito contexto, mas eu não vou ter a capacidade de tomar minha decisão.
Então, precisa ser um um um crescimento mais equilibrado em que eu amo o meu conhecimento de negócio ao mesmo tempo que eu trago um pouco mais de especificação técnica. E aí a gente entra num contexto de literácia, data literacy, alfabetização de dados, que é você desenvolver nas pessoas a capacidade de ser fluente em dados. Fala, sei lá, influente em português ou inglês. O que que seria isso? Você ter a capacidade de se comunicar, de você ter conversas, de você conseguir e eh se manifestar, vamos colocar assim, através daquela linguagem. E o dado ele acaba sendo uma linguagem. Então, a ideia é que todas as pessoas consigam ter essa fluência, mas novamente, não é um idioma melhor que o outro, é uma técnica, OK? Para que eu traga transparência, que eu traga confiança, que eu traga eh eh clareza naquilo que eu tô tendo ali como análise. E aí, quanto mais você for fluente em dados e quanto mais eu for fluente em dados, o que que vai acontecer? Nós teremos decisões éticas, decisões, como posso falar, qualificadas que vão gerar resultados de negócio mais sustentáveis, tá? Eu gosto de pensar lá que dados com qualidade vão gerar informações com qualidade, que vão gerar um conhecimento com qualidade e que vão gerar resultados de curto, médio e longo prazo. Então, a gente tem que pensar sempre nesse desenvolvimento, tá? Mas a aí, Rud, eh o que eu euô fazendo um paralelo aqui e e peço até desculpa se a pergunta for muito noob por não conhecer tanto a área de ciência de dados, mas mas imagina assim, ó, eu eu faço um paralelo muito com a área de arquitetura, que é onde eu de fato me atuo e tenho minha especialidade.
A gente quando desenvolve algo em solução, a gente tem n caminhos que podem ser seguidos e nenhum deles está incorreto, mas talvez algum deles ele é melhor indicado para determinadas situações. E o bom arquiteto, ele tem então a fluência de negócio e de tecnologia para poder adotar uma melhor abordagem de tecnologia pro contexto de negócio.
Eu, ouvindo a sua explicação, eu consegui fazer mentalmente um paralelo com um cara que um arquiteto muito bom, que ele é muito técnico e ele consegue projetar qualquer tipo de sistema, tem uma arquitetura de sistema muito boa, eh, olhando só tecnicamente, mas se ele não tiver um feedback de negócio do contexto onde ele tá envolvido, ele pode ter algo que tecnicamente talvez não esteja errada, mas não atende de fato o que o negócio precisa, né? E e você acha que essa equivalência do eh do cientista de dados ali para entender de fato o processo de negócio, ela tem que tá tão enraizada assim na na no papel de atuação dele?
Porque, cara, o, eu fico imaginando o cara que é arquiteto sem entender de fato como é o negócio, é como um cientista de dados que ele tá olhando lá campo, tabela, como é que ele sabe o que de fato aquilo define, mesmo que ele receba uma especificação, tá? A especificação pode ser muito subjetiva.
Concordo? Quando você trabalha com ciência de dados, você pode achar ali correlações. E às vezes as correlações, entrando até na pauta que iniciou aqui o podcast, as correlações elas não fazem sentido quando você traz a luz do contexto de negócio. Então, por exemplo, teve um estudo aí no passado que usou os dados e provou que o aumento da taxa de natalidade está correlacionada com o aumento de cegonhas numa determinada região. E aí quer dizer que os bebês os bebês vêm da cegonha? Verdade. Era verdade, Rud. Era verdade. Olha só.
Sabia? Os desenhos sempre tem ali um fundo de verdade. Tem alguma coisa, caraca? tem uma coisa científica sempre atrás do desenho. Eh, mas brincadeiras à parte, o que eu quero dizer é quando você não traz o contexto, uma análise de dados pode alucinar, que é o que a gente vê hoje aí nas IAs generativas, nas IAs ali que tentam reproduzir algumas especificidades aí do comportamento humano, né? ela acaba alucinando. Então o que eu quero dizer com isso é assim, a gente precisa trazer a luz do contexto de negócio, senão eu posso tecnicamente fazer algo viável, mas não aplicável, entendeu? Que é o que pode acontecer com qualquer disciplina técnica. E pra interpretação dos dados é a mesma coisa.
Eu posso fazer uma análise de dados linda, que vai ter eixo X, Y, vai ter um gráfico bonito para caramba, mas só que não vai trazer nenhuma explicabilidade e nenhuma decisão saudável pra minha empresa. Então, para quê? Entendeu?
Então, sim, tenho que conhecer o contexto de negócio, tenho que conhecer as vulnerabilidades dos meus sistemas, porque olha só, pasme, os sistemas têm problemas de qualidade e às vezes problemas de desenvolvimento. Meu Deus do céu, quase nunca acontece, né? Mas em outros países, só em outros países, né?
Na Islândia, pois é, aqui no Brasil não é? Então, o que que acontece? a gente precisa ter o conhecimento de negócio, precisa ter o conhecimento dos sistemas, ter o conhecimento das nuances de dados que estão dentro dos sistemas para que a minha análise seja cada vez mais eh protegida a esses problemas de interpretação. Novamente, não é da noite pro dia, como eu falei assim, quanto tempo você demora para aprender o contexto de negócio? Eh, eu por acaso tô começando numa nova jornada, tô começando numa empresa que eu tenho zero de conhecimento de negócio. Então, o que que eu tenho que fazer? Tenho que aumentar meu conhecimento de negócio, começar a conversar com pessoas que conhecem do processo, respeitar a cultura da empresa, respeitar a jornada e a história da empresa, começar a entender as dificuldades que existiram durante o processo e através da análise de dados, interpretação de dados, criar maneiras de eu conseguir ser imparcial e permitir, e aí através da minha disciplina, governança de dados, que as decisões elas sejam primeiro baseadas em números confiáveis.
números que batem quando uma área A fala com a área B e que tudo esteja de uma maneira organizada e transparente para que qualquer pessoa consiga ter acesso à aqueles dados, tá? E aí eu gosto de falar de democratização de dados, porque todo mundo pensa em democratização de dados como a ter acesso ao dado, certo?
Mas não é ter um acesso ao dado perfeito e ter a capacidade de gerar valor através do dado. E eu só gero valor se eu sou baseado em tomadas de decisões com qualidade, se eu sou alfabetizado em dados e eu consigo ter a técnica necessária para tomar decisões através dos dados, entendeu? E e essas técnicas que a gente tem para executar esse tipo de análise, ela envolve uma série de de requisitos técnicos que envolve a formação de um cientista de dados ou de um engenheiro de dados para que eu reduza esses vieses, né? Então, eh, a gente fala, por exemplo, tamanho de amostra, né? Não adianta você pegar uma amostra muito pequena e aí entra técnicas inclusive de estatística nessa parada. Sim. Mas às vezes você não precisa ser um um estatístico, né? Eh, para você ou um cientista matemático, sei lá, para você conseguir fazer uma uma análise, tá? Sim. Mas você tem que ter conhecimento de que é uma curva padrão, eh, o desvio padrão, etc. É, é que a gente, vamos lá, quando a gente vai para essa desvio padrão, eh, vai para essas análises mais avançadas, concorda que eu saí do do descritivo, tô indo pro diagnóstico, às vezes até para um preditivo, para um prescritivo. Eh, eu, sendo bem sincero assim, aí não é nenhuma literatura que eu tenha como base. Eu tô falando da minha experiência, minha vivência, tá, pessoal? Eh, as soluções analíticas de dia a dia que você vai ter que fazer uma análise, a maior parte tá concentrada no descritivo. Você precisa entender o que aconteceu. Você precisa entender o que aconteceu, não o o como aconteceu. Você não precisa entrar no diagnóstico, entendeu? Você vai precisar fazer uma análise mais básica. Hoje, eh, eu vejo que a maturidade das empresas, ela tá tão baixa que nem isso a gente tá conseguindo fazer, tá? Então, eh, lógico que ter um profissional que tem essas capacidades em cada área de negócio, no modelo mais hub, pô, sensacional. Mas vamos fazer o feijão com arroz, conseguir que as pessoas tenham influência para fazer o BI tradicional.
E aí quando eu falo BI tradicional, eu tô falando da análise descritiva, não necessariamente dos componentes de BI.
eh, antigos, tá bom? Mas fazer o o beabá, entender que quantas quanto o quantitativo pelo qualitativo para você conseguir fazer uma análise para você entender onde tá o problema, entendeu?
Agora, a gente tem até agora as LLMs que podem até facilitar. Existem ali algumas soluções que você às vezes faz perguntas em linguagem natural ou até mesmo você fala e o próprio motor ali de inteligência já gera quer e os gráficos para você. Ótimo. Mas você tem que cada vez mais ter a capacidade de fazer as perguntas certas e gerar o senso crítico e as habilidades técnicas vão estar cada vez mais encapsuladas, entendeu? Lógico que para uma coisa avançada ainda tem uma um avanço. É, eu eu concordo contigo que, por exemplo, para para fazer uma interpretação de de uma uma um dado que me traga valor qualitativo, por exemplo, eh faz muito mais sentido eu entender o fluxo e a razão daquele dado do que o que eu imagino. Por isso que eu pedi até uma licença poética aqui. Eh, quando eu tô analisando, por exemplo, um uma tabela colunar gigantesca de quantidade de vendas, etc., que aí eu tenho que ter uma um um volume de dados muito grande relacionado até oo que a gente falava antigamente no big data, etc., que aí eu tenho que ter curva de curva desvio padrão, etc., para calcular a efetividade e a precisão daquele dado, porque aí eu tô falando de grandes volumes, né? Mas quando eu eu tô num numa esfera um pouco mais qualitativa de insightes, né, que você chamou de descritivo, etc., Eh, eu acho que entender o contexto de negócio faz muito mais sentido. E você falando disso, eu lembrei para fazer um contraponto ao o post do Negros. Você gosta de de citar? Eu eu adoro esse cara, adoro, adoro. Eh, que que a E aí é o ponto que eu queria fazer o contra, porque são duas coisas que elas têm valores diferentes e roupagens completamente diferentes. O poste do Nigros, ele tem uma roupagem que parece científica, ela parece matematicamente correta, ela parece assertiva do ponto de vista de ser específica, de ser e não de ser certa, mas de ser coerente, sabe? porque ele de fato plotou três eixos ali e que segundo a interpretação que ele fez, matematicamente dentro daquele contexto tá correto, só que o contexto vai além daquilo, né?
Sim. Então tem uma interpretação que não pode se resumir aquela informação que tá ali. Eu vou fazer um outro contraponto de uma outra notícia que eu vi ontem ouvind no podcast, eh, e que parece totalmente sem sentido, mas é extremamente valiosa. É o contrário disso. E vou deixar até aqui os créditos que é do podcast Peti Jornal. Eu gosto muito de estudar política internacional, etc., Porque se a gente ficar só nas nas exatas, eu vou morrer louco, né? Não que agora a política internacional esteja sempre um assunto muito fácil, né? Então acho que eu vou morrer louco de qualquer jeito.
Mas enfim, eu tava vendo o o podcast do Peti Jornal e eles comentaram que a gente tá tendo agora o conflito do Israel com Irã. Sim, né?
e começaram a ver algumas análises das inteligências dos países para saber de fato se o Estados Unidos sabia de que o Israel estava planejando esse ataque ao Irã ou não.
E cara, saiu na Aljazira um estudo científico que é feito já há algum tempo, acho que desde 1970, chama de pizza index.
Eles falam: "Cara, esse negócio não faz o menor sentido científico." Mas olha que [ __ ] isso.
Eles mapeiam há algum tempo na região do Pentágono a quantidade de pedidos de pizza que são feitos durante todo o tempo. Então, perto do Pentágono ali, eu vou mapear a quantidade de pedidos de pizza que são e os caras monitoram isso, cara. deve ter inteligência do mundo, monitorando a região do Pentágono, enfim, né? Então, existe o pizza Index, que mapeia a quantidade de pizza vendida na região do Pentágono o tempo todo.
E chegaram à conclusão que teve um pico de mais de 10 vezes de quantidade de pizza pedida na região do Pentágono no dia do ataque, do primeiro ataque de Israel para Irã. E eles plotaram gráfico. Em todos os grandes eventos militares que os Estados Unidos estava envolvido de alguma forma, esse índice, tipo, subia 8, 10, 12 vezes na região do Pentágono, né? E aí você fala: "Porra, mas que que tem a ver a pizza? Porque mais pessoas estão trabalhando lá, mais pedidos são feitos. Mais pedidos são feitos. Mas aí, por exemplo, e aí você consegue ter uma você consegue ter uma correlação direta e simples, né? por mais que seja uma coisa eh trivial, né?
Vamos só e que aparentemente não deveria ter uma correlação direta. Aí, por exemplo, e antes desse primeiro ataque teve ali o o pico, certo? Isso aí vamos entender aqui o cenário político mundial. O Estados Unidos tá envolvido somente nessa guerra atualmente? Só não tá lá envolvido com Putin e lá não, mas aí teve recentemente lá o o a questão lá com com a Ucrânia, isso. Certo. Será que também não no esse pico não pode ter sido causado por outra guerra ou outro conflito político que os Estados Unidos estão intermediando? Tô dando, tentando fazer uma uma análise para poder abstrair o viés, tá?
É, será que esse pico aconteceu só num dia anterior ou ele já vinha acontecendo em semanas subsequentes? Não, e o gráfico que eles plotam e sem esses esse ele esse gráfico ele sempre ele [ __ ] digamos assim, ele exponencializa em eventos que o Estados Unidos está ligado eh militarmente e não diplomaticamente, como por exemplo no caso da Ucrânia.
Entendi. Então, teoricamente, o Estados Unidos, pelo comportamento do cidadão estadunidense, esse gráfico pode ser que fique, pode ser, pode ser que faça um pouco de sentido, mais do que a análise que foi comentada aqui, tá bom? Eh, mas obviamente é uma coisa muito crua. A gente tem que pegar ali os dados, a origem dos dados, verificar se ali não houve nenhuma manipulação, eh verificar realmente se as fontes são confiáveis para em cima disso fazer ali um um uma dálise. Vou dar um outro exemplo. Será que não existiu ali uma campanha da Pizza Hut e da Dominus ou de alguma outra rede de pizzaria para fazer com que naquela região tivesse uma campanha de consumo maior? Então assim, existem n variáveis. E ó, aqui, ó, eu falei de três, quatro possibilidades e nem eh esgotei meu senso crítico aqui, meu pensamento crítico. A ideia é essa.
Por exemplo, pega essa informação e vai eh criticando essa informação e vendo o quanto que ela se prova consistente. E aí a gente até tava aqui nos bastidores conversando do caso daquela menina que foi dita ali como uma astronauta. E aí teve um monte de gente que começou a seguir a menina, teve empresas e instituições que começaram a patrocinar essa essa menina, certo? E aí o que acontece assim, era uma informação que se você fizesse ali um senso crítico, você veria que que é uma informação eh eh passivo de questionamento, tá? Não tô entrando no mérito eh da pessoa ser competente ou não, de poder estar ali ou não. A questão é uma pessoa para chegar no grau de autoridade que ela chegou, ela demora anos e anos e anos de capacitação. Um astronauta precisa ter condições físicas, eh, mentais, que não são treinadas eh num curto espaço de tempo, são amplamente treinadas, certo?
E olha só, a gente simplesmente, por uma fala de uma uma pessoa, simplesmente acreditou, não fez nenhum senso crítico e houve um delírio coletivo de, pô, olha só, ela é astronauta brasileira, entendeu? Então, olha só até que ponto chegamos. Eh, pessoas, não que tenha que ser muito inteligente para ser astronauta, viu, galera? Marcos Pontes tá aí para provar o contrário.
Eu eu prometo que esse esse podcast não tem viés político, tá bom? Um abraço pro meu advogado, tá? Eh, eh, mas o, o ponto é assim, eh, eh, as pessoas elas estão num numa questão que toda informação que alguém publica, ela elas acreditam, porque se, por exemplo, se for algo que é visualmente é agradável para mim ou que está alinhado com o meu discurso filosófico, vamos colocar assim, eu já acredito de antemão. Mas aí é um problema maior, né, Rud? Porque quando a gente fala de data analytics, estando o meu viés de análise errado ou não, eu tenho um lastro mais ou menos. É que é que a estatística é aquilo que você falou aqui durante o podcast, os dados eles podem provar qualquer coisa. Sim, mas eu tenho um lastro. Ele pode estar errado. Tem um lastro. Quando a gente fala do Ela tem um lastro também, um storytelling mal contado, que é a mesma coisa com dado, mas que não se comprova. Mas então com dado também não. Se você traz um senso crítico, você também desmistifica o viés de dados. Mas eu posso se eu eu posso e eu entendi o que você quis dizer, mas eh eu eu chego a uma conclusão errada com dados. Vou vou dar um outro exemplo aí, ó. Pouso Alegre. Pouso Alegre ficou aí em evidência por causa de uma coisa que aconteceu na política de Pouso Alegre.
Você ficou sabendo? Hum. Não. Que que aconteceu? Vamos lá. Os caras estavam lá votando em projetos de lei. Uhum. E aí aconteceu um evento lá que o cara que é o manda-chuva lá da política, ele teve que se ausentar para poder atender ali um chamado da polícia, certo? que ele pegou lá um celular de um carinha que tava filmando ele e aí ele foi resolver os problemas e aí tava lá no nos projetos lá voltando, voltando, voltando, que que o o rapaz lá que tava fazendo as propostas percebeu que toda vez que ele e o o outro candidato que defendia a mesma linha de defesa dele, votava um sim, todo mundo fazia o quê?
votava não.
E toda vez que ele votava não, todo mundo votava. Sim. Sim. E aí quando ele foi apresentar a proposta dele que ele queria que fosse aprovado, o que que ele fez? Ele fez o contrário do que ele queria. Votou? Não. E todo mundo votou.
Sim. E ele aprovou o que ele queria.
Exatamente. E ele diminuiu lá de 30 para sete cargos públicos, alguma coisa assim lá de Polegre. É. É. É. A Gebra Buliana aprovar e testada na prática. Isso. E aí o que eu tô querendo dizer é o seguinte, até mesmo nessas eh nessas nesses organismos institucionais, vamos colocar assim, que deveriam ter uma análise do que tá sendo votado, certo? Cara, assim, o o senso de de valor é o que o outro falou, eu vou contra, entendeu? Então isso acontece nas organizações. Se eu sou de uma área e você é de outra e eu defendo algo, você vai contra, você já vai partir que o meu número tá errado e vai ir contra. Então assim, o o o ser humano é um é um bicho político. Sim. E e infelizmente e e assim não é errado ser não é errado ser político. O o errado é você exercer uma política que ela não faz bem ao todo. Porque política vem de polis. Polis é o bem para todos.
Polis vende muito. Então, quando você vai paraa política, esse deveria ser o conceito, só que é a política aplicada pro indivíduo, que é que contradiz o próprio nome, né? Isso. O, no final das contas, o inverso de política é idiota.
E o inverso de idiota é política, porque o idiota só pensa em si. Por isso que o centro etimológico de é você pensar só em si, enquanto política não. Você quer fazer o bem para o todo, entendeu? Então o que acontece que a nossa em algum momento da humanidade se sente palavra se perdeu completamente pervertei e tem outras entre outras n palavras aí que se distorceram que eu quero dizer é o seguinte, quando eu tenho senso crítico, não importa se a ideia vem do meu amigo ou do meu inimigo. Se eu tenho um bom princípio, um bom fundamento, um bom contexto, o que que eu faço? Eu analiso sobre essa ótica, entendeu? Porque enquanto ficar um cabo de guerra, o que que vai acontecer? Nada. Porque a força que eu exerço para puxar aqui, você puxa para cá e o negócio não anda. Se eu utilizo a força do meu inimigo a favor daquilo que eu defendo, quando ele puxar e fizer sentido, eu vou lá e puxo naquela mesma direção. Mas quando não fizer sentido, eu faço força ao contrário, não tem problema. Mas, meu amigo, voltando pro centro do episódio, os dados eles deveriam ser neutros, eles são, e trazer informação de forma agnóstica.
E E por que que isso acontece, cara?
Porque existe um fator chamado bichinho ser humano. Exatamente. Por isso que assim a as organizações elas têm que gerar cada vez mais capacidade de literácia para os indivíduos da organização. Você você tocou alguns pontos nesse nesse termo de data litera.
Explica, faz um parênteses, explica melhor pra galera o que que é data litteres, por favor. Tá bom. É, eu vou tentar trazer, depois você volta pro outro ponto que, tá? Eu vou tentar trazer uma abstração maior, tá? Pensa em cultura, OK? Cultura, já falei aqui algumas vezes nos em outros episódios, tá? A ver com a sua capacidade de eh gerar comportamentos, habilidades, crenças dentro ali de uma organização.
No final das contas, é aquilo que você cultiva fazendo uma analogia ali com plantação, tá bom? Então, se e eu trago para um viés de cultura de dados, são todas as habilidades, comportamentos, crenças, pilares, propósitos que eu vou desenvolvendo na organização para que no falto tenha uma cultura de dados madura na minha companhia, tá? A alfabetização de dados, ela vai entrar como um uma vertente desse plano de cultura para que você gere capacidade nas pessoas para elas eh conseguirem se comunicar através dos dados, para que elas consigam exercer análise e e e fazer diagnósticos ali e eh em cima dos dados. Isso é o o data literacy. E aí eu vejo que existem cinco vertentes que a gente pode falar, que eu gosto de chamar de os cinco CS.
Primeiro, comitês. Você precisa ter comitê para você educar o executivo. O executivo não sabe falar em dados se você não materializar isso em resultado ou risco. OK? No final das contas, o executivo é ou ego ou dinheiro. É, é o, enfim, infelizmente é assim. O ser humano se move assim. OK? Então tem, você tem que estabelecer comitês e falar: "Os dados indicam que você tá bem, os dados indicam que você tá mal, os dados indicam que a área tal está melhor que a área tal". É isso. Esse é o o reflexo do comitê, tá? Não brigue com os dados, brigue com o que o o o que produz o resultado. Na verdade, não precisa brigar, você só comunica, você só evidencia o o que existe, tá? A gente não tá aqui numa numa competição, embora as pessoas às vezes eh eh queiram ser uma melhores que as outras, mas é no final das contas. Não, mas a minha crítica é no sentido que muitos executivos eles brigam com o que o dado mostra e não com a causa que gera o dado, entendeu? Exatamente isso é verdade. Então, primeiro comitê, segundo comunidade. Você precisa ter um desenvolv no comitê, você tá fazendo top down, comunidade é bottom up. Você vai gerar capacidade nas pessoas de conseguirem resolver seus problemas de dia a dia, certo? E a gente pode fazer eventos, datatowns, a gente pode fazer eh algumas eh eventos corporativos para poder estimular isso. Eu posso ter uma comunidade de datavis, eu posso ter uma comunidade de engenharia de dados, eu posso ter uma comunidade de ciência de dados. para promover aí o data science, cidadão de ciência de dados espalhado nas áreas de negócio. Posso fazer isso.
Então, o segundo pilar ali, comunidade.
Terceiro pilar, capacitação. Trilha de capacitação. lá um um na sua universidade corporativa, uma trilha que ensina o cara a fazer SQL, ensina ele a pegar lá o Power BI, ou seja qual ferramenta de datavis e a fazer uma análise lá dentro, entender, explicar como se faz ali uma análise às vezes diagnóstica, aí as curvas, explicar o que que é uma normal, né?
mostrar ali o que que é uma parábola para as pessoas conseguirem entender e compreender essas análises, ver o que que é outlier, enfim, capacitação. O outro C que eu gosto de falar é o C de comunicado. Cara, se ninguém te ouve e se você não tem uma recorrência ali, uma cadência de comunicação, a galera não vai engajar no seu propósito, OK? Então, precisa ter comunicado separando um público, eh, com uma cadência, né, periodicidade, com um conteúdo bacana.
que vai ali promovendo ou prevenindo algum cenário que você deseja na na que você deseja ou não deseja na sua companhia, tá? E o último, consultoria, que às vezes você vai ser tão leigo, mas tão leigo, mas tão leigo, que eu preciso te dar a mão, ensinar você a sair do seu problema para que em cima da sua experiência você começa a gerar capacitação, tá bom? Então eu vejo o a o data literacy nesses cinco caminhos para você ir mudando os comportamentos e gerando uma cultura corporativa saudável. Então quando você fala de data literacy, é muito mais sobre uma liturgia de dados, sobre isso como é aplicado dentro da companhia do que sobre literalidade de dados. Isso não é é gerar capacidade técnica de gerar valor através dos dados. E aí, eh, isso é isso que eu queria deixar claro pras pessoas, porque o termo ele pode ser, como é o nome quando um termo datalit ambío ele não é ambíguo, é um é o falso cognato. Falso cognato. Beleza. Olha só.
Tô ó, tá tá afiado, ó. Então, a gente não tá falando sobre o dato literal, mas sobre uma, acho que uma boa analogia é sobre a liturgia de como criar uma cultura de dados dentro da empresa, né?
Pode voltar pro seu ressent. Ah, ótimo.
Então vamos de novo. Aqui a gente falava, ó, o ponto que eu quero trazer, que a gente tava comentando, é, e eu tô com tô com uma pergunta aqui que eu vou deixar pro final. Eu tô segurando para te fazer, tá bom? Mas você acha que, por exemplo, o mesmo tipo de dado, o mesmo contexto, dependendo da experiência e e da vivência de negócio do do cientista de dados ou do analista que tá trabalhando, pode gerar resultados diferentes. Pode. E aí eu vou até tirar o cientista de dados da da da parada, certo? para fazer um corte aqui. E isso pode ser considerado um viés de dados.
Sim. Ó, vou vou explicar uma história que aconteceu comigo durante muito tempo. Eh, eu dei suporte a uma ferramenta de BI. Então, o que que eu fazia? Eu ajudava as áreas de negócio a montar as suas análises no BI corporativo que existia. Perfeito, né? E aí constantemente eu recebia, Rud, os dados do BI estão errados. Eu falei, estão errados. Mas por quê?
Porque o número que o BI está mostrando está diferente do que eu tenho. Opa.
Olha lá. Aí eu chegava e falava assim: "Eh, você cuida de alguma carteira específica regional?" Cuido. Eu falei: "Você fez o filtro nessa carteira?" "Não, não fiz". Aí eu falei assim: "Vamos fazer". Aí ele ia lá e fazer o ainda tá diferente. Aí eu cheguei a falar assim: "Ah, você quer só ver um segmento ou você quer ver outro segmento?" Não, não, eu quero só saber esse segmento. Você fez o filtro? Não, não, não fiz. Aí o ia fazer, poxa, ainda não tá batendo. Ah, mas você quer ver pelo calendário de faturamento, calendário caixa, ou você quer olhar pro calendário de competência? Quero olhar pro calendário de caixa. Ah, então vamos trocar aqui a dimensão que você puxou pra sua análise. Ah, o número bateu. Ah, então bateu. Aí eu falava assim, tá vendo? Então, o problema não é o o dado, é como você manipulou o dado. E eu tentava gerar com isso conhecimento dele, do que existia disponível para que ele pudesse fazer análise. Mas aí, eh, fazendo complemento e já fazendo uma outra pergunta que eu acho que que vai encaixar bem com o que a gente tem falado sobre tudo no PPT no CPIL. Aí não é um erro do analista, é um erro do da manipulação do dado do ponto de vista do usuário, certo? Sem, eu ainda acho que é um erro da análise do indivíduo, porque ele não se preocupou em entender o sistema que ele tá mexendo, que no caso Sim. Não, mas eu digo sobre o cientista que fez aquele dash, o cara que entendeu o contexto. Nesse caso ele tava no exploratório, certo? Mas vamos supor que ele tivesse num dashboard. Ele não leu o geralmente isso só acontece lá na na nos países nórdicos, né? não ler a o help do dashboard, não ler os metadados do que significa cada coisa. Eh, e geralmente isso é um dos maiores motivadores de de erros. Sim. E e aí eu quero fazer esse gancho para te dar oportunidade de explicar paraas pessoas de fato que é um produto de dados. Porque quando a gente fala sobre produto de dados e desenvolvimento software, existe uma uma falta de conhecimento aqui, uma falta de proximidade, inclusive das pessoas entenderem que regra de negócio é questão de desenvolvimento software e que dados é lidar com tabela, etc. Uhum.
E esse exemplo que você deu, ele esclarece muito bem de que eu preciso entender do contexto de negócio para gerar um produto que me geret, me gere as regras de negócio aplicadas para que aquele dado de fato tenha coerência, né?
E que isso é tão importante quanto a regra de negócio no momento do desenvolvimento de software. E elas têm que ser complementares e coerentes, né?
eu aplicar uma regra no BI, se o meu produtor do dado, que é um sistema transacional desenvolvido, tiver com uma regra de negócio diferente. Vamos trazer aqui alguns conceitos que eu acho que é importante a gente falar, certo? Eh, existe muito produto de prateleira e RP de prateleira e tem muitos conhecidos, certo? Certo. Tipo, SAP patrocina nós, né? Sap, um abraço. É isso. Tem tem outro também que aí que pode patrocinar nós também. Seus forces também. A Totos, Totos, um abraço. Totos, enfim, existe um monte de software, né, ERP, que ele já tem um standard ali definido e muitas vezes não é o standard que é tão configurável a ponto de refletir as regras de negócio. Você geralmente cria um mundo de customizações dentro da plataforma, certo? O que eu quero dizer com isso? Existe muita empresa que empurra o seu modelo de negócio para dentro de um standndard e o negócio não funciona. Onde você vai criar muitas vezes as regras? No ambiente analítico que você tem um pouco mais de flexibilidade, tá? Então acho que esse é um ponto importante e que é um problema do [ __ ] né? Que é um problema bastante grande. Por isso que gosto do seu filtro. É um problema do carário. É um problema bastante grande. É. Eh, tô tentando ser político. Tá bem polêmico aqui o episódio. É que você pastor, né?
Tô tentando manter não, eu falo, já falei bastante aqui, mas eh eu tento manter um pouco de coerência que hoje tá bem ofensivo em alguns pontos. É, é brincadeira, não tá nada. Eh, enfim, tá bom episódio, tá bom, tá bom, vamos lá.
Bom, eh, então, o que que acontece quando a gente eh faz isso? a gente acaba distanciando a minha capacidade de fazer análise, porque o meu sistema não reflete o meu modelo operacional, não reflete o meu modelo de negócio. Por isso que tem muitas organizações que compram código fonte ou que trocam desses grandes RPS para outros grandes RPS ou têm desenvolvido o seu próprio RP, porque no final das contas os dados eles têm que refletir o modelo de negócio, tá bom? Então esse aqui é um primeiro ponto. Quando a gente traz para ambiente saudável, cara, e fazer isso é é a catástrofe da arquitetura, velho. É, se o seu sistema transacional não reflete a sua camada, a a sua regra de negócio e você tem que transformar no analítico, meu amigo. E aí vamos trazer aqui à luz algumas alguns outros problemas de engenharia de software. Às vezes a velocidade que o modelo de negócio evolui é diferente da capacidade da empresa de evoluir o sistema. E aí, geralmente o que você faz? Cria algumas gambiarras sistêmicas ou tipo, o sistema gera uma planilhinha que o cara faz uma coisa fora do sistema para depois ter um input manual que permite um monte de divergência, divergência. Isso é muito preocupante. Certo? Então, vamos pegar a luz num cenário saudável, onde a minha regra de negócio ela é aplicada de maneira bonitinha lá no sistema. Eu consigo refletir isso no ambiente analítico muito facilmente. Mas o que geralmente acontece não é isso. Quando você vai pro ambiente analítico, você precisa criar um monte de regra de negócio que não tá no transacional. E aí a gente já falou aqui, inclusive talvez seja um outro episódio pra gente falar só sobre isso, data centric. Por quê?
Porque como a minha aplicação é efêmera, quando eu saio lá de um RP e vou pro outro, o que que acontece com o meu modelo de dados? Muda. Muda. E eu faço o quê? Reconstruo de novo um modelo de dados. E aí, usando aí as terminologias, já que a gente falou ali de de SAP, geralmente você vai pro novo ambiente no esquema Greenfield, que é o standard.
Uhum. O que que acontece com o seu histórico customizado? Fou, sei lá, virou papel higiênico. Fica lá na outra arquitetura e que e que não é compatível, né? Perfeito. E aí quando você quiser fazer uma análise histórica, que que você faz? Você compara maçã com banana. É, você sente, chora. Porque não não dá para comparar, não dá. E você não consegue fazer os depares, você não consegue coexistir semanticamente com as informações que estão lá. Por isso que assim, vamos falar, se eu fosse dar uma sugestão de arquitetura centrada em dados, com as suas entidades bem definidas de dados, eh, e aí você pode flexibilizar o seu o seu a sua aplicação da aplicação A paraa aplicação B, mas o seu modelo de dados ele continua íntegro e respeitando seu sua entidade de negócio. A gente tem que fazer um episódio sobre isso, porque eu acho que isso tem que ser um princípio arquitetural. Você tem que partir pelo dado e construir em cima do dado. Existe uma uma [ __ ] de desafios em cima disso. Legado e third party software, com, por exemplo, o cara que vem com o modelo pronto. Mas aí, por exemplo, pr esses grandes players, você consegue é fazer consumo vioda, então você pode continuar bebendo inclusive às vezes do das inteligências embutidas na ferramenta, mas você só precisa criar ali um modelo de dados que seja saudável, entendeu? ou o o eh optar pelos grandes mercados que, por exemplo, têm transparência de dados e que tem interoperabilidade de dados, como, por exemplo, um mercado de saúde que você que você trabalha, o o próprio mercado financeiro Open Fess, poxa, Open Fance foi um acelerador, tem lá o contábil, esqueci qual que é um o nome, SRO também é a parte a parte ali de de eh insurance, né, tudo mais também tem ali uma parte bem forte. Poxa, tem o EHR em saúde, tem o HL7 Fire em saúde. Então, por exemplo, já existem alguns modelos caminho, né? Porque que representam muitas vezes 80% da realidade. Isso é catacentric. Isso porque você tá centralizando o dado e criando o entorno em cima dele, né? E aí vamos pegar, por exemplo, eh, grandes RPs aí de mercado.
Geralmente é um módulo financeiro, cara, contabilidade, quantas a pagar, já tem um bybook bem solidificado no mercado.
Mas aí, meu amigo, a gente tem interesses comerciais envolvidos muito mais que, né? Você poderia ter um open RP, como você tem um fire, um open finan.
Mas aí você sair de um player como um SAP para um totus seria muito fácil. E não é interesse, né, em cima disso, não é? No no final das contas, assim, o que a gente vê que eh novamente assim, eu não posso julgar ali a motivação, mas estamos no mundo capitalista, certo? Eh, a motivação às vezes é gerar realmente dificuldade para você fazer o lockin, entendeu? É, e isso não é questão de ser capitalista ou não, é a questão da visão de negócio, né? Porque, por exemplo, o mundo financeiro aprendeu a lidar com Open Finance e ser tão competitivo quanto de outra forma. Mas o Openfine, se você for ver, a maioria das empresas colocam mais uma camada, entendeu?
Quando eu falo mais uma camada, é tipo mais uma complexidade em cima, não? Você não consome de uma maneira nativa o seu modelo. Sim, mas eu posso pegar minha conta corrente, meus investimentos de um banco e fazer portabilidade para outro hoje facilmente. É, não digo se é facilmente para você, mas eu não sei se ali dentro do do ambiente ali é fácil. Vou vou vou dar um exemplo, né? Eh, eh, agora que eu que eu mudei de Áries, vamos colocar assim, e algumas pessoas já sabem que eu tô trabalhando numa nova empresa Áries é água, é novas águas, né? Eh, pessoas já tão entrando em contato comigo aqui, por exemplo, para poder reportar um problema de, poxa, eu fiz o pagamento, mas só que tão falando que eu não não fiz. Uhum. O que eu quero dizer com isso? assim, eh eh tem um um problema que teoricamente deveria ser uma comunicação nativa entre uma instituição financeira e uma organização eh eh que recebe essas informações do banco e não não existe, entendeu? Que é uma coisa teoricamente, mas é um problema que ele deveria ser independente do mercado, da da da atuação da empresa. Deveria, não? Sim, deveria. E quantas vezes você às vezes recebe uma cobrança que você não deveria, cara? Ó, vou vou dar um exemplo, ó. Eh, comecei a pagar minha conta de luz no Pix. Beleza? Poxa, tá lá fácil. Para mim, o trabalho de copiar o o escanear o Pix lá, o Qcode ou copiar o código de barra vai da minha da minha vontade, certo? Mas as duas vezes que eu paguei a conta via Pix, o que que aconteceu? Hum. A empresa falou que eu não tinha e feito pagamento.
Aí que que eu fiz? Vou vou colocar isso aqui no boleto mesmo. Vou pagar no boleto. Por quê? Porque no boleto não tinha problema. Mas aí é um problema de operação.
Mas aí o problema, concordo. De cada empresa. Não é de cada empresa, mas às vezes pode ser um uma falha no banco.
Sim. Cada empresa envolvida no processo.
Pode ser do banco, pode ser de quem recebeu, enfim. O consumidor não tem nada a ver com isso, né? Pero, não tem.
E às vezes ele é penalizado por isso, mas aí quando eu vou para uma arquitetura mais e eh centrada em dados, esses problemas de integração, eles vão sendo mitigados, eles tendem a ser menos e eh eu não diria que eles são mitigados, mas eles ele você tem menos fricção, você tem menos ETR, tem menos processo no meio do caminho. Perfeito. E você tem um processo mais transparente.
É porque aí eu vou conseguir saber se o problema de uma maneira bem facilitada é no banco ou é na empresa XPTO. Concordo contigo. Entendeu? Por quê? Porque é tanta integração, é tanto gargalo, você tem menos chance de problema no meio do caminho. É, às vezes lá a integração do banco de dados roda só uma vez por semana. Isso aí tem lá um roda processo noturno do banco, vem para cá. É, eu concordo contigo. E aí quando você é data centric, você tem todo mundo olhando pro mesmo contrato, todo mundo olhando pro mesmo modelo. É tudo muito.
E aí eu potencializo o conceito de virtualização e federação, OK? Consigo trabalhar com protocolos de dados de uma maneira mais saudável e consigo fazer uma coisa que hoje é extremamente difícil nas organizações. Consigo evoluir a minha aplicação ou consigo coexistir com aplicações diferentes, mas gravando no mesmo banco. E você pode evoluir a sua aplicação, trocar ela, eh, sem alterar o seu modelo de dados, que é muito mais simples. Sim. E aí você consegue até ter uma, como se fala, um tempo de dos dois funcionando.
Exatamente. Convivência. Os dois estão funcionando ao mesmo tempo. E aqui eu começo 90 10 80, entendeu? Como se fosse um deploy green blue, porque você tem, claro, tem todo um processo de concorrência de tabelas, etc. Tem que ser gerenciado, mas é muito mais facilitado. Sim. E você consegue trabalhar com versões de esquimas e consegue evoluir isso de uma maneira muito fácil.
Você que tá aí escutando esse episódio bacana e quer levar toda essa tecnologia, essas novidades pra sua empresa e não sabe como, chama o time da VemBS. A gente pode ajudar vocês com desenvolvimento de software, com arquitetura de soluções, a entender os problemas que vocês estão vivendo e sair do outro lado com uma solução bem bacana. E se você tá escutando o podcast para aprender coisas novas, faz o seguinte, manda um e-mail pra gente no peoplecare@vems.ioio e você pode fazer parte também do nosso grupo de talentos. Valeu.
Agora o time do Relações Públicas vai gostar mais de mim.
Meu amigo, agora eu quero te fazer uma última pergunta pra gente fazer um flashback até aqui da da revelar a nossa idade. Eh, eu sou novo. É novo, cara.
Minha cara, é só só de dados, né?
Eh, lá no começo, quando a gente começou a dar importância para dados em tecnologia, quando a gente começava a falar muito de big data, tinha um contexto de data mining, lembra disso?
Não, não lembro.
não era nascido, não era formado.
Eh, e isso eu lembro que a gente tinha muito laboratório de data mining, que era cara tentando fazer inferência e cruzando informações, etc. Eu queria que você fizesse um paralelo sobre isso, porque muita coisa boa saiu desse data mine, né, que a gente eh hoje hoje isso a gente usa muito a própria inteligência generativa para poder encontrar correlações que de alguma forma eh de forma coerente na no nosso conhecimento de negócio, etc. a gente pode ter correlações que a gente pode escapar do nosso conhecimento, certo? E no data a gente fazia isso meio que manualmente, cruzando, experimentando esses dados para tentar encontrar correlações que não eram esperadas.
E a gente falou muito aqui de correlações que podem ser manipuladas e que não são válidas, né?
como que eu eu posso, na sua opinião, manter esse aspecto exploratório de de cruzar informações eh sem correr em um viés por falta de de negó de de conhecimento de negócio ou por uma por um erro de causa e e um viés de casualidade, etc.
eh, sem entrar, claro, no escopo de inteligência artificial, mas mantendo isso dentro da ciência de dados, que é encontrar correlações que talvez a gente intuitivamente, mesmo tendo pleno conhecimento do negócio, talvez a gente não consiga ter.
quando a gente falava muito sobre machine learning, né, que a gente conseguia ter um uma vasta eh falando tecnicamente, a gente conseguia processar matrizes de dados de uma forma muito ampla, né, para para e conseguir correspondência, estatística, etc. A gente conseguir jogar lá e conseguir ter indícios dos traços, dos dados, etc.
antes do datamine, qual é a generativa?
Um pouco mais fácil, né? Mas como que eu valido essas hipóteses de correspondência de dados e eu consiga entender, diferente do que a gente, voltando no começo do episódio, invalidou a hipótese no meu amigo Thiago Negro e com a correção muito bem feita do Caio Gomes, eh, entender que nem toda correlação que é matematicamente correta, ela é no mundo real de fato uma infer que faz sentido, tá? Eh, compliquei um pouco a pergunta. Não, eu eu vou eh vou tentar explicar de uma maneira lúdica, tá? E eu vou tentar explicar de Por isso que é bom gravar com gravar com o pastor, não. Você é um cara didaticamente muito bom. Olha só.
Mas aí não tem a ver com um unção, vamos falar assim, tem a ver só com o que eu gosto de explicar. Eh, mas tem um um grande amigo, Paulo Rusa, abraço Rusa, que ele fala que quando você domina um assunto, você consegue explicar e esse assunto para as pessoas mais leigas. Então, uma maneira de você explicar os assuntos para as pessoas mais leigas é você trazer analogias, tá?
Eh, vamos pensar aqui no num mercado de atacado, OK? você vai ter lá um produto dentro de um supermercado para poder vender esse produto. Ele precisa passar por uma série de regulações para que ele esteja ali na prateleira do mercado. OK? Quando a gente vai falar para o mundo das análises, é a mesma coisa. Eu preciso criar um processo que garanta que aquela informação que está disponível para consumo, ela seja minimamente qualificada e confiável. Tipo, eu não vou comprar aquele produto no supermercado, vou comer e ter uma dor de barriga, vou passar mal. Ele vai ter ali algumas regras que ele vai precisar respeitar para que ele não afete a sua saúde. Perfeito. Então, como que a gente consegue garantir? Criando uma esteira que garanta essa produtização e essa capacidade de você e eh consumir coisas com qualidade. Tá bom?
Fechei parênteses. Essa é uma primeira analogia, tá? Vamos para uma outra analogia. Você tá fazendo uma analogia desse produto de prateleira com produto de dados. Exatamente. E aí, conceito de produto, vamos lá, bem ao serviço que que que você tem, uma coisa mais tangível, menos tangível, mas no final das contas, um produto útil dentro da organização é um produto que você consegue gerar valor comum. e fazer ali a gestão de eficiência para que você consiga gerar aquele produto com o menor custo possível e você aumenta o uso dele e automaticamente quando você aumenta o uso você aumenta o valor que ele gera paraa companhia. E aí dentro daquele produto que tá dentro da prateleira, eu tenho regulações, tenho regras, que aí entra no que a gente falou no tópico anterior, que eu tenho regras de negócio validadas que garantem que aquele dado, aquele produto está correto. É isso. Aí, falando de uma maneira técnica, você pode ter uma esteira de data ops, que essa esteira de data ops, ela vai garantir qualidade, vai garantir metadados, vai garantir várias outras coisas, eh, que vai garantir que você não vai ter uma uma redundância de entidade, vai garantir que você não tem duplicidade, vai garantir uma série de coisas para que você tenha esse consumo de uma maneira mais confiável, tá?
Existe uma máxima da qualidade que assim, tudo tudo é muito bom até o primeiro erro. Depois você ter o primeiro erro, você afeta o seu modelo de confiança e você não consegue escalar valor. É igual cerveja. Você primeira vez que você foi no banheiro, você bebe mais não? Aí você vai direto.
Exatamente. Tá bom. Tá. Mas beleza.
Voltando pro cenário, a gente tem ali produtos de dados que estão bem definidos e que são confiáveis. E que são confiáveis. Então, e é dentro dessa dessa analogia, a gente vai para uma outra vertente dessa analogia. Eh, você tem um restaurante, certo? Quando você tem um restaurante, você precisa aplicar também, passar por algumas regras.
Então, você precisa ter lá vigilância sanitária, você precisa criar as coisas ali dentro de um CNPJ, eh, para você ter aquele restaurante, certo? Mas aí você me convida para ir pr pra sua casa, eh, a gente vai lá com as nossas famílias e vai ter ali um um jantar, certo? Vamos conversar sobre PPT, vamos conversar sobre outras coisas e você resolve cozinhar, certo? Você vai no mercado, vai comprar o produto e você vai testar uma nova receita. Você sua cobaia, certo? Você vai testar uma nova receita e você vai fazer essa receita. Você não precisa de vigilância sanitária na sua cozinha. Você vai ter uma liberdade um pouco maior na sua cozinha. Afinal, eu sei que o presunto que eu tô usando é o presunto que tá dentro do prazo de validade, que foi feito dentro das especificações. Mas às vezes você pode combinar o o presunto com chocolate e alcachofra. Pode ficar uma bosta, mas o o o eu sei que o presunto é um presunto mesmo. Perfeito. E você pode não saber cozinhar e você fazer uma gororoba. O que eu quero dizer? você não vai monetizar isso. Então, é normal que as empresas tenham um ambiente com uma robustez de processos em que você vai consumir coisas com maior qualidade e você vai ter um ambiente onde você pode experimentar mais, mas só que você não vai ter uma escala de monetização.
Quando você criar-lhe uma receita que é boa para caramba, que vai matar a fome de muita gente, muita gente vai gostar, que que você faz? joga paraa esteira de produção e aí você desenvolve um novo ativo ali dentro da esteira que vai ser corporativo. Isso não vai tirar de você a autonomia de criar uma nova receita no seu ambiente de experimentação. Então a analogia que eu gostaria de fazer é essa, tá? E aí é é um último ponto que até a gente já comentou aqui é é sobre o freio do carro, certo? Por que que um carro vai tão rápido? Porque ele sabe que ele vai poder brecar. Você não vai andar 200 por hora se na primeira curva você não conseguir ter a certeza que você vai brecar e vai pisar no freio para poder fazer a curva, senão você vai bater de cara na parede, certo? Então, eh, quando você estabelece essa e eh este esses processos a essas normas de dados, você dá a capacidade das pessoas acelerarem nas suas análises, mas elas vão ter em cima da sua plataforma de dados normas, políticas, metodologia que vai garantir que isso eh não seja utilizado de uma maneira indiscriminada.
Por quê? Porque eu continuo tendo meus dados produtivos, meus dados oficiais, minha regulamentação de dados internos de uma maneira mais robusta. E aí se eu quero transformar esse produto numa coisa super rápida dentro da companhia, eu tenho que ir paraa cisteira que vai garantir todos esses processos, tá? O que você tá, o que você tá querendo colocar nessa analogia que eu o que eu tinha antes de uma forma mais eh, rupestre, digamos assim, que era o data mining, onde a galera ficava cruzando tabela com tabela, etc. Hoje eu tenho uma metodologia mais clara de produtização de dados, etc., que esse cara pode ter uma ele trabalha num degrau acimba, né, de uma confiança um pouco mais estável sobre o dado que ele tá trabalhando, tem mais capacidade computacional, tem mais capacidade computacional e ele consegue ter quase, entre aspas, um PID aqui para utilizar esses produtos e criar inferências que são muito mais eficientes e com menos viés do que ele tinha antes dentro de um data mining, porque o produto reduz muito, né, isso porque o produto ele é contido e ele tem a sua regra em si, né?
Como você uma vez bem citou aqui, acho que em alguns episódios bem no começo do PPT, eh, você falou que produto de dados é um encapsulamento de valor que tem como premissa máxima o consumo de dados.
[ __ ] eu falei isso. Falou isso. Isso me marcou porque foi uma boa definição e eu guardei para mim. Que orgulho, tá? E então que que eu quero dizer com isso?
Esse encapsulamento de de valor, ele vai sempre existir se eu tô num esquema de protótipo piloto, ou então se eu tô tendo ali um projeto para poder escalar a utilização disso, tá? Então a ideia é eu conseguir flexibilizar um pouco a minha regulamentação conforme a maturidade dos meus produtos, OK? Mas no final das contas eu ter sempre um nicho corporativo, que é onde eu tenho realmente as coisas que t um modelo de confiança maior. Então é o seguinte, você quer usar coisa que tem um modelo de confiança menor, usa. Mas isso é um risco seu. Se você quiser utilizar uma coisa que esteja corporativo, validado, curado, que já respeite todo o compliance corporativo, vai nesse portfólio aqui, entendeu? Aí no final das contas é seu o seu apetite por risco, tá? Mas fazendo uma analogia com a sua própria analogia, se eu quiser usar carne de porco em natura, ao invés de um presunto curado, já um produtinho bem feito, temperado, etc. Beleza? Às vezes você vai ter o seu próprio tempero que vai ficar mais gostoso e às vezes você vai querer uma coisa pronta porque você precisa de uma coisa mais prática, entendeu? Então, o que vai determinar no final das contas qual produto você tem que usar é a sua fome, é o seu desejo, é aquilo que você anseia, certo? E principalmente seu conhecimento, porque pode ser que eu não consiga pegar uma carne de porco pura e transformar numa receita boa. Então, é melhor eu comprar o o o presunto feito, certo? Eu falo que eu sou um ótimo cozinheiro, eu abro o meu celular, vou lá em iFood, iFood patrocina nós. Eu vou lá em iFood e peço, acabou. Pronto. Exatamente.
Entendeu? Então, se você não é o Alexala, nem sei quem é dos dados. O Alexala é o maior cruzeiro brasileiro.
Ou até era. Eu só sei, eu só sei comer.
Não decoro o nome das pessoas assim.
Bom, mas é, patrocina nós também, Alex.
Isso. Um abraço, Alex. Você quiser vir aqui falar de coloca aí, ó. você sabe que tem o data kit, né, que é o o a esteira de data ops. É bem legal esse depois porque faz analogia da sua esteira de produção de dados com uma cozinha, como você tem que organizar as coisas. E aí fazendo até a analogia dos restaurantes que a gente falou, cada cozinha precisa organizar, cada cozinha, que eu digo assim, a mediterrânea, nordestina, né, precisa organizar e o a sua esteira de produção de uma maneira diferente. Por quê? Porque cada uma tem o seu pré-preparo diferente, tem uma dinâmica, Missan Plus diferente. Aí que chique. É isso aí.
É um podcast. Um quê? Data, o Data kit pode ser. Assim como o Data Centric também que a gente comentou. Dá bastante pano pra manga. Muito bom. Muito bom.
Rud, cara. Novamente, meu amigo, a gente vem aqui e fala: "Cara, será que isso aqui dá um episódio e poderia dar uma série de episódios?" Foi, foi bem bem.
Eu confesso que eu não pensei que ia sair tanta conversa não. Muito bom, cara. Obrigado como sempre. Você tá com a data de nova, cara? Nada. Isso aqui é de sempre. Sério? Sou o taco aqui, ó. É anime. Jujutso Kaisen. Caraca, que nerd esse cara. V Sou sou otaco, gente. Tá vendo, pô. Obrigado. Não sou Johnny Dep. Tá vendo? É Johnny Dep. Johnny Depck. Otao.
Otaco. É isso aí. Você que acompanhou a gente até agora, muito obrigado, Rud. Eu vou deixar para você convidar os caras a serem membros do PPT no Compila. Já defini qual que é o nome dos membros do PPT? Vai ser, eu não vou falar porque na semana que vem a gente vai soltar um episódio especial falando sobre o programa de fidelidade do PPT no comput. Então, perfeito.
Então, vou fazer. Mas, ó, antes lá, é, você vai trazer a galera para cá, porque quando a gente lançar o o programa de de fidelidade, quem já for membro vai ter umas coisas especiais. Então, beleza. Então, se você é ouvinte do PPT, eh, você já acompanha aqui o trabalho que nos últimos aí 2, tr anos tem enchido de conhecimento aí as nossas cabeças, já aproveita e se feliz. seja membro do PPT, não compila, tá bom? Vaiá lá no YouTube e siga lá, coloca o sininho, eh, vai lá em patrocínio e patrocine esse trabalho que realmente é muito bom e vir paga uma cervejinha aqui para nós. Isso, paga cerveja para nossos convidados aqui. É isso aí. Eh, e siga lá no no Spotify também tem também.
Instagram, Twitter não, porque a gente desistiu por causa do Kiko dos Foguetes.
Então beleza, mas sigue em todas as redes, compartilha pro pros seus amigos.
LinkedIn LinkedIn é muito importante pra gente. Compartilha lá no LinkedIn, compartilha também no seu WhatsApp, no seu pessoal ainda usa Telegram? Eu sou ruim de de rede social. Usa usa Telegram agora tem um um contexto mais underground, né? É, mas aí compartilha nas suas redes. Compartilha no underground também. Também. É, mas faça aí um calor também para que mais pessoas tenham acesso no Teams, Teams da Teams da empresa no Slack. Compartilha o conteúdo, compartilha, faça a comunidade crescer. Bom, é, e se fil, não se esqueça, porque em breve vai ter aí muitas vantagens para você. Vamos ter aí alguns brindes especiais.
nas próximas semanas vai vir. Então, se você já for membro, você vai ter alguns eh algumas vantagens adicionais. E siga também aqui e Luiz Rud lá no LinkedIn, siga também Wellington Cruz lá no LinkedIn, tá bom? Ele tá numa fase influencer, então recompartilha também o o os posts lá e compartilha sua visão também no Linked. Pronto. É isso. Isso aí. e e principalmente deixe seu comentário nesse episódio. A gente quer que você participe dessa discussão aqui.
Foi um papo eu e o Rud, né? e que eu espero que você tenha participado como se você tivesse sentado aqui na mesa.
Então, enquanto a gente estava conversando, em qualquer momento você deixa o seu comentário, eu sei exatamente em que momento você que você comentou e eu vou mandar pro Rud, eu vou comentar também e a gente vai conversar e fazer essa comunidade se expandir e cada vez mais a gente trazer mais conhecimento, porque nosso, o a gente tá aqui para isso, gente. A gente gosta de tecnologia, a gente é apaixonado por isso e apesar de tomar uma cerveja aqui, a gente não não não vamos ficar rico com isso daqui. A gente trabalha para fazer a comunidade de tecnologia, porque a gente gosta disso, a gente ama isso daqui. Então participa com a gente e traga essa paixão junto conosco.
Obrigado pela pela paciência de vocês e por acompanhar a gente até aqui. R, meu amigo.
Valeu, até a próxima.
[Música] [Música]
Episódios Relacionados
1h 37minInteligência Artificial vs Maturidade de Dados | PPT Não Compila Podcast
Luis Rudi
2 de abr. de 2025
1h 45minDecisões Estratégicas: Adoção ou Construção de Plataforma de Dados? | PPT Não Compila
Glauco Lemes, Pedro Avolio, Rômulo Barbosa
31 de jul. de 2024
1h 28minData Deep Dive: O Impacto da Qualidade de Dados nas Corporações | PPT Não Compila Podcast
Juline Louise, Samuel Otero, Romulo Barbosa
28 de fev. de 2024
1h 41minRevolução Digital no Agronegócio: Inovação e Tecnologia na Cargill | PPT Não Compila Podcast
Danillo Sciumbata, Valdir Scarin
19 de jul. de 2023
