Posts in Data Science

Investigando o grande banco de dados chamado DNA

27/11/2018 Posted by Data Science, Tecnologia 0 thoughts on “Investigando o grande banco de dados chamado DNA”

Como os avanços da ciência colocaram lado a lado a biotecnologia e as tecnologias da informação.

As últimas décadas de avanço científico e tecnológico proporcionaram expandir nosso poder de influência a níveis nunca experimentados. A história da civilização mostrou progressivo aprendizado e desenvolvimento de nossas habilidades em fazer uso dos recursos disponíveis e transformar o mundo que nos cerca, mas pouco podíamos em matéria de controle sobre nós mesmos. O que nos traz a um patamar inédito são as descobertas, sobretudo dos últimos 30 anos, que nos permitiram conhecer com riqueza de detalhes a constituição de nossos corpos e, a partir disso, interferir nela.

Nos anos 1990 teve início um projeto de cooperação global para mapear o sequenciamento genético dos seres humanos. Em 2003 já conhecíamos, com alto nível de precisão, as mais de 3 bilhões de “letras” do nosso “alfabeto genômico”. Ao esforço de geneticistas e outros estudiosos das ciências biológicas somou-se a expertise de cientistas da informação, auxiliares na tarefa de organizar e armazenar essas descobertas que, a rigor, são sequências de dados.

Talvez como nunca antes, a biotecnologia e as tecnologias da informação puderam andar simbioticamente juntas. Daí em diante as “revoluções gêmeas” de ambas as áreas, como caracteriza o autor israelense Yuval Harari em “21 lições para o século 21”, passariam a nos permitir “reestruturar não apenas economias e sociedades mas também nossos corpos e mentes”.

Essa parceria já nos proporciona, por exemplo, lidar com a ameaça que alguns vírus representam. Diagnosticar um portador a partir dos sintomas que apresenta pode ser um processo demorado, dadas as várias manifestações possíveis e a enorme lista de vírus já conhecidos. Some-se a isso o fato de que muitos deles, potencialmente mortais, tais como o HIV e o Ebola, causam sérios danos aos seres humanos mas não produzem nenhum sintoma em seus hospedeiros naturais. Aí entra o sequenciamento de DNA, hoje muito mais acessível, e a capacidade já desenvolvida de processamento e análise de dados.

O recente anúncio da gestação dos primeiros bebês submetidos a edição genética de que se tem notícia é um exemplo de onde pudemos chegar. O cientista chinês He Jiankui divulgou informações preliminares da iniciativa que buscou conferir a um embrião a resistência a uma futura contaminação pelo vírus da AIDS por meio de alteração genética. É verdade que o experimento ainda não foi validado pela comunidade científica internacional, mas indica que estamos muito próximos de, antes mesmo do nascimento, interferir em algumas características dos seres humanos. Há dilemas éticos e muitas incertezas envolvidas, mas sem dúvidas o que vemos é um avanço sem precedentes.

Outras aplicações são menos controversas. Com base nos petabytes (ou milhões de gigabytes) de sequências de DNA disponíveis em acervos públicos, cientistas podem identificar no código genético de um hospedeiro pequenos fragmentos do DNA de um vírus e, assim, constatar sua presença. É como encontrar duas sequências numéricas iguais em duas colunas de uma planilha no Excel.

“Humanos sempre foram muito melhores em inventar ferramentas do que em usá?las sabiamente”, afirma Yuval Harari em seu último livro. As revoluções na biotecnologia e nas tecnologias de informação seguirão, ao que tudo indica, e o potencial transformador delas é enorme. Vão restar os dilemas morais e éticos, bem como a responsabilidade pelas consequências das transformações postas em prática – coisas que continuarão atribuídas aos seres humanos, e não às máquinas ou à tecnologia.  

A Terra em 3D

14/11/2018 Posted by Data Science, Tecnologia 0 thoughts on “A Terra em 3D”

Agência espacial alemã cria e divulga mapa da Terra em três dimensões.

O Centro Aeroespacial Alemão (DLR, na sigla no idioma germânico) disponibilizou para cientistas do mundo todo uma base de dados com um mapeamento detalhado da superfície terrestre. Por meio dos satélites TerraSAR-X e TanDEM-X, mais de 148 milhões de km² foram varridos, dando origem à mais detalhada descrição já feita de nosso relevo.

A precisão do mapa é de impressionar. Sua resolução é de 90 metros, ou seja, é como se nosso planeta tivesse sido dividido em quadrados de 90 metros de lado. Em cada um desses quadros a dimensão vertical é registrada na casa dos metros, conferindo ao mapeamento um detalhamento incrível.

O arquivo completo tem mais de 500 GB e pode ser acessado mediante um registro na página do DLR. Em uma próxima fase do processo os pesquisadores utilizarão de tecnologia mais avançada, na qual satélites utilizarão frequências com ondas de maior comprimento, permitindo esmiuçar ainda mais as informações. Se atualmente fizeram algo como um Raio X do globo, a ideia é poder fazer, em breve, uma tomografia do planeta. Na próxima fase o diagnóstico será capaz, por exemplo, de estimar com precisão o volume de biomassa existente na Terra.

Machine Learning já é!

07/11/2018 Posted by Data Science, Tecnologia, Tendências 0 thoughts on “Machine Learning já é!”

O machine learning (ou aprendizagem de máquina) é um desenvolvimento das possibilidades de Inteligência Artificial. Entre os sistemas criados para emular a maneira como os humanos pensam, o machine learning é um que busca a capacidade de aprender “sem ser explicitamente programado”. Ou seja, todo machine learning é Inteligência Artificial, mas a recíproca não é verdadeira, pois há um universo de outras possibilidades de AI.

No aprendizado de máquina, técnicas estatísticas são aplicadas pelos computadores para aprender a identificar automaticamente padrões em dados. Como resultado, são capazes de fazer previsões com alto índice de acerto.

Nem precisamos dizer que não é coisa de ficção científica. Computadores já aprendiam a jogar damas ou xadrez, sozinhos, na década de 1960. E atualmente, eles estão nos sistemas de recomendação dos mecanismos de busca, no reconhecimento dos padrões de desenho manuscrito e na prevenção de fraudes bancárias, entre muitos outros.

E a tendência é crescer. De acordo com o IDC, organizações investiram US$ 12.5 bilhões em sistemas de AI, em 2017.

Veja aqui uma apresentação das mais bacanas e didáticas para entender a capacidade do machine learning em identificar padrões de dados e fazer previsões.

Quem precisa de um cientista de dados?

29/10/2018 Posted by Data Science, Negócios 0 thoughts on “Quem precisa de um cientista de dados?”

Sucesso das organizações data-driven depende da adoção de uma cultura focada em dados por todos os colaboradores.

As oportunidades para inovação nos negócios são cada vez maiores, mas serão bem-sucedidas as organizações em que todos os colaboradores, e não apenas os líderes, souberem aproveitar as chances.

Confira abaixo três reflexões válidas para pequenos e grandes times em busca do sucesso em um mundo permeado por informação.

Foco na pergunta certa e não em como chegar à resposta.

Organizações enfrentam dificuldades com Big Data por simplesmente não saberem levantar as questões relevantes. O que você pode aprender com os dados que já estão armazenados?

Aprenda a extrair resultados para o seu campo de atuação.

Talvez você não precise entender em profundidade sobre a cadeia de distribuição ou a customização industrial, mas vale a pena reavaliar seu fluxo, gestão do tempo e produtividade com base nos dados coletados em seu trabalho diário.

Entenda que os dados não são perfeitos

Ninguém é. Os dados precisam ser extraídos e limpos antes de oferecerem valor. E agora é um excelente momento para avaliar como eles estão sendo armazenados, para evitar problemas mais à frente.

Os dados estão em toda parte e os colaboradores interagem com eles o tempo todo, em seus celulares, e-mails e aplicativos. É importante reforçar que, sem análise, interpretação e implementação, os dados são apenas números. O insight e a experiência humana é que garantem seu valor.

Três reflexões sobre o impacto da Lei de Proteção aos Dados Pessoais

01/10/2018 Posted by Data Science, Negócios, Tecnologia, Tendências 0 thoughts on “Três reflexões sobre o impacto da Lei de Proteção aos Dados Pessoais”

Do direito de ser esquecido ao direito à educação.

A necessidade de consentimento explícito e específico para a coleta e uso de dados pessoais, estipulada pela Lei Lei 13.709/2018, recentemente sancionada, faz emergir outros três temas relevantes.

O primeiro se refere ao dia-a-dia dos clientes e usuários da web. A aprendizagem permanente e incremental está na gênese da ciência de dados. As empresas fazem um primeiro uso dos dados e, com o resultado, fazem novas análises e descobrem novos usos e valores. Dessa forma, o uso original solicitado ao usuário da rede mudou, e uma nova solicitação será pedida.

O resultado possível é a rotina dos clientes ser permeada por uma sequência interminável de solicitações de consentimento. Não é preciso dizer como isto impacta na experiência de navegação, com possíveis resultados negativos para e-commerce, por exemplo.

O segundo está relacionado à capacidade dos clientes de decidir sobre o assunto. Apesar da posição de destaque no ranking de usuários web, o Brasil ainda figura entre os países com menores níveis de autonomia no uso da tecnologia.

Apontei este problema em recente participação em um debate na Globonews (veja aqui), e é importante ressaltar que as pesquisas mostram que o brasileiro tem dificuldade em experiências simples, como usar um editor de texto ou mesmo ligar e acessar uma conta pelo computador.

O terceiro tema é a necessidade premente a normatização do direito de esquecimento que permite aos clientes solicitar que seus dados sejam definitivamente apagados dos registros de empresas, organizações públicas e provedores web. Esse assunto foi recentemente julgado na suprema europeia a partir do caso de um cidadão que solicitou o esquecimento dos registros web que o associavam a um imóvel leiloado por inadimplência.

Visto como positivo por zelar pela privacidade, esse direito torna tênue o limite entre o seu exercício e ações socialmente negativas como a censura, o ocultamento de fraudes e suas variações.

Quando terceirizar a análise de dados?

16/08/2018 Posted by Data Science, Negócios 0 thoughts on “Quando terceirizar a análise de dados?”

Custos e benefícios de uma solução cada vez mais utilizada
pelas organizações.

Como analisar a massiva quantidade de dados armazenados e em armazenamento em todo o mundo? Somente em 2017, algo como 1,8 trilhões de gigabytes foram criados e estudo da consultoria IDC estima um crescimento de até 10 vezes ao longo dos próximos cinco anos.

A capacidade de analisar estes dados diferenciará as organizações. Aquelas capazes de extrair conhecimento e resultados, investindo em Data Analytics, prosperarão. A pergunta feita por gestores e consultores é como fazer o melhor investimento de tempo e recursos. Ou, de forma mais prática: criar uma estrutura própria ou contratar uma consultoria?

A resposta está em determinar quão críticos para os negócios são os dados armazenados (ou disponíveis) na organização.

  • Dados críticos para a sobrevivência dos negócios devem ser, preferencialmente, analisados por equipes internas, atualizadas e capazes. Estas equipes beneficiam-se do apoio de consultores e redes externas.
  • Já os dados considerados de suporte, facilitadores dos processos de tomada de decisão, mas não necessariamente críticos, podem ter sua análise terceirizada.

Atenção para o detalhe: podem e devem! A base da Data Analytics e sua capacidade de transformar os negócios está na visão de que todos os dados devem ser analisados. É a análise que determinará o que é ou não relevante.

Data Analytics ajuda a manter postos de trabalho

16/08/2018 Posted by Data Science, Pessoas, Tendências 0 thoughts on “Data Analytics ajuda a manter postos de trabalho”

Como a análise de dados pode oferecer contraponto ao
desemprego gerado pela automação.

O maior desafio da gestão de pessoas das organizações do futuro é atuar no dinâmico ambiente em que as tecnologias da informação e comunicação estarão criando e eliminando vagas. Mostramos aqui como 800 milhões de vagas podem ser perdidas até 2030, e também onde elas serão criadas.

Soluções em Data Analytics são especialmente importantes para as organizações neste cenário. Ao longo de anos de operação, as empresas reuniram um valioso manancial de informações sobre seu capital humano.

Qualificações, promoções, interfaces, tempo de permanência, áreas de expertise, redes de relacionamento, contribuições e muitos outros dados estão à disposição.

Com esse acervo, as áreas de gestão de pessoas devem ser capazes de:

  • Utilizar as ferramentas de Data Analytics nas avaliações das adjacências profissionais de seus colaboradores;
  • Ampliar a capacidade da organização de usar de forma estratégica os dados sobre seu capital humano;
  • Antecipar, por meio da Inteligência Artificial, os fluxos, demandas e alternativas nos processos de requalificação e reinserção no mercado.

A análise de dados é capaz de reduzir custos de dispensa, qualificar o investimento em treinamento e determinar as habilidades a serem buscadas no mercado.