A jornada de Teradata na nuvem

Com a Teradata transformando o Vantage em uma plataforma nativa da nuvem, está preparando o terreno para democratizar a plataforma por meio de novos esquemas de preços, aproveitando ao máximo a elasticidade da nuvem. Ao fazer isso, a Teradata também espera ampliar seu alcance, visando usuários descontentes do Hadoop, mas com uma mensagem que pode ser muito perturbadora.

Teradata completou 40 anos este ano, colocando-o nas fileiras de um pequeno grupo de nomes familiares de TI como IBM, SAS e Oracle que nasceram ou (no caso da IBM) sofreram os males do poliéster e do disco. Quando a empresa foi formada, a noção de um terabyte de dados era praticamente inimaginável. Felizmente, quando alguém publicou um slide mostrando como as fronteiras de armazenamento passaram de terabyte para gigabyte, petabyte e zetabyte, respiramos aliviados por Teradata não sentir a necessidade de mudar seu nome para manter-se atualizado.

Para recapitular, Larry Dignan resumiu as manchetes do evento anual Teradata Universe da semana passada, com o destaque em nossa mente sendo a adoção de Teradata de uma arquitetura e modelo de negócios nativos da nuvem.

Teradata acabou de ver uma grande mudança de guarda, marcada pela ascensão no início deste ano de Oliver Ratzesberger como CEO, e grandes mudanças no restante do conjunto C. Para nós, o significado é que esta é a primeira vez em décadas que a Teradata é liderada por um tecnólogo e não por um empresário.

Começaremos com um fato que não mudou. A Teradata define seu mercado endereçável como o que chama de “Megadata Companies”, ou seja, as organizações com os problemas analíticos mais conhecidos, com base na complexidade e na escala. Em outras palavras, não está competindo com os MySQLs, PostgreSQLs, Redshifts ou Snowflakes do mundo pelo mercado mais amplo de data mart de cargas de trabalho de armazenamento de dados de médio porte. Isso coloca Teradata em rota de colisão com Cloudera . Segure esse pensamento.

Outra coisa que não mudou foi a tentativa da empresa de se desligar do hardware – é uma mensagem que cresceu e diminuiu nos anos desde que a Teradata introduziu suas plataformas de “sistemas abertos” nos anos 90.

Até agora, essa era uma venda difícil, porque os tipos de cargas de trabalho em que a Teradata se destaca – SQL extremamente complexo com inúmeras junções, em até terabytes (ou mais) de dados e com suporte a simultaneidade muito alta – exigiam hardware especialmente otimizado.

A Teradata costumava vender dispositivos especializados voltados para as variações de cargas de trabalho: intensivos em computação, intensivos em IOPS e / ou alta simultaneidade. Com a última geração de hardware da marca IntelliFlex , essas variações podem ser configuradas por meio de software. Ainda existem recursos específicos do Teradata, como as interconexões do Bynet, mas com tendências como a Ethernet mais rápida, esperamos que o campo de atuação do hardware comum acabe nivelando.

Mas a notícia ainda melhor é que a nuvem pode finalmente tornar toda a questão acadêmica: resolva de uma vez por todas que a Teradata é uma empresa de software. E é aí que entra o capítulo da jornada deste ano. A arquitetura nativa da nuvem da plataforma da Teradata, agora chamada Vantage , separa os dados da computação e oferece suporte nativo ao armazenamento de objetos como apenas outra camada. Teradata dificilmente é o único player a adotar a arquitetura nativa da nuvem. Na verdade, acabamos de falar sobre a SAP fazer a mesma mudança com o HANA . E, a propósito, Cloudera e Hadoop também. Como observamos anteriormente, o armazenamento de objetos na nuvem está se tornando o lago de dados de fato .

E, com computação e armazenamento separados, isso abre caminho para o Teradata começar a oferecer preços baseados no consumo. Portanto, se você estiver usando o serviço de nuvem gerenciado da Teradata, não há preços Tcore mais complexos ; em vez disso, você paga como pagaria por qualquer serviço gerenciado em nuvem; por quantidade de armazenamento e somente a computação usada. Esse é um passo importante para facilitar a negociação com a Teradata e a adoção de preços pré-pagos, que tornarão o serviço muito mais acessível.

Vamos dar um passo adiante. Como parte da versão atual do Vantage, há o suporte à conteinerização. O próximo passo lógico será estender o suporte ao Kubernetes. Para a Teradata, isso abriria um caminho para criar – e potencialmente gerenciar – nuvens privadas para os clientes desconfiados de mover suas cargas de trabalho para a nuvem pública. Não ficaríamos surpresos se a Teradata adicionar o suporte ao Kubernetes no próximo ano.

Por trás desses desenvolvimentos está, como observado acima, a crescente paridade de hardware comum. Mas também fala da crescente variedade de instâncias de computação em nuvem. Por exemplo, na AWS, agora você pode selecionar de um portfólio de instâncias do EC2 otimizadas para computação, memória, processamento de alta velocidade ou armazenamento – assim como nos velhos tempos, você selecionava dispositivos da Teradata otimizados para computação, IOPS, ou cargas de trabalho mistas. Você também tem uma variedade de opções de armazenamento . Enquanto isso, os provedores de nuvem estão adicionando processadores especializados personalizados para cargas de trabalho específicas, como as TPUs. otimizado para cargas de trabalho do TensorFlow no Google Cloud. Fechando o acordo, os backplanes dos provedores de nuvem estão se tornando suficientemente rápidos para oferecer alternativas “boas o suficiente” à infraestrutura altamente otimizada dos dispositivos Teradata tradicionais.

A outra tendência importante é o posicionamento do Vantage como uma plataforma com várias cargas de trabalho. E, como observado acima, é aí que ele colide com o Hadoop. A chave para o desenvolvimento do Vantage é que ele é fruto da plataforma Aster Data Discovery . Na época, a Teradata mantinha a plataforma Aster separada da nave mãe, direcionando-a para organizações que trabalhavam com análises de Big Data. O resultado foi uma confusão em toda a base de Teradata sobre se o Aster se tornaria estratégico ou vazado. A contribuição de Aster foram as centenas de bibliotecas que estenderam o SQL para oferecer suporte a abordagens como MapReduce, gráfico, aprendizado de máquina e programação R e Python. Sem o Aster, a plataforma Vantage não teria sido tão bem arredondada.

Obviamente, o Teradata não está sozinho ao tornar o banco de dados relacional mais extensível. Enquanto tradicionalmente, a prática comum era extrair dados ou tabelas no laptop e, em seguida, visualizar e analisar dados em estruturas como o Pandas, cada vez mais, os fornecedores de bancos de dados estão trazendo o processamento R e Python diretamente para o banco de dados. A vantagem é eliminar a necessidade de copiar dados (e acabar com várias versões da verdade), sem mencionar a vantagem de aproveitar os próprios mecanismos de execução do banco de dados para dimensionar a execução de modelos.

Hoje, a Microsoft suporta processamento de Python e R no banco de dados com o SQL Server 2019 por meio de funções definidas pelo usuário; A Oracle agora está adicionando APIs R e Python para executar modelos no banco de dados; enquanto a IBM suporta a execução de Go, Ruby, Python, PHP, Java, Node.js e Sequelize, entre outros idiomas no Db2. A capacidade de usar os notebooks Jupyter para desenvolver e implantar modelos para executar no banco de dados também se tornou uma aposta na tabela. O diferenciador da Teradata está oferecendo um rico portfólio de bibliotecas analíticas otimizadas para o banco de dados.

O resultado é que a Teradata acredita ter uma alternativa mais credível para as organizações que lutaram com o Hadoop. Ele anunciou um programa de migração do Hadoop que inclui um envolvimento multifásico de avaliação, planejamento e implementação. Ele surge juntamente com a promoção de “lagos de dados relacionais” de empresas como a SAP. A noção norteadora é que, dada a grande base de habilidades existente dos desenvolvedores de SQL, tornar o SQL extensível para suportar algumas das novas abordagens de análise programática será mais prático para organizações que não possuem bases de habilidades adequadas em Python ou R. Não surpreendentemente, uma exposição improvisada A sessão de piso que apresentou o novo programa de migração do Hadoop atraiu uma multidão de pessoas em pé.

E isso aconteceu logo após a crise de meia-idade do Hadoop, que ocorreu com a fusão da Cloudera e da Hortonworks e com a aquisição do MapR pela HPE na venda por incêndio. Tornou-se moda condenar o Hadoop como morto e, infelizmente, Teradata tem sido inconsistente em suas mensagens sobre o Hadoop. Em alguns slides, ele se refere ao Hadoop como “tecnologia em extinção”. No entanto, seus praticantes no terreno reconhecem que o Hadoop continuará desempenhando um papel e, a propósito, Teradata ainda tem uma parceria com Cloudera. O Teradata precisa limpar suas mensagens do Hadoop e ser mais positivo. Lagos de dados relacionais são adequados para organizações onde predominam as habilidades em SQL. Desde que a Teradata posicione a migração do Hadoop como mais adequada ao conjunto de habilidades de sua base de clientes, isso deve evitar o ruído e a distração desnecessários que suas mensagens inconsistentes irão lançar em seu caminho.

E Você, deixe nos comentários abaixo à sua opinião, e não deixe de visitar: https://www.deltaservers.com.br/ para acompanhar todas as novidades que preparamos para você!

Deixe uma resposta

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.