Como a própria tradução literal diz, big data são “grandes dados”. Conceitualmente, pode ser entendida como um grande volume de dados, com ampla variedade, em velocidade alta de circulação e que são, a todo momento, questionados sobre sua veracidade. São bases de dados gigantes, complexas e que podem ser processadas para obtenção de resultados diversos.
Entre as características marcantes, vou destacar duas: com relação a volume, já se trabalha, no mercado, com a casa de 1 milhão de gigabytes, ou seja, algo praticamente intangível. Para se ter uma ideia, este volume de dados corresponde a mais de 280 milhões de livros do tamanho da Bíblia, por exemplo.
Já com relação à veracidade, ao trabalhar com big data é preciso checar se todas as informações são verídicas e se não estão poluindo amostras e atrapalhando processamentos. Arquivos de texto, números, imagem, áudio e vídeo compartilhados por meio de qualquer tecnologia existente aumentam a diversidade de informações disponíveis e a velocidade com que isso acontece coloca em risco a veracidade da informação. Acontece bastante no caso das fake news, por exemplo.
Na prática
Já percebeu que ao navegar por um determinado site sua experiência se torna cada vez mais personalizada? Seja pelo direcionamento às suas preferências, pelo armazenamento de sua senha de acesso ou até mesmo pelas propagandas que são exibidas nos espaços destinados a estes fins – e sim, elas são exibidas com base no seu histórico de busca, ou seja, no seu interesse momentâneo.
Todas estas informações armazenadas para otimizar e aprimorar sua experiência fazem parte de um pacote imenso de dados assimilados por sistemas com base em informações armazenadas e que, quando você navega pelo site, é processado para gerar a personalização.