Tecnologias e ferramentas básicas de Business Intelligence

Estão por trás dos sistemas de BI

flexM4I > abordagens e  práticas > business intelligence (BI) and analytics >Tecnologias e  ferramentas básicas de Business Intelligence (versão 1.3)
Autoria: Henrique Rozenfeld (roz@usp.br)

Apresentamos um conjunto de tecnologias e ferramentas básicas que tratam da transformação de dados brutos (estruturados ou não) em informações significativas e úteis para dar apoio à business intelligence.

Esta seção ainda está em desenvolvimento

Introdução

Esta seção complementa a seção sobre business intelligence e analytics e mostra quais são as ferramentas básicas de data analytics e inteligência artificial que são utilizadas para adicionar inteligência baseada em dados nos negócios.

O termo business intelligence (BI) já pressupõe o uso de data analytics. Por isso, achamos redundante utilizar o analytics como um complemento do termo. Além do data analytics, os algoritmos de inteligência artificial são fundamentais para o business intelligence. 

A próxima figura ilustra uma “visão confusa (blur)” das abordagens, práticas, ferramentas e tecnologias relacionadas com BI.

Figura 549: abrangência das abordagens relacionadas com business intelligence e analytics (clique na figura para aumentá-la e abrir em outra aba)

A X intelligence que inserimos na figura indica diversas abordagens e práticas de inteligência baseada em dados que se especializaram.

Em seguida, mostramos a sistematização que realizamos para estruturar as abordagens, como descrevemos no tópico “Hierarquia entre as inteligências da business intelligence “ da seção principal “Business Intelligence and Analytics”.

Figura 918: abrangência e hierarquia das abordagens e tecnologias da business intelligence (BI)

Clique na figura para aumentá-la, abrir em outra aba e baixar o pdf como infográfico com os links para as seções relacionadas com as inteligências identificadas na figura.
Na seção principal sobre business intelligence, você pode ler uma descrição resumida sobre essas “inteligências”.

Seguem agora as ferramentas básicas de business intelligence.

Big data

Big data:  é uma área de conhecimento que estuda formas de analisar e extrair sistematicamente informações a partir de conjuntos de dados que são muito grandes ou complexos para serem tratados por softwares tradicionais de processamento de dados.

Link Wikipédia (em português) e link wikipedia (em inglês)

Leia este post do blog da Exact Sales, que explica a aplicação de big data em vendas. Essa aplicação pode trazer insights para inovação.

Data Science

Data science – ciência de dados:  é uma área interdisciplinar voltada para o estudo e a análise de dados econômicos, financeiros e sociais, estruturados e não-estruturados, que visa a extração de conhecimento, detecção de padrões e/ou obtenção de insights para possíveis tomadas de decisão.

Visite essa comparação entre data science, data analytics e big data

A principal diferença entre Big Data de Data Science é o volume de dados.

Data science define o algoritmo.

O foco do data analytics está na inferência.

Link Wikipédia (em português) e link wikipedia (em inglês)

Data analysis

Data analysis – análise de dados:  é um processo de inspeção, limpeza, transformação e modelagem de dados com o objetivo de descobrir informações úteis, informar conclusões e apoiar a tomada de decisões.

A análise de dados ajuda a entender os dados e fornece insights necessários do passado para entender o que aconteceu até agora.

Business analysis é a aplicação de data analysis na área de negócios.

Link Wikipédia (em português) e link wikipedia (em inglês)

Data analytics

Data analytics (*2), conhecido em português como inteligência analítica: é o processo de descoberta, interpretação e comunicação de padrões significativos em dados para apoiar a tomada de decisão. Baseia-se na aplicação simultânea de técnicas estatísticas, programação de computadores e pesquisa operacional.

Nota (*2): A tradução para o português, análise de dados, confunde-se com a tradução de data analysis, que é diferente de data analytics. Análise de dados, portanto, é polissêmica. Vamos adotar análise de dados como a tradução de data analysis e continuaremos a utilizar o termo data analytics em inglês.

Data Analytics explora os dados do passado (da data analysis) para tomar decisões apropriadas no futuro com base em insights. Data analytics é mais amplo do que data analysis. Data analytics inclui a gestão dos dados e não somente a análise, ou seja, a coleta, organização, armazenamento e a inferência.

Data analytics pode ser considerado um sinônimo de data science, apesar de também ser considerada uma abordagem dentro de data science.

Business analytics é a aplicação de data analytics na área de negócios.

Veja neste link uma lista de ferramentas populares de data analytics, assim como técnicas, tais como:

  • aprendizado por regras de associação
  • análise de árvore de classificação
  • algoritmos genéticos
  • aprendizado de máquina
  • análise de regressão
  • análise de sentimento
  • análise de redes sociais

Link wikipedia (em inglês). Na wikipedia em inglês é utilizado o termo “analytics”. Não existe verbete correspondente em português.

Machine learning (ML)

Machine learning (ML) – aprendizado de máquina: “é o estudo de algoritmos de computador que podem melhorar automaticamente por meio da experiência e do uso de dados. É visto como parte da inteligência artificial. Os algoritmos de aprendizado de máquina constroem um modelo com base em dados de amostra, conhecidos como dados de treinamento, para fazer previsões ou decisões sem serem explicitamente programados para isso”.

É um dos componentes do data analytics

Link Wikipédia (em português) e link wikipedia (em inglês)

Neste post da AEVO você pode ler uma síntese bem pragmática sobre machine learning.

Data mining

Data miningmineração de dados:

“é o processo de explorar dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

No campo da administração, a mineração de dados é o uso da tecnologia da informação para descobrir regras, identificar fatores e tendências-chave, descobrir padrões e relacionamentos ocultos em grandes bancos de dados para auxiliar a tomada de decisões sobre estratégia e vantagens competitivas.

É um tópico recente em ciência da computação, mas utiliza várias técnicas da estatística, recuperação de informação, inteligência artificial e reconhecimento de padrões.”

Link Wikipédia (em português) e link wikipedia (em inglês)

Data warehouse

Data warehousearmazém de dados ou depósito de dados: É considerado o elemento central da inteligência de negócio (business intelligence). “É utilizado para armazenar informações relativas às atividades de uma organização em bancos de dados, de forma consolidada. O desenho da base de dados favorece os relatórios, a análise de grandes volumes de dados e a obtenção de informações estratégicas que podem facilitar a tomada de decisão.

É um componente de big data, data analysis, data analytics, data science, business analysis, business analytics, business intelligence, competitive intelligence, market intelligence, technology intelligence

Link Wikipédia (em português) e link wikipedia (em inglês)

Data mart

Data martrepositório de dados: é um subconjunto de dados de um Data warehouse (ou DW, armazém de dados). Geralmente são dados referentes a um assunto em especial (ex: Vendas, Estoque, Controladoria) ou diferentes níveis de sumarização (ex: Vendas Anual, Vendas Mensal, Vendas 5 anos), que focalizam uma ou mais áreas específicas. Seus dados são obtidos do DW, desnormalizados e indexados para suportar intensa pesquisa. Data marts extraem e ajustam porções de DWs aos requisitos específicos de grupos/departamentos (Wikipédia e wikipedia).

Link Wikipédia (em português) e link wikipedia (em inglês)

Dashboard

Dashboard – “painel de bordo”: “é um tipo de interface gráfica do usuário, que geralmente fornece visualizações rápidas dos principais indicadores de desempenho (KPIs) relevantes para um objetivo ou processo de negócios específico. Em outros usos, dashboard é outro nome para “relatório de progresso” ou “relatório”, sendo considerada uma forma de visualização de dados. O dashboard geralmente é acessível por um navegador da Web e geralmente está vinculado a fontes de dados atualizadas regularmente”.

Link wikipedia (em inglês). Consideramos que o conteúdo da Wikipédia em português é limitado atualmente (visitado em 4/3/2022).

Artificial Intelligence

AI merece uma descrição separada do contexto de BI e analytics, pois é uma abordagem muito ampla, que vai impulsionar inovações em todos os ramos do conhecimento. No entanto, ainda não temos essa descrição à parte. Portanto, vamos nos limitar a definições básicas só para contextualizar que algumas das abordagens listadas anteriormente fazem parte do arcabouço da AI (veja a figura inicial desta seção).

Para você ter uma noção da importância da AI, leia este roadmap publicado pelo governo do Reino Unido sobre a estratégia de AI para os próximos anos.

Extraímos trechos do roadmap citado acima:

  • a AI torna-se um motor cada vez mais importante para o progresso económico e social
  • um elemento crítico será a promoção de um forte ecossistema de ferramentas e serviços para garantir que os sistemas de AI funcionem como deveriam.
  • será necessária uma abordagem de auditoria para permitir que empresas, consumidores e reguladores saibam se os sistemas de IA são eficazes, confiáveis e legais.
  • AI adicionará 10,3% ao PIB do Reino Unido entre 2017 e 2030.
  • sem confiança, consumidores e cidadãos também ficarão relutantes em aceitar produtos e serviços baseados em AI e em dados (data driven), ou em compartilhar os dados necessários para construir esses produtos ou servi

Definições básicas

Artificial Intelligence (AI) – inteligência artificial (IA): é a inteligência exibida por sistemas de software, em oposição à inteligência natural exibida por animais, incluindo humanos.

Link Wikipédia (em português) e link wikipedia (em inglês)

Os dois verbetes da wikipedia são bem completos.

“É a capacidade do sistema para interpretar corretamente dados externos, aprender a partir desses dados e utilizar essas aprendizagens para atingir objetivos e tarefas específicas através de adaptação flexível” (Kaplan & Haenlein, 2019).

Veja pela figura no início desta seção, que a IA abrange várias abordagens citadas anteriormente.

Fontes adicionais

O site da IBM apresenta uma definição bem completa do que é inteligência artificial.

Neste link de acesso a materiais gratuitos do blog da AEVO, você pode fazer o download de um guia de bolso sobre AI (entre outros), que é bem pragmático.

Statistics & Mathematics

Não vamos colocar aqui as definições dessas duas disciplinas (veja o significado de disciplina), pois são bem amplas. Elas foram colocadas na figura para destacar, que muitas abordagens utilizam os conceitos dessas disciplinas.

#printfriendly a { color: blue !important; text-decoration: underline !important; } #printfriendly i, #printfriendly em { color: purple !important; } @media print { .break-page-before { page-break-before: always !important; } h1 { page-break-before: always !important; font-size: 32px !important; } div.no-page-break-before h1, div.no-break-page-before h1 { page-break-before: avoid !important; } }