Ciência de Dados

A Ciência de Dados tornou-se a sustentação dos processos de transformação digital e da Quarta Revolução Industrial. Sendo um campo multidisciplinar, formado pela junção de áreas disciplinares independentes como Ciência da Informação e Ciência da Computação, Ciências Cognitivas, Matemática e Estatística, utiliza métodos, processos, algoritmos, análise de dados e aprendizado de máquina, para extrair conhecimento e insights de dados de variadas formas e origens.
 
Atualmente, o termo Ciência da Dados apresenta forte polissemia, devido, principalmente, ao fato de ser um campo amplo e multidisciplinar, abrangendo diversas disciplinas como Ciência da Computação, Ciência da Informação, Ciências Cognitivas, além de áreas da Matemática, como lógica, estatística e análise de redes complexas, entre outras.
 
A Ciência de Dados, ao tornar-se a sustentação de uma tecnologia pervasiva, tornou-se também um termo amplamente empregado, por vezes de forma equivocada, reduzindo o seu significado ao simples uso de ferramentas de BI (Business Intelligence), de BA (Business Analytics) ou de ETL (Extração, transformação e Carga de dados). Naturalmente, o emprego desses tipos de ferramentas é característico de Projetos de Ciência de Dados, porém o campo da Ciência de Dados é conceitualmente mais amplo.
 
Por uma perspectiva de maturidade tecnológica, Projetos de Ciência de Dados são em sua essência projetos de inovação. Possuindo características específicas e necessidades próprias dos projetos de PD&I, que os distinguem de outros projetos mais tradicionais da área de Tecnologia da Informação, tanto de sistemas transacionais como também de projetos de Business Intelligence, os projetos de Ciência de Dados requerem metodologias de desenvolvimento e metodologias de gestão de projetos próprias para a sua execução.
 
Diferentemente de projetos tradicionais de desenvolvimento de software, nos quais define-se previamente um conjunto de requisitos que permitem estimar escopo, esforço, prazo e custo antes de seu início efetivo, projetos de Ciência de Dados e de Inteligência Artificial, enquadrados como projetos de inovação tecnológica, possuem incertezas inerentes à sua natureza, que dificultam ou impossibilitam realizar tais estimativas previamente.
 
A Ciência de Dados sendo um campo multidisciplinar, formado pela junção de áreas disciplinares independentes, exige necessariamente diferentes tipos de perfis e competências para o desenvolvimento e a implementação de Projetos de Ciência de Dados, conforme representado na figura 3, a seguir.
Metodologias mais utilizadas para projetos de Ciência de Dados
Assim, projetos de Ciência de Dados e de IA exigem para o seu desenvolvimento e implementação três perfis profissionais, de áreas distintas, com as competências descritas a seguir, que devem atuar em estreita colaboração:

• Cientista de Dados: pesquisador com profundos conhecimentos e experiência em pesquisa básica e aplicada, e em disciplinas específicas da matemática, com destaque para a Estatística e Análise de Redes, e capacidade para selecionar, testar, entender o funcionamento, alterar, criar e calibrar algoritmos;
• Especialistas na área de domínio do negócio: especialistas nos diversos aspectos da área de domínio, sejam de ordem técnica, administrativa, jurídica, comercial ou financeira, analista de negócios e processos;
• Especialistas em Ciência da Computação e Tecnologia da Informação: engenheiro, arquiteto ou analista de dados, responsável pela execução das fases de entendimento e preparação de dados, com a experiência necessária para o trabalho de modelagem da solução, em conjunto com o cientista de dados.

O entendimento profundo das áreas de atuação e áreas de negócio da instituição, e de seus respectivos processos organizacionais, objetivo da primeira das fases metodológicas para o desenvolvimento de Projetos de Ciência de Dados, serão os insumos para a formulação das perguntas estratégicas que o projeto pretenderá responder. Para a obtenção de resultados relevantes, é necessário que se consiga fazer as perguntas certas. E, para isso, torna-se necessária a participação ativa de especialistas nas áreas de domínio em estudo, com competência para identificar, selecionar e priorizar os problemas a serem tratados.

Quais as características mais significativas de Projetos de Ciência de Dados?
• Baseia-se na descoberta de padrões de comportamento e correlações entre variáveis, normalmente difíceis de serem percebidos pelo ser humano, utilizando bases dados estruturados e não estruturados;
• Fornece novos entendimentos e perspectivas diferentes de observação de um problema, que potencializam descobertas e resultados inovadores, normalmente não disponíveis por outras abordagens;
• Permite a realização de predições de comportamento futuro com maior acuracidade que Aplicações de BI.
• Apoio significativo em processos de tomada de decisão.

Mais informações em: Desenvolvimento de Projetos de Data Science

Inteligência Artificial

Ao longo do tempo as definições e o entendimento do que seria a Inteligência Artificial (IA) tem sofrido profundas alterações. Atualmente, considera-se a IA como a capacidade de um sistema interpretar dados corretamente, aprender e adaptar-se a partir desses dados, tendo por objetivo cumprir tarefas específicas, com altos índices de automação.

Assim como ocorre com Ciência de Dados, a Inteligência Artificial também tornou-se um termo difuso, que engloba sob esse significado vários tipos de aplicações, de tecnologias e de técnicas de trabalho. As primeiras referências à Inteligência Artificial remetem à Conferência que definiu a área em 1956, no Dartmouth College, em New Hampshire, realizada como resultado de proposta elaborada em agosto do ano anterior por grandes nomes da época como Marvin Minsky (1927-2016) e Claude Shannon (1916-2001). Em seus primórdios, a Inteligência Artificial seguiu por dois caminhos distintos – os Sistemas Especialistas, baseados em heurísticas, e as Redes Neurais Artificiais.

Como exemplos de aplicações de Inteligência Artificial, podemos citar a detecção, reconhecimento e classificação sons e vozes, imagens e vídeos, detecção e localização de objetos, identificação e reconhecimento de faces e pessoas, análise de sentimentos e reconhecimento de emoções, geração de conteúdo, processamento de linguagem natural, compreendendo nesse caso o reconhecimento ótico de caracteres e de escrita à mão, interpretação linguística, tradução de idiomas, conversão da fala em texto e vice-versa. Quase todos os exemplos acima podem ser classificados como reconhecimento de padrões, uma das principais aplicações de IA.

De modo geral, aplicações de IA permitem inferir possibilidades de simplificar, de melhorar e dar celeridade a processos complexos, caros e de elevado esforço humano, por meio da automação de tarefas repetitivas e automatizáveis.

As aplicações de Inteligência Artificial podem ser supervisionadas, atuando em conjunto com o ser humano, ou não supervisionadas, atuando de modo autônomo. Quanto às tecnologias e técnicas empregadas em projetos de Ciência de Dados e de Inteligência Artificial, temos alguns exemplos como Big Data, Data Analytics, Análise de Redes Semânticas e de Similaridade Textual, Análise de Redes Complexas, Aprendizado de Máquina, incluindo nesse caso as técnicas de Machine Learning e Deep Learning, além de diversas técnicas para a construção, seleção e escolha de modelos matemáticos e algoritmos.

Aplicações Supervisionadas e Aplicações Não Supervisionadas:
Aplicações Supervisionadas: projetadas para atuarem como assistentes especializados das mais diversas áreas de atividade humana, automatizando tarefas repetitivas e apoiando processos de tomada de decisão. Exemplos: Assistentes Jurídicos, Assistentes Tributários.
Aplicações Não Supervisionadas: projetadas para atuarem de forma independente de supervisão humana, tomando decisões por conta própria, geralmente calibradas por níveis de threshold. Exemplos: Identificação de procurados em aeroportos (Visão artificial), automóveis de direção autônoma completa.

Em termos acadêmicos, a Inteligência Artificial pode ainda ser classificada como IA-Fraca e IA-Forte:
IA-Fraca: simula comportamentos humanos considerados inteligentes, por meio de algoritmos, caracterizados como uma sequência fixa de regras lógicas, com rigidez determinante para que não hajam capacidades verdadeiras de raciocínio ou autoconsciência. Todas as aplicações atuais de Inteligência Artificial são dessa categoria.
IA-Forte: as pesquisas nessa área estudam a possibilidade da concepção e construção de máquinas que fossem de fato cognitivamente indiferenciáveis de seres humanos, e que pudessem ser classificadas como autoconscientes. Em princípio, esse tipo de equipamento deveria ser capaz de alterar e adaptar os seus próprios algoritmos. O tema permanece bastante controverso.

Mais informações em: Desenvolvimento de Projetos de Data Science