Inteligência artificial & Ciência de dados

Janete Ribeiro
3 min readOct 6, 2021
fonte: SIC

Muitas pessoas olham a Ciência de dados e a inteligência Artificial como se fossem disciplinas completamente distintas. Como se uma coisa não tivesse ligação com a outra. Talvez essa seja uma das causas para que haja tanta confusão em relação ao uso destas duas ferramentas na gestão de negócios e na sociedade como um todo.

Para esclarecer esse equívoco, veja o infográfico a seguir:

fonte: Getty Images adaptado

A Ciência de Dados alimenta a Inteligência Artificial. E a Inteligência Artificial organiza a Ciência de Dados.

Existe uma interdependência entre as duas práticas. Como já comentei em outros artigos, a inteligência artificial praticada hoje são algoritmos matemáticos baseados em estatística probabilística. Para que esses algoritmos trabalhem precisam de volumes significativos de “dados” que representem o ambiente do problema ou pergunta que desejamos que o algoritmo nos dê uma solução ou confirmação de uma hipótese. E quando o algoritmo responde a essa “pergunta” ele gera “dados” que podem despertar novas “perguntas”.

Trata-se de um círculo virtuoso quando bem utilizado. A ressalva sobre “quando bem utilizado”, existe devido aos riscos que podem ocorrer quando quem manipula os dados, ou quem desenvolve os algoritmos não se atenta a qualidade dos dados.

E o que seria essa qualidade dos dados? Quando falamos sobre os dados representarem o ambiente do estudo, estamos falando de buscar uma amostra de dados onde as características do ambiente estejam representadas de forma muito parecida com a realidade.

Um exemplo prático:

Quando desenvolvemos um algoritmo de Inteligência Artificial para identificar pessoas (imagens).

fonte: Getty images

Precisamos ter neste banco de dados de imagens a maior variedade possível de características humanas. Isso significa ter por exemplo, imagens de pessoas de todas as raças, todas idades, com vestimentas de todas as culturas, religiões. Enfim, que represente a espécie como nós humanos somos capazes de nos reconhecer.

Nem sempre conseguimos ter uma amostra de dados tão completa para treinar nossos algoritmos, por isso é necessário construir essas bases selecionando dados das mais diversas fontes para criar a amostra ideal, com o mínimo de “viés” possível.

Por vezes uma falha involuntária nesse processo de preparação dos dados, como por exemplo, um cientista de dados muito jovem que não conheça várias possibilidades de culturas além daqueles presentes na sua região de origem, pode selecionar o que ele conhece de informação e treinar o algoritmo com uma base de imagens da visão “que ele tem” do mundo. Ele não estava discriminando ninguém, ele simplesmente desconhece diversas culturas, não porque as despreze, mas porque não viveu tempo suficiente na Terra para saber que elas existem.

Por isso, o trabalho do cientista de dados, do engenheiro de dados e do especialista em inteligência artificial vai além do conhecimento de técnicas matemáticas e linguagens de programação. Para se garantir a ética do uso da Inteligência Artificial e do tratamento e adequação dos Dados que a alimentam é fundamental uma base cultural diversificada.

fonte: shutterstock

Por essa razão as equipes de projetos que envolvem ciência de dados e inteligência artificial necessitam fundamentalmente dessa diversidade de culturas, gêneros e idade. Dificilmente um grupo com características sociais muito semelhantes terá uma visão ampla sobre as diversidades do planeta.

Sendo assim, podemos concluir que a Ciência de Dados e a Inteligência Artificial antes mesmo de serem praticadas já exercem uma forte mudança no comportamento humano. Nos obriga a sermos colaborativos e a trabalharmos nossa capacidade de aceitação das diferenças.

Site InnovationInsider — https://innovationinsider.com.br/ha-etica-e-diversidade-na-inteligencia-artificial/

--

--

Janete Ribeiro

Analytics Data Services CEO, Chief Data Officer Certified by MIT, MsC Business Administration, SENAC University Professor