Revolução da Inteligência Artificial

– o papel da Matemática

Inscrições: https://forms.gle/kHgz9Wn8mGKZqSw7A

Informações: acm@acm-itea.org

A inteligência artificial (IA) está presente hoje em muitas áreas da ciência e do mercado e, mais que isso, está presente no dia-a-dia de todos nós, desde smartphones até os veículos mais modernos. Sendo assim, não havia como a matemática não ser diretamente influenciada por essa revolução. Nesta apresentação, abordaremos como essas duas áreas fundamentais podem se relacionar em dois sentidos: 1º como teorias matemáticas avançadas (topologia, por exemplo) podem levar ao desenvolvimento de técnicas poderosas de IA; 2º como a IA pode auxiliar matemáticos a novos teoremas/conjecturas, por exemplo, solver problemas em geral, auxiliando na prova e na “descoberta” de novos teoremas e conjecturas.

A interseção entre Matemática e Inteligência Artificial (IA) remonta aos primórdios da computação. Alan Turing, em seu trabalho seminal “Computing Machinery and Intelligence”, lançou as bases teóricas para a inteligência artificial ao propor o famoso “Teste de Turing”. Este teste estabeleceu um marco conceitual para a avaliação da inteligência das máquinas, destacando a importância da lógica e da computação na imitação do pensamento humano (Turing, 1950). Posteriormente, o desenvolvimento da teoria dos autômatos e das linguagens formais por nomes como Alonzo Church e Emil Post proporcionou uma base matemática sólida para a modelagem de processos computacionais, influenciando diretamente a IA.

Decididamente a Inteligência Artificial (IA) se encontra em um momento de rápida evolução, impulsionada por avanços significativos na área da Matemática. Essa profunda interconexão tem sido fundamental para o desenvolvimento de algoritmos mais eficientes, modelos de aprendizado de máquina mais robustos e sistemas de IA mais inteligentes.

Desvendando as Raízes Históricas

A matemática tem desempenhado um papel crucial na IA desde seus primórdios. Alan Turing, considerado um dos pais da IA, propôs a Máquina de Turing em 1936-1937, um modelo teórico que deu base à computação moderna e à IA. O trabalho de Turing influenciou outros pioneiros da IA, como John von Neumann e Marvin Minsky, que reconheceram a importância da matemática para formalizar e analisar problemas de IA.

No entanto, foi com o advento do aprendizado de máquina que a relação entre Matemática e IA se intensificou. O teorema de Bayes, redescoberto por Claude Shannon em seu trabalho sobre teoria da informação, tornou-se fundamental na formulação de algoritmos de classificação probabilística, como os classificadores bayesianos. Além disso, o desenvolvimento da teoria dos grafos por Euler e subsequentemente por Claude Shannon na teoria da informação foi crucial para a representação e análise de redes neurais artificiais (Shannon, 1948).

Outro marco importante foi a formalização do conceito de redes neurais artificiais. O trabalho pioneiro de McCulloch e Pitts sobre neurônios artificiais em 1943 estabeleceu os fundamentos matemáticos para o desenvolvimento posterior de modelos de redes neurais. Esta abordagem foi posteriormente aprimorada por Frank Rosenblatt com o Perceptron, uma das primeiras arquiteturas de rede neural capazes de aprender padrões complexos (McCulloch & Pitts, 1943; Rosenblatt, 1958).

Ao longo do século XX, matemáticos e cientistas da computação contribuíram significativamente para o desenvolvimento da IA. Claude Shannon, pai da teoria da informação, introduziu conceitos matemáticos essenciais para a compressão de dados, comunicação e processamento de linguagem natural. Andrey Kolmogorov e Solomon Kullback desenvolveram medidas de informação que são usadas para avaliar o desempenho de algoritmos de aprendizado de máquina.

Explorando Novas Fronteiras

A matemática fornece uma estrutura rigorosa para o estudo da IA permitindo formular hipóteses precisas, analisar resultados e desenvolver teorias robustas. Através da matemática, os pesquisadores podem explorar as propriedades fundamentais dos algoritmos de IA, entender seus limites e identificar novos caminhos para o aperfeiçoamento da tecnologia.

Um exemplo notável é o trabalho de Yoshua Bengio, Geoffrey Hinton e Yann Le Cun, pioneiros do aprendizado profundo, que demonstraram o poder da matemática para treinar redes neurais artificiais em tarefas complexas como visão computacional e reconhecimento de fala. A matemática também é fundamental para o desenvolvimento de algoritmos de aprendizado de máquina mais eficientes e escaláveis, que podem lidar com grandes conjuntos de dados e problemas computacionalmente intensivos.

Assim, a área da IA tem sido impulsionada por avanços significativos na teoria matemática. O renascimento da aprendizagem profunda nas últimas décadas foi catalisado pela teoria dos gradientes estocásticos, que fornece uma estrutura matemática para otimizar eficientemente os parâmetros de modelos de redes neurais profundos. Aqui, os autores acima referidos desempenharam papéis fundamentais no desenvolvimento e popularização dessas técnicas, elevando a aprendizagem profunda a novos patamares de desempenho (Hinton et al., 2006; Cun et al., 2015; Bengio et al., 2009).

Além disso, a teoria da probabilidade e estatística desempenha um papel crucial na modelagem e interpretação de dados em IA. A inferência estatística bayesiana, em particular, tem sido cada vez mais utilizada para aprimorar a robustez e a incerteza de modelos de IA, permitindo uma tomada de decisão mais informada em ambientes complexos e dinâmicos. Autores como Judea Pearl e David MacKay contribuíram significativamente para a aplicação da teoria bayesiana em IA (Pearl, 1988; MacKay, 2003).

Por fim, a teoria da computação desempenha um papel fundamental na compreensão dos limites da inteligência artificial. Autores como John McCarthy e Marvin Minsky, pioneiros no campo da IA, exploraram os conceitos de computabilidade e complexidade, estabelecendo os fundamentos matemáticos para a análise da eficácia e escalabilidade de algoritmos de IA (McCarthy & Minsky, 1956).

Construindo e Testando Soluções

Na prática, os avanços na IA muitas vezes exigem experimentação rigorosa e validação empírica. A abordagem experimental na IA é fortemente fundamentada em princípios estatísticos, com técnicas de validação cruzada e bootstrapping desempenhando um papel central na avaliação e comparação de algoritmos de aprendizado de máquina. Autores como Trevor Hastie, Robert Tibshirani e Jerome Friedman são conhecidos por seu trabalho seminal em métodos estatísticos para aprendizado de máquina (Hastie et al., 2009).

Ademai, a implementação eficiente de algoritmos de IA muitas vezes requer conhecimentos avançados de álgebra linear e cálculo numérico. Autores como Gene Golub e Charles Van Loan são figuras proeminentes neste campo, com sua obra clássica “Matrix Computations” sendo uma referência fundamental para a implementação eficiente de algoritmos de álgebra linear em IA (Golub & Van Loan, 2013).

Outro aspecto importante dos enfoques experimentais em IA é a interpretabilidade e a explicabilidade dos modelos. Autores como Cynthia Rudin e Rich Caruana têm explorado técnicas para tornar os modelos de IA mais transparentes e interpretables, permitindo uma compreensão mais profunda de como as decisões são tomadas (Rudin, 2019; Caruana et al., 2015).

Indiscutivelmente, a matemática fornece ferramentas poderosas para projetar, implementar e avaliar experimentos em IA. Através da modelagem matemática, os pesquisadores podem prever o comportamento de algoritmos de IA identificar parâmetros críticos e otimizar o desempenho dos sistemas. A matemática também é utilizada para analisar dados de experimentos, extrair insights e validar resultados.

A matemática também é fundamental para o desenvolvimento de técnicas de validação cruzada e seleção de modelo, que garantem que os resultados dos experimentos sejam confiáveis e generalizáveis. A título de exemplo relembre-se o uso de métodos estatísticos para avaliar a precisão de modelos de aprendizado de máquina em tarefas de classificação e regressão.

Transformando o Mundo

A interseção entre Matemática e IA tem gerado uma ampla gama de aplicações e utilidades em diversas áreas. Na saúde, a análise de imagens médicas utilizando técnicas de aprendizado profundo tem permitido diagnósticos mais precisos e rápidos de doenças como câncer e doenças cardíacas (Litjens et al., 2017). Na indústria automobilística, algoritmos de IA são usados para aperfeiçoar sistemas de condução autônoma, aumentando a segurança nas estradas (Ko et al., 2017). Nas finanças, modelos de IA são aplicados para prever tendências de mercado e otimizar carteiras de investimento, proporcionando ganhos significativos para investidores (Zhang et al., 2019). Na educação, sistemas de tutoria inteligente baseados em IA personalizam o ensino para cada aluno, melhorando a eficácia do aprendizado (van Lehn, 2011). Na agricultura, algoritmos de IA são utilizados para otimizar o cultivo de culturas, maximizando a produção e minimizando o uso de recursos (Gebbers & Adamchuk, 2010).

A matemática está na base de diversas aplicações de IA que impactam nossa vida cotidiana. Algoritmos de IA baseados em matemática são usados em sistemas de reconhecimento facial, carros autônomos, tradutores de idiomas, sistemas de recomendação e muitas outras áreas. A matemática também é fundamental para garantir a segurança, confiabilidade e robustez dos sistemas de IA evitando vieses e discriminação algorítmica.

Aplicações e Projetos

  1. Visão Computacional: A matemática é usada para desenvolver algoritmos que podem extrair informações de imagens e vídeos, como reconhecimento de objetos, detecção de faces e análise de cenas.
  2. Processamento de Linguagem Natural: A matemática é utilizada para desenvolver algoritmos que podem entender e gerar linguagem humana, como tradução automática, chatbots e análise de sentimento.
  3. Aprendizado de Máquina: A matemática é fundamental para o desenvolvimento de algoritmos que podem aprender com dados, como previsão de séries temporais, detecção de anomalias e classificação de texto.
  4. Robótica: A matemática é usada para controlar robôs e torná-los capazes de realizar tarefas complexas, como manipulação de objetos, navegação autônoma e interação com o ambiente.
  5. Bioinformática: A matemática é utilizada para analisar dados biológicos, como sequências de DNA e proteínas, para identificar padrões e fazer descobertas científicas.

Referências Bibliográficas

  • Amari and Karakota. Information Theory and Statistical Learning (2006). Academic Press.
  • Bengio, Y. (2016). Deep learning. MIT press.
  • Bengio, Y., Courville, A., & Vincent, P. (2009). “Unsupervised Feature Learning and Deep Learning: A Review and New Perspectives.” IEEE Transactions on Pattern Analysis and Machine Intelligence, 35(8), 1798-1828.
  • Bishop, Christopher. Pattern Recognition and Machine Learning (2013). Springer.
  • Caruana, R., Lou, Y., Gehrke, J., Koch, P., Sturm, M., & Elhadad, N. (2015). “Intelligible Models for Healthcare: Predicting Pneumonia Risk and Hospital 30-Day Readmission.” Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 1721-1730.
  • Cun, Y. Le, Bengio, Y., & Hinton, G. (2015). “Deep Learning.” Nature, 521(7553), 436-444.
  • Cun, Yann Le et al.. A Neural Network Architecture for Speech Recognition (1990). Proceedings of the IEEE.
  • Deisenroth, Faisal, and Ong. Mathematics for Machine Learning (2014). Cambridge University Press.
  • Gebbers, R., & Adamchuk, V. I. (2010). “Precision Agriculture and Food Security.” Science, 327(5967), 828-831.
  • Golub, G. H., & Van Loan, C. F. (2013). Matrix Computations. Johns Hopkins University Press.
  • Goodfellow, Ian J. et al. Generative Adversarial Networks (2014). Proceedings of the IEEE.
  • Hastie, T., Tibshirani, R., & Friedman, J. (2009). The Elements of Statistical Learning: Data Mining, Inference, and Prediction. Springer.
  • Hinton, G. E., & Salakhutdinov, R. R. (2006). Reducing the dimensionality of data through supervised learning. Science, 313.
  • Hinton, G. E., Osindero, S., & Teh, Y. W. (2006). “A Fast Learning Algorithm for Deep Belief Nets.” Neural Computation, 18(7), 1527-1554.
  • Ko, H., Lee, H., Shin, J., & Choi, J. (2017). “A Survey on Deep Learning-based Autonomous Driving: Challenges and Opportunities.” arXiv preprint arXiv:1711.07747.
  • Krizhevsky, Alex et al. Deep Convolutional Neural Networks for Image Classification (2014). Advances in neural information processing systems.
  • Krizhevsky, Alex et al. Learning Deep Architectures for Image Recognition (2012). Advances in neural information processing systems.
  • Lehn, K. van (2011). “The Relative Effectiveness of Human Tutoring, Intelligent Tutoring Systems, and Other Tutoring Systems.” Educational Psychologist, 46(4), 197-221.
  • Litjens, G., Kooi, T., Bejnordi, B. E., Setio, A. A. A., Ciompi, F., Ghafoorian, M., … & Sanchez, C. I. (2017). “A Survey on Deep Learning in Medical Image Analysis.” Medical Image Analysis, 42, 60-88.
  • MacKay, D. J. (2003). Information Theory, Inference, and Learning Algorithms. Cambridge University Press.
  • McCarthy, J., & Minsky, M. L. (1956). “Some Philosophical Problems from the Standpoint of Artificial Intelligence.” In Readings in Artificial Intelligence, 431-450.
  • McCulloch, W. S., & Pitts, W. (1943). “A Logical Calculus of the Ideas Immanent in Nervous Activity.” Bulletin of Mathematical Biophysics, 5(4), 115-133.
  • Pearl, J. (1988). Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan Kaufmann Publishers.
  • Rosenblatt, F. (1958). “The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain.” Psychological Review, 65(6), 386-408.
  • Rudin, C. (2019). Stop Explaining Black Box Machine Learning Models for High Stakes Decisions and Use Interpretable Models Instead. Nature Machine Intelligence, 1(5), 206-215.
  • Shannon, C. E. (1948). “A Mathematical Theory of Communication.” The Bell System Technical Journal, 27(3), 379-423.
  • Stuart Russell e Peter Norvig. Artificial Intelligence: A Modern Approach (2016). Pearson Education.
  • Turing, A. M. (1950). “Computing Machinery and Intelligence.” Mind, 49(236), 433-460.
  • Vaswani, Ashish, et al. Attention Is All You Need (2017). Advances in neural information processing systems.
  • Zhang, Y., Bao, Y., Zheng, Y., Xu, X., & Zong, Z. (2019). “Financial Time Series Forecasting with Deep Learning: A Systematic Literature Review: 2008–2019.” Applied Soft Computing, 93, 106282.

Nota: Parte do texto foi produzida em sinergia com IA.

João Batista Florindo

Atualmente é Professor Associado no Instituto de Matemática, Estatística e Computação Científica (IMECC) da Universidade Estadual de Campinas (Unicamp). Possui pós-doutorado em Física Computacional pelo Instituto de Física de São Carlos (IFSC) da Universidade de São Paulo (USP) (2016), estágio pós-doutoral na University of Birmingham (Inglaterra) (2014/2015), doutorado (2013) e mestrado (2009) pelo IFSC/USP e bacharelado em Ciências de Computação pelo Instituto de Ciências Matemáticas e de Computação (ICMC/USP) (2006).

Tem experiência nas áreas de Matemática Computacional e Ciência da Computação, atuando principalmente nos seguintes temas: redes neurais profundas, análise de imagens digitais e séries temporais, medidas de generalização de redes neurais e aplicações em imagens biológicas.

Conta atualmente com 73 trabalhos indexados no Scopus e Web of Science (FATOR H 15), publicados em revistas e conferências internacionais respeitadas em áreas como Computação, Medicina e afins.

Em seu trabalho, tem contado também com parcerias internacionais comas universidades Incheon National University (Coreia do Sul e, Birmingham (Reino Unido), além de colaborações com a Faculdade de Ciências Médicas da Unicamp e outras universidades brasileiras, entre elas, unidades da USP/São Carlos, USP/São Paulo, UFU, UTFPR, UFPR, entre outras.

Foi grantee do Instituto Serrapilheira em 2019 e no momento é pesquisador associado do centro FAPESP de inteligência artificial BIOS (Brazilian Institute of Data Science).

É também membro da diretoria da Academia Brasileira de Jovens Cientistas.

Deixe um comentário

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.