Curso de Governança da IA – Texto Introdutório da Semana 1

Semana 1: Introdução à IA e ao Aprendizado de Máquina

O que aconteceu nos últimos 10 anos de aprendizado de máquina (machine learning, ML)? Quão significativos são os desenvolvimentos recentes com modelos fundamentais e ferramentas como o ChatGPT, e podemos esperar que o progresso continue?

Esta semana introduz os conceitos técnicos básicos de aprendizado de máquina, que é a abordagem dominante à IA. O objetivo geral é obter uma compreensão de alto nível da própria tecnologia, antes de avançarmos para entender os riscos e soluções de governança nas próximas partes do curso.

Os materiais devem ser úteis para leitores não técnicos e leitores técnicos que são novos no aprendizado de máquina ou que se beneficiariam de uma visão geral ampla do campo.

Até o final da sessão, você deve ser capaz de:
  • Explicar o básico do que são redes neurais, como elas são treinadas e como elas fazem inferências. Como resultado, você deverá estar razoavelmente confortável em ter discussões não técnicas sobre aprendizado de máquina.
  • Descrever alguns desenvolvimentos cruciais nas capacidades da IA na década passada, com exemplos. Usar esse conhecimento para poder fazer previsões iniciais sobre quais desenvolvimentos podem ocorrer na próxima década.
  • Descrever a importância de algoritmos, poder computacional e dados no avanço da IA:
    • Entender a diferença entre aprendizado supervisionado, aprendizado não supervisionado e aprendizado por reforço;
    • Descrever como o poder computacional mudou durante a década passada e por que isso foi importante para o progresso do ML;
    • Descrever o papel que dados desempenharam no progresso do ML na década passada.

Recursos (cerca de 1 h 37 min)

A tríade da IA e o que isso significa para a estratégia de segurança nacional de Ben Buchanan (2020) [Relatório]

Tempo estimado: 21 min

Leia o resumo executivo e a seção “A Tríade da IA”

Este relatório do Centro de Segurança e Tecnologia Emergente da Universidade de Georgetown explica e analisa os três principais fatores que impulsionam os avanços em IA: algoritmos, dados e poder computacional.

Visualizando a revolução do aprendizado profundo de Richard Ngo (2023) [Blog]

Tempo estimado: 15 min

Este artigo analisa os avanços rápidos em IA que ocorreram na última década, com muitos exemplos. Utilize este recurso para compreender o ritmo de desenvolvimento e considere quais avanços podem ser feitos na próxima década.

Você também pode estar interessado neste site interativo.

Mas o que é uma rede neural? de 3Blue1Brown (2017) [Vídeo]

Tempo estimado: 20 min

O âmago de um sistema de IA moderno é uma rede neural, um tipo de programa de computador cujo design é vagamente inspirado no cérebro humano. Este vídeo introduz visualmente o que são esses programas.

Este vídeo deve ajudar você a entender a terminologia mencionada posteriormente no curso, mas você não precisa desenvolver uma compreensão técnica profunda.

Descida do gradiente, como as redes neurais aprendem de 3Blue1Brown (2017) [Vídeo]

Tempo estimado: 20 min

Os engenheiros não especificam diretamente como as redes neurais devem processar suas entradas. Em vez disso, eles as treinam com exemplos. Este vídeo explica visualmente como isso funciona.

Novamente, não é necessário ter uma compreensão técnica profunda.

Uma breve introdução ao aprendizado de máquina de Richard Ngo (2021) [Blog]

Tempo estimado: 11 min

A Tríade da IA menciona muitas técnicas e termos de ML; esta introdução ajudará você a solidificar seu entendimento desses termos. Ela define muitos termos que surgem frequentemente na IA moderna e explica como eles estão relacionados.

Novamente, o objetivo dos recursos desta semana é fornecer uma compreensão de alto nível do aprendizado profundo.

Como o ChatGPT funciona tecnicamente da ByteByteGo (2023) [Vídeo]

Tempo estimado: 8 min

Agora que estudamos o que são redes neurais, este vídeo explica, em um alto nível, como o ChatGPT foi treinado e como ele é operado. Essa abordagem de treinamento de alto nível é usada para muitos dos modelos de linguagem de ponta atuais.

Embora os modelos de linguagem atuais em meados de 2023 possam apresentar riscos de segurança limitados, essas abordagens podem ser desenvolvidas para criar IA mais capaz que oferece maiores riscos e oportunidades.

GPT significa “Generative Pretrained Model”, Modelo Pré-Treinado Generativo em inglês, e é um exemplo de IA generativa. Isso significa que ele é capaz de criar (ou “gerar”) novos conteúdos a partir de uma entrada (às vezes chamada de “prompt”). Ele gera novos conteúdos prevendo a próxima saída mais provável com base na sequência precedente e de acordo com seus dados de treinamento.

Exercício


Link para o original

Tradução: Luan Marques

Deixe um comentário