Alinhamento da IA – um curso introdutório

Para ver os demais cursos sobre IA disponibilizados, clique aqui.

Não sabe nada sobre esse tema? Então recomendamos que comece assistindo a este vídeo.

Faça este curso para entender o alinhamento da IA e os riscos extremos impostos pelo desalinhamento da IA.

O currículo foi desenvolvido com Richard Ngo (OpenAI) com a contribuição de vários especialistas na área do alinhamento como David Krueger (Universidade de Cambridge), Adam Gleave (FAR) e Beth Barnes (Alignment Research Center Evals). Veja no nosso site quem mais está envolvido.

No fim deste curso, você deve ser capaz de entender uma variedade de pautas no Alinhamento da IA e tomar decisões informadas sobre os seus próximos passos para se envolver com a área.

Visão geral do curso

Começamos explorando qual é o estado atual dos sistemas de IA gerais (p. ex., sistemas fundamentais) e qual pode ser o seu estado no futuro. Daí investigaremos problemas fundamentais de alinhamento como má especificação de recompensa e má generalização de objetivo, alguns exemplos deles e por que eles podem levar a resultados indesejáveis ou até catastróficos.

A última metade do curso cobre quatro técnicas com o objetivo de prevenir o desalinhamento e as limitações dessas técnicas, seguidas de pesquisas que tentam entender sistemas de aprendizado de máquina a um nível mais profundo, incluindo a interpretabilidade e os fundamentos da agência.

Finalmente, cobriremos dois tópicos em alto nível: a governança da IA e carreiras no alinhamento. (Observe que também temos um curso completo sobre governança da IA.)

Tempo

Esperamos que em cada seção leve 2-4 horas para interagir com todos os materiais (16-32 horas ao todo). Além disso, há exercícios para ajudar você a passar pelos tópicos por si mesmo e fazer progresso no seu aprendizado sobre o alinhamento da IA. Organizamos o conteúdo em semanas para ajudar você a se manter a par do seu envolvimento com o currículo. Ao final deste curso, você deve ser capaz de entender uma gama de pautas no Alinhamento da IA e tomas decisões informadas sobre os seus próximos passos para se envolver com a área.

Sessão 0: Introdução ao Aprendizado de Máquina

Sessão 1: Inteligência Geral Artificial

Sessão 2: Erro de Especificação da Recompensa e Convergência Instrumental

Sessão 3: Erro de Generalização do Objetivo

Sessão 4: Decomposição da Tarefa para Supervisão Amplificável

Sessão 5: Técnicas Adversárias para Supervisão Amplificável

Sessão 6: Interpretabilidade

Sessão 7: Governança

Sessão 8: Fundamentos da Agência

Sessão 9: Carreiras e Projetos


Esse conteúdo foi traduzido a partir do curso original de Alinhamento da IA elaborado pela Bluedot Impact e publicado originalmente no ano de 2023 aqui. Eventuais divergências entre os textos aqui traduzidos e os encontrados na página podem ocorrer, dado que o curso passa por constantes atualizações. Caso encontre algum conteúdo incorreto, link quebrado ou tenha uma sugestão de melhoria da tradução, pedimos que entre em contato pelo e-mail: altruismoeficazbrasil@gmail.com

This is our translation of work done by BlueDot Impact as of September 2023. You can see the original material here.

Deixe um comentário