Se você trabalhar na governança de IA, é provável que faça pontes entre desafios técnicos e sociais no desenvolvimento de IA e políticas públicas. Logo, é importante entender os riscos subjacentes.
Neste exercício, você praticará a defesa de um risco de IA para um público (neste caso, representantes eleitos) que tem várias prioridades concorrentes.
Para este exercício, escreva uma introdução a uma recomendação de política (observe que não fará uma recomendação de política real; só está escrevendo um pano de fundo/seção de motivação para uma recomendação de política imaginária). Esolha um dos seguintes riscos ou desafios que a sua recomendação está abordando:
Problemas técnicos:
- Comportamento de buscar poder
- Comportamento enganoso após a implementação
- Dificuldade de especificar corretamente resultados que humanos valorizam numa função de perda (p. ex., erro de especificação da recompensa e a lei de Goodhart
- Erro de generalização do objetivo [das leituras opcionais]
Estruturas de incentivo:
- Uma “corrida para o fundo do poço” na segurança de IA
- Pressão competitiva para delegar poder a sistemas de IA
- Aceleração da pesquisa em IA por sistemas de IA
Os escolha o seu próprio
Instruções adicionais – válidas para todos os exercícios
Neste curso, frequentemente pediremos que você sintetize seu aprendizado fazendo um exercício de “Escrever para aprender”. Nesses exercícios, vamos propor um tema e pedir sua conclusão sobre ele. Nosso objetivo é ajudá-lo a ativar seu conhecimento anterior sobre o assunto, interagir criticamente com os recursos semanais e formular seus pensamentos iniciais sobre o assunto.
Você pode levar o tempo que quiser nesses exercícios e esperar obter o que você tiver colocado neles.
- Achamos que dedicar-se por até uma hora seria suficiente na maioria dos casos, embora você possa gerar subquestões ou confusões interessantes nas quais deseje passar mais tempo ou voltar mais tarde.
- Se você estiver com pressa, nós o encorajamos a pelo menos fazer um rascunho de alguns tópicos resumindo seus pensamentos iniciais.
O resultado dos exercícios de escrever para aprender deve ser de 1/2 a 2 páginas (exceto quando especificado outro tamanho) de redação expressando sua conclusão sobre um tópico, com justificativas e seu raciocínio. O objetivo principal é ajudá-lo a aprender sobre o assunto, em vez de que o conteúdo seja necessariamente correto ou elegante; esperamos que dentro de uma hora você seja capaz de chegar a uma conclusão superficial, mas pode não se sentir totalmente satisfeito com a quantidade de pesquisa que foi capaz de fazer.
Quando terminar sua redação, você pode:
- Pedir feedback a alguém que você conhece: ele concorda com sua conclusão? Você perdeu de vista alguma consideração importante?
- Adentrar-se nas subquestões que você gerou e fazer mais pesquisas.
- Decidir fazer um projeto muito mais aprofundado investigando a questão ou subquestão, o que pode levar você a desenvolver um nicho no qual outras pessoas não estão pensando.
- Aperfeiçoar o rascunho e postá-lo em algum lugar publicamente para obter mais feedback ou engajamento.
Publicado originalmente aqui.
Tradução: Luan Marques