Curso de Alinhamento da IA – Texto Introdutório da Semana 9

Carreiras e projetos

A segurança da IA é um campo novo com poucas oportunidades claras, mas, de forma contraintuitiva, há muito trabalho a ser feito. Descobrir o que fazer pode ser difícil, já que não existem muitos caminhos-padrão a seguir.

O principal objetivo desta semana é reservar um tempo para pensar em sua carreira e objetivos, e propor um projeto no qual você possa trabalhar nas próximas quatro semanas para ajudá-lo a avançar em direção a esses objetivos, com base no conhecimento que você adquiriu ao longo deste curso. O projeto pode incluir aprender uma nova habilidade, tentar desenvolver uma opinião provisória sobre um tópico importante e escrever sobre ele, iniciar um projeto de longo prazo, testar a adequação para diferentes funções, etc.

O foco principal desta semana são os dois exercícios, que você pode encontrar após a seção de recursos. Por favor, envie-os antes da sessão. Ter qualquer plano ajuda a resolver a paralisia decisória, e você provavelmente revisitará e adaptará este plano conforme tomar medidas e aprender mais. O importante, por enquanto, é começar.

Como abordar esta semana:

  1. Leia os recursos fornecidos (há menos do que o habitual).
  2. Complete o exercício do Plano de Panorama Geral antes da sessão, focado em elaborar diferentes caminhos de longo prazo que você poderia seguir.
  3. Complete o exercício dos Projetos de Conclusão & Próximos Passos antes da sessão, focado em que projeto(s) autodirigido(s) você poderia trabalhar ao longo das próximas quatro semanas.

Durante a sessão com sua turma, você terá a oportunidade de oferecer e receber feedback de seus colegas sobre seus planos e discutir como podem apoiar uns aos outros para alcançar seus objetivos. Não se preocupe se algum desses planos for um rascunho preliminar ou se você estiver muito incerto. Sua turma está lá para apoiá-lo, e a intenção da sessão é ajudar uns aos outros a melhorar e refinar seus planos.

Trabalhando no seu projeto

[Após a sessão, você terá as próximas 4 semanas para trabalhar no seu projeto! Pediremos envios ou relatórios ao final para ver o que as pessoas realizaram (isso não será “avaliado”, mas é muito útil para nossas avaliações de impacto e para informar nossas decisões em cursos futuros).

O Slack permanecerá aberto para conversas com sua turma, ajuda/conselhos gerais ou feedback sobre seu projeto, de sua turma ou de outras. Como ex-aluno do Curso de Fundamentos da Segurança da IA: Alinhamento, você também terá acesso a cursos e workshops de seguimento que pretendemos oferecer no futuro!

Mande uma mensagem para Jamie ou preencha o formulário se tiver algum feedback ou dúvida.]

Até o final da sessão, você deverá ser capaz de:
  • Plano de carreira: Desenvolver um rascunho de um plano geral/plano de carreira, em direção ao qual você se sinta motivado a trabalhar a longo prazo e a curto prazo imediato.
  • Passos aplicáveis e responsáveis: Dentro deste plano de carreira, desenvolver um plano de 4 semanas para como você fará progresso em lidar com suas principais incertezas. Divida-os em passos de objetivos SMART aplicáveis de semana a semana pelos quais você será responsável pelas próximas quatro semanas.
  • Visando o problema de alinhamento: Se seu plano se destina a abordar o alinhamento da IA, apresente argumentos de como seu objetivo final avança no problema de alinhamento.
  • Movendo-se rapidamente em direção ao objetivo: Apresente argumentos de como seu plano de 4 semanas pretendido o ajuda a alcançar seu objetivo final, abordando suas principais incertezas. 

Recursos (cerca de 55 min)

Trabalhando no alinhamento da IA de Charlie Rogers-Smith (2022) [Blog]

Tempo estimado: 30 min

Escolha as seções mais relevantes para você

Este artigo é longo, mas está cheio de conselhos práticos que podem ajudá-lo a focar em quais habilidades você pode querer desenvolver, ou que tipo de caminho de longo prazo no alinhamento técnico você pode querer seguir.

Recomendamos pular as seções que parecem menos relevantes para você.

Análise de risco x para a pesquisa de IA de Dan Hendrycks e Mantas Mazeika (2022) [Artigo]

Tempo estimado: 15 min

Esta leitura discute o conflito entre trabalhar na segurança e trabalhar nas capacidades, e a preocupação de que pesquisadores motivados pela segurança possam acelerar o desenvolvimento de capacidades prejudiciais.

Gerenciar a taxa de desenvolvimento das capacidades da IA para avançar no mesmo ritmo que nosso entendimento de como alinhá-la pode ser um problema importante da governança.

Planejar uma carreira de alto impacto: um resumo de tudo que você precisa saber em 7 tópicos de Benjamin Todd (2021) [Blog]

Tempo estimado: 10 min

Concentre-se nos pontos 4-7.

Este recurso fornece uma maneira estruturada de gerar e pensar sobre suas opções de carreira.


Tradução: Luan Marques

Link para o original.

Deixe um comentário