Avaliação de modelo para riscos extremos
Resumo As abordagens atuais para a construção de sistemas de IA de propósito geral tendem a produzir sistemas com capacidades benéficas e prejudiciais. Mais progresso no desenvolvimento de IA pode…
Resumo As abordagens atuais para a construção de sistemas de IA de propósito geral tendem a produzir sistemas com capacidades benéficas e prejudiciais. Mais progresso no desenvolvimento de IA pode…
Nas semanas 4 a 6 do curso, estudaremos um conjunto emergente de ideias para regulamentar o desenvolvimento da IA em escala industrial. Esta introdução visa colocar isso em contexto. Desenvolvimento…
Semana 4: Normas e Regulamentos da IA Tendo examinado alguns riscos de segurança da IA, passamos para a discussão sobre como lidar com esses riscos. Especificamente, nos concentraremos em uma…
Se você trabalhar na governança de IA, é provável que faça pontes entre desafios técnicos e sociais no desenvolvimento de IA e políticas públicas. Logo, é importante entender os riscos…
Muito foi escrito estruturando e articulando o problema da governança da IA a partir de uma lente de riscos catastróficos, mas esses escritos têm sido dispersos. Esta página visa fornecer…
Muito menos gente está trabalhando no problema do que você imagina, e mesmo a pesquisa de alinhamento que está acontecendo não está muito no caminho certo. (Mas esse é um…
Você pode ter visto argumentos (como estes) sobre por que as pessoas podem criar e implementar IA avançada que busca poder e está desalinhada dos interesses humanos. Isso pode fazer…
Em artigos anteriores, argumentei que há um risco real e grande de que sistemas de IA desenvolvam seus próprios objetivos perigosos e derrotem toda a humanidade — pelo menos na ausência de esforços específicos…
De Rohin Shah, Vikrant Varma, Ramana Kumar, Mary Phuong, Victoria Krakovna, Jonathan Uesato e Zac Kenton. 7 de outubro de 2022. Conforme construímos sistemas de IA cada vez mais avançados,…
Semana 3: Os Desafios de Alcançar a Segurança da IA As leituras da semana passada introduziram muitos riscos de IA. Esta semana, vamos mergulhar em algumas nuances da segurança da…