Evitando Efeitos Colaterais Considerando Tarefas Futuras
De Victoria Krakovna, Laurent Orseau, Richard Ngo, Miljan Martic e Shane Legg. 15 de outubro de 2020. Resumo Projetar funções de recompensa é difícil: o projetista precisa especificar o que…
De Victoria Krakovna, Laurent Orseau, Richard Ngo, Miljan Martic e Shane Legg. 15 de outubro de 2020. Resumo Projetar funções de recompensa é difícil: o projetista precisa especificar o que…
De Charlie Rogers-Smith, com pequenas atualizações de Adam Jones (publicado em 5 de abril de 2024) 0. Prefácio Este guia foi escrito para pessoas que estão considerando trabalhar diretamente no alinhamento…
De Jess Whittlestone e Jack Clark[^1]. 31 de agosto de 2021. Sumário executivo Delineamos uma proposta para melhorar a governança da inteligência artificial (IA) por meio do investimento na capacidade…
De Sophie-Charlotte Fischer, Jade Leung, Markus Anderljung, Cullen O’Keefe, Stefan Torges, Saif M. Khan, Ben Garfinkel e Allan Dafoe[^1]. 16 de março de 2021. Resumo O governo dos EUA (GEUA)…
De Allan Dafoe. 15 de setembro 2020. A governança da IA diz respeito à forma como a humanidade pode navegar melhor na transição para um mundo com sistemas de IA…
De Nelson Elhage, Tristan Hume, Catherine Olsson, Nicholas Schiefer, Tom Henighan, Shauna Kravec, Zac Hatfield-Dodds, Robert Lasenby, Dawn Drain, Carol Chen, Roger Grosse, Sam McCandlish, Jared Kaplan, Dario Amodei, Martin Wattenberg, Christopher Olah. 14 de setembro de 2022. Seria muito conveniente se os neurônios…
De Chris Olah, Nick Cammarata, Ludwig Schubert, Gabriel Goh, Michael Petrov e Shan Carter. 10 de março de 2020. Estudando as conexões entre os neurônios, podemos descobrir algoritmos significativos nos…
De Stephen Casper, Dylan Hadfield-Menell, Gabriel Kreiman. 11 de setembro de 2023. Resumo A literatura sobre ataques adversários em visão computacional geralmente se concentra em perturbações ao nível dos pixels.…
De Geoffrey Irving, Paul Christiano e Dario Amodei. 22 de outubro 2018. Resumo Para tornar os sistemas de IA amplamente úteis para tarefas desafiadoras do mundo real, precisamos que eles…
De Tom Everitt, Ryan Carey, Lewis Hammond, James Fox, Eric Langlois e Shane Legg. 30 de junho de 2021. Cerca de 2 anos atrás, divulgamos os primeiros artigos sobre entender os incentivos dos…