Un trombone. Deux trombones. Trois trombones..?
Un grand merci au Centre pour la Sécurité de l’IA. Pour faire un tour sur leur discord, c’est par ici :
/ discord
Et pour leur site, par là :
Quelques sources en vrac :
Spreadsheet des “mauvaises instructions” : https://docs.google.com/spreadsheets/…
“Sparks of Artificial General Intelligence: Early experiments with GPT-4” : https://arxiv.org/pdf/2303.12712
Papier sur l’AI Scientist : https://arxiv.org/pdf/2408.06292
“Optimal Policies Tend to Seek Power” : https://arxiv.org/pdf/1912.01683
“Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback” : https://arxiv.org/pdf/2307.15217
“AI deception: A survey of examples, risks, and potential solutions” : https://www.ncbi.nlm.nih.gov/pmc/arti…
Papier sur Diplomacy : https://noambrown.github.io/papers/22…