Un trombone. Deux trombones. Trois trombones..?


Un grand merci au Centre pour la Sécurité de l’IA. Pour faire un tour sur leur discord, c’est par ici :

/ discord

Et pour leur site, par là :

https://www.securite-ia.fr/


Quelques sources en vrac :

Spreadsheet des “mauvaises instructions” : https://docs.google.com/spreadsheets/

“Sparks of Artificial General Intelligence: Early experiments with GPT-4” : https://arxiv.org/pdf/2303.12712

Papier sur l’AI Scientist : https://arxiv.org/pdf/2408.06292

“Optimal Policies Tend to Seek Power” : https://arxiv.org/pdf/1912.01683

“Open Problems and Fundamental Limitations of Reinforcement Learning from Human Feedback” : https://arxiv.org/pdf/2307.15217

“AI deception: A survey of examples, risks, and potential solutions” : https://www.ncbi.nlm.nih.gov/pmc/arti

Papier sur Diplomacy : https://noambrown.github.io/papers/22

Commentaires

Vous devez vous inscrire ou vous connecter pour poster un commentaire