Документация OpenAI по оценкам, Рамочная программа управления рисками ИИ NIST 2023 года и постоянные обновления примечаний к выпускам от Adobe единодушно указывают на главное: истинная работа заключается в измерении «дрифта» (изменений в поведении или производительности) системы ИИ до того, как ей можно будет доверять.
Почему демонстрации ИИ-продуктов терпят крах после запуска: Взгляд на подход OpenAI к оценке

