Звучит как сенсация, но GPT-4 (мультимодальная большая языковая модель) со временем становится все хуже (тупее), а не лучше (умнее).
Многие пользователи заметили значительное ухудшение качества ответов модели, но до сих пор все это было на уровне шуточек. Но теперь всё стало не так смешно.
Под катом! Серьезное исследование показывает, что июньская версия GPT-4 объективно хуже версии, выпущенной в марте, в части выполнения некоторых задач.
Команда оценила модели, используя набор данных из 500 задач, в которых модели должны были выяснить, является ли данное целое число простым.

