Як з’ясували дослідники, здатність GPT-4 визначати прості числа різко впала — з 97,6% у березні до 2,4% у червні. А ось GPT-3.5 показав вищі результати за аналогічний період. Проблеми у випадку з GPT-4 виявилися і у відповідях на запитання, що вимагають просторового мислення, а також у генерації коду. Як пояснили автори дослідження в коментарі Gizmodo, під час розв’язання цих завдань ШІ-компаньйон почав видавати більше базового тексту і код, який частіше доводиться редагувати вручну, ніж раніше.