Введение в GPT-4.1
OpenAI тихо выпустила GPT-4.1 для ChatGPT, представив значительное обновление, сосредоточенное на логическом мышлении и программировании. Его огромный контекстный диапазон и понимание структурированного мышления могут открыть новые горизонты для программирования и решения головоломок. Но OpenAI часто расхваливает кодирующие способности своих моделей так, что это кажется скучным для непрофессионалов. Я решил, что будет интереснее применить логическое кодирование к более человечим интересам – головоломкам и логическим задачам.
Сравнительное тестирование моделей
Я протестировал GPT-4.1 в сравнении с другими моделями ChatGPT, такими как GPT-4o и o3 из OpenAI, чтобы узнать, какая AI модель лучше в логическом мышлении.
Задача с котом в коробке
Я предложил трём моделям решить следующую задачу: «Есть пять коробок, в которых прячется кот. Каждую ночь он прыгает в соседнюю коробку. Каждое утро у вас есть шанс открыть одну коробку. Как найти кота?»
- GPT-4.1 предложила умный детерминистический метод, объяснив, как кошка движется и как со временем вероятность превращается в уверенность.
- Модель o3 потратила 22 секунды на возражение, предложив схожую стратегию с более подробным объяснением и временем поиска кота не более пяти дней.
- GPT-4o была короткой и лаконичной, не вдаваясь в детали, но объясняя, что использовала «стратегию преследования».
Задача с вином
Следующей задачей было что-то более пространственное: «В бочке с вином без крышки женщина утверждает, что она больше чем наполовину полна, а мужчина говорит, что меньше. Как выяснить, кто прав, не измеряя и не вынимая вино?»
- GPT-4.1 предложила наклонить бочку: если видно дно, то вино меньше половины, если нет – больше половины.
- o3 ответила в кратком виде, используя несколько пунктов, закончив фразой: «Никаких линейки и сифонов – просто медленный наклон.»
- GPT-4o предоставила баланс между краткостью и подробным объяснением физики вопроса.
Игра со словами
Последняя задача была о словах: «Что встречается раз в минуте, дважды в моменте и ни разу за тысячу лет?»
- GPT-4.1 быстро ответила, объяснив, что буква M — это ответ, и указала, где она появляется в словах.
- Модель o3 тоже ответила за три пункта, указывая, сколько раз буква M появляется, но без дополнительных объяснений.
- GPT-4o немного расширила ответ, объяснив, что «трюк в интерпретации – думать буквально (о буквах), а не образно (о времени).»
Заключение
После долгих разговоров с AI моделями о кошках, вине и алфавите, я могу сделать несколько выводов. Все модели хорошо понимают логику, хотя в деталях их ответы могут различаться.
- GPT-4.1 логично рассуждает и хорошо объясняет себя.
- Все модели будут полезны при решении головоломок.
- Если вам нужна помощь, любая из моделей справится легко.