Я сравнил ChatGPT 4.1 с o3 и 4o, чтобы найти самый логичный ИИ-модель — результат кажется почти иррациональным.

Введение в GPT-4.1

OpenAI тихо выпустила GPT-4.1 для ChatGPT, представив значительное обновление, сосредоточенное на логическом мышлении и программировании. Его огромный контекстный диапазон и понимание структурированного мышления могут открыть новые горизонты для программирования и решения головоломок. Но OpenAI часто расхваливает кодирующие способности своих моделей так, что это кажется скучным для непрофессионалов. Я решил, что будет интереснее применить логическое кодирование к более человечим интересам – головоломкам и логическим задачам.

Сравнительное тестирование моделей

Я протестировал GPT-4.1 в сравнении с другими моделями ChatGPT, такими как GPT-4o и o3 из OpenAI, чтобы узнать, какая AI модель лучше в логическом мышлении.

Задача с котом в коробке

Я предложил трём моделям решить следующую задачу: «Есть пять коробок, в которых прячется кот. Каждую ночь он прыгает в соседнюю коробку. Каждое утро у вас есть шанс открыть одну коробку. Как найти кота?»

GPT-4.1 предложила умный детерминистический метод, объяснив, как кошка движется и как со временем вероятность превращается в уверенность.
Модель o3 потратила 22 секунды на возражение, предложив схожую стратегию с более подробным объяснением и временем поиска кота не более пяти дней.
GPT-4o была короткой и лаконичной, не вдаваясь в детали, но объясняя, что использовала «стратегию преследования».

Задача с вином

Следующей задачей было что-то более пространственное: «В бочке с вином без крышки женщина утверждает, что она больше чем наполовину полна, а мужчина говорит, что меньше. Как выяснить, кто прав, не измеряя и не вынимая вино?»

GPT-4.1 предложила наклонить бочку: если видно дно, то вино меньше половины, если нет – больше половины.
o3 ответила в кратком виде, используя несколько пунктов, закончив фразой: «Никаких линейки и сифонов – просто медленный наклон.»
GPT-4o предоставила баланс между краткостью и подробным объяснением физики вопроса.

Игра со словами

Последняя задача была о словах: «Что встречается раз в минуте, дважды в моменте и ни разу за тысячу лет?»

GPT-4.1 быстро ответила, объяснив, что буква M — это ответ, и указала, где она появляется в словах.
Модель o3 тоже ответила за три пункта, указывая, сколько раз буква M появляется, но без дополнительных объяснений.
GPT-4o немного расширила ответ, объяснив, что «трюк в интерпретации – думать буквально (о буквах), а не образно (о времени).»

Заключение

После долгих разговоров с AI моделями о кошках, вине и алфавите, я могу сделать несколько выводов. Все модели хорошо понимают логику, хотя в деталях их ответы могут различаться.

GPT-4.1 логично рассуждает и хорошо объясняет себя.
Все модели будут полезны при решении головоломок.
Если вам нужна помощь, любая из моделей справится легко.

Я сравнил ChatGPT 4.1 с o3 и 4o, чтобы найти самый логичный ИИ-модель — результат кажется почти иррациональным.

Введение в GPT-4.1

Сравнительное тестирование моделей

Задача с котом в коробке

Задача с вином

Игра со словами

Заключение

ОСТАВЬТЕ ОТВЕТ Отменить ответ

Городская ассоциация слепых запускает курсы по искусственному интеллекту для людей с нарушениями зрения.

Эксперты по технологиям анализируют обновления Siri AI и Apple Intelligence с WWDC 2026.

Обзор WWDC 2026 от Apple: Что анонсировала компания?

Акции Intel и Apple...

Как новый режим Lockdown...

Искусственный интеллект пока не...

Ии который генерирует картинки по тексту?

Что представляет собой восходящая парадигма ии?

Ия остергрен сколько лет?

AI в спортивной аналитике: кейсы использования для повышения эффективности команд

Как компании используют AI для улучшения кибербезопасности

AI в образовании: примеры автоматизации учебного процесса

Я сравнил ChatGPT 4.1 с o3 и 4o, чтобы найти самый логичный ИИ-модель — результат кажется почти иррациональным.

Введение в GPT-4.1

Сравнительное тестирование моделей

Задача с котом в коробке

Задача с вином

Игра со словами

Заключение

ОСТАВЬТЕ ОТВЕТ Отменить ответ

ПОХОЖИЕ МАТЕРИАЛЫ