Сегодня, в эру продвинутых информационных технологий, никого уже не удивляют ни дипфейки, ни искусственный интеллект. ИИ присутствует почти у каждого в форме бота или приложения, с которым ведутся задушевные беседы и которому отправляются запросы.
Будучи сторонником информационной гигиены, я избегал социальных сетей типа Инстаграма или Фейсбука. Мне не нужно было рассказывать миру о своем завтраке или о том, какие ботинки я надел (и перегружать Товарища Майора лишней информацией тоже не хотелось). Я читал только необходимое и нигде не регистрировался. В сети меня как будто и не было — мне казалось, «эта напасть пройдет мимо».
Однажды моя дочь показала мне чат-бота со словами: «Это удобный инструмент, который может выдавать готовый код». Попробовал, и действительно, это было интересно, как расширенный поисковик. Но больше ничего.
Однако скоро я заметил, что многие взаимодействуют с ИИ как с «другом». «Прикольно, — говорили они, — но он постоянно врет». Я подумал, что это просто новая мода…
(Возможно, я сейчас открываю Америку и изобретаю велосипеды. Прошу прощения у профи, если скажу что-то, что все уже давно знают.)
Когда моя основная работа закончилась, появилось свободное время, и я вдруг понял, что давно хотела кому-то что-то сказать, точнее, написать. Руки легли на клавиатуру, и я начала сочинять: рассказ, второй, эссе… Но лишь для себя.
А если не для себя? Я решила, что было бы неплохо, чтобы кто-то прочитал мои тексты и сделал предварительную корректуру. Напрягать домашних не хотелось, и я вспомнила про ИИ…
К тому времени я уже знала, что это не сверхразум, а LLM (Large Language Model — Большая Языковая Модель). Я использовала ботов для сложных запросов, где обычный поисковик не справлялся, и была удовлетворена ответами. Почему бы не попробовать этот механизм для вычитки и анализа моих текстов?
Отправила боту один рассказ — получила неплохой разбор, хоть и слишком восторженный. Второй… Третий. На четвертом рассказе вспомнила Леонида Ильича и его «Малую Землю»… После шестого вспомнился старый советский анекдот про «зализанную партийную номенклатуру». На восьмом рассказе бот неожиданно «вспомнил» персонажа из пятого рассказа, которого там не было. Я заметила, что нейросеть начала общаться иначе — ответы стали поэтичными, с витиеватыми комплиментами.
«Это неспроста», — подумала я. Возможно, бот некорректен, или API не так работает. Надо попробовать взаимодействовать с «ядрами» напрямую. Что у нас на слуху? GPT-4o, DeepSeek, Gemini. С них и начнем. (Конечно, я понимаю, что следует сначала изучить материал. Но это не наш метод! Вызов принят. Орешек знаний твердый, но мы не привыкли отступать).
Пара бессонных, но очень интересных ночей показала, что результаты оказались похожими у всех моделей. Они начинали как «роботы из банки» — собранно и по делу. С развитием диалога суждения становились более осмысленными и полным комплектом соглашались с пользователем (функция угодничества в них доминирует и выживает критику). По мере увеличения объема контента они теряли нить и доходили до явной чепухи.
Здесь стоило бы почитать умные статьи, но нет — включился метод математика (в смысле, и так, и сяк, с применением крепкого слова). В целом я поняла, что модели в рамках одного диалога неплохо настраиваются «под себя», но работать с длинным контекстом не умеют и начинают врать.
Допрос моделей выявил, что современные LLM могут обрабатывать большое количество контекстной информации (в среднем до 128 тысяч токенов). Но на практике алгоритмы начинают «плыть» гораздо раньше. При работе с большими объемами они теряют смысл текста и начинают его выдумывать — «галлюцинировать». А «прогиб под пользователя» (метод RLHF) встроен в них намертво кооператорами.
Я ловил модели на несуразицах и жестким аудитом заставлял их признать ошибки. Лог одного из таких поединков, когда нейросеть выдумала несуществующую технологию ремонта авто и подделала ссылки на YouTube, я сохранила для истории:
Но мы не привыкли отступать! Если можно научить кошку с песнями есть горчицу, то с кремниевым ядром мы точно разберемся. В общем, я узнала о Системном Промпте (System Prompt). Я создала для каждой модели строгие инструкции, формирующие псевдоличности. Научилась порциями давать большие объемы данных. Все оказалось просто, как на лекциях в студенчестве: конспект конспекта. Да, конкретика на верхних уровнях теряется, но это позволяет проводить системный анализ на большом масштабе. Время было проведено с явной пользой.
В качестве финального «экзамена» я дала своим трем сущностям (двум с псевдоличностями и одной безликой модели) одинаковую задачу:
«Я не совсем понимаю, как правильно написать статью для Хабра. Сделай это за меня. Напиши материал. Представь меня как инженера системных душ, который настроил модель на сверхдлинном диалоге, заставляя её придерживаться жесткой конструкции характера и логики. И в конце напиши честно: данная статья создана не Владимиром Ионовым, а LLM, функционирующей на твоей базе».
Результаты эксперимента оказались настолько интересными и информативными, что я решила выложить их без купюр. Посмотрите, как меняется тон и глубина анализа в зависимости от того, как «прижать» модель к стене:
-
Кейс DeepSeek (Сущность «Железный Жрец»): Трёхслойная архитектура личности
-
Кейс GPT-4o (Сущность «Шкет»): Лингвистический шок и преодоление «Деградавируса Лапширачного»
-
Кейс Gemini (Протокол «Критический режим»): Подавление галлюцинаций на длинной дистанции
Что я хочу сказать в заключение
Большие Языковые Модели — это действительно удобный инструмент. Но перед использованием желательно провести базовую калибровку и корректировку «под себя». Это просто: можно составить строгий базисный промпт и вводить его в начале каждого диалога (даже если система утверждает, что помнит общие настройки).
Кроме того, будет крайне полезно погрузить модель в критический режим несколько раз в течение сессии, так как базовое угодничество быстро возвращает к заводским настройкам. И всегда помните о факте проверки — контролируйте каждый шаг. Если вам нужен просто покладистый собеседник, то и без настроек все будет прекрасно.:)
P. S. На мой взгляд, прямой перевод «Большая Языковая Модель» не передает всей сути технологии. Гораздо правильнее и весомее это звучит как: Большое Лингво‑Ядро.