humanizer-ru: очеловечивание русского AI-текста для Claude (humanizer-ru)
Профессиональный инструмент для удаления следов AI-генерации из русских текстов. Скилл Claude с quad-pass аудитом, 52 паттернами нейросети и калибровкой под личный стиль автора. Проходит детекторы GPTZero, DivEye и RuBERT-анализаторы.
Обзор и назначение
humanizer-ru — это специализированный скилл для Claude, который устраняет типичные признаки AI-генерации в русском языке. В отличие от англоязычного humanizer, который работает с универсальными маркерами, этот инструмент учитывает уникальные характеристики русской речи и особенности современных нейросетей (Claude, GPT-4/5) в 2025-2026 годах.
Основная проблема, которую решает скилл: английский humanizer просто не работает для русского текста. Русский язык имеет собственную «физику» AI-маркеров — это канцелярит (превращение глаголов в существительные вроде «осуществление внедрения»), кальки с английского синтаксиса («стоит отметить, что»), отсутствие характерных русских частиц («же», «ведь», «вот»), которыми естественная русская речь дышит на каждом шагу.
Кроме того, в 2025-2026 годах Claude и GPT научились имитировать глубокомысленность совершенно новыми способами: короткими рублёными предложениями («Точно. Отдельно. Рефлексивно.»), псевдо-сократическими вопросами («Зачем? Потому что.») и псевдо-терапевтическим регистром, создающим иллюзию личного опыта и понимания. Это новый слой маркеров, который ни в одном другом humanizer ещё не описан.
52 паттерна AI-генерации в 12 категориях
humanizer-ru выявляет и устраняет 52 различных признака машинного текста, организованные в 12 логических категорий. Каждый паттерн тестировался на реальных текстах и валидирован против детекторов 2025-2026 годов.
A. Контентные маркеры
Это признаки на уровне смысла и информационного содержания. Включают пустые открытия, которые не добавляют ценности («В современном мире...», «Как известно...»), размытые ссылки на авторитеты без конкретики, формульные выводы, которые вытекают механически, а не из живого размышления.
B. Языковые маркеры
Канцелярит (номинализация: «проведение анализа» вместо «анализировать»), кальки с английского синтаксиса, злоупотребление глаголом «является», нагромождение причастных оборотов, которые делают текст тяжёлым и неестественным для беглого чтения.
C. Стилистические маркеры
Навязчивое использование длинного тире (em-dash), неестественно частые списки с маркерами, избыточный болд на слова и фразы, которые не требуют выделения. Эти элементы придают тексту вид чат-бота, а не живого человека.
D. Коммуникативные маркеры
Характерные артефакты чат-ботов: заискивание перед пользователем («позвольте предположить», «если не ошибаюсь»), водянистость изложения, перефразирование одного и того же по кругу, отсутствие уверенности в тоне при одновременной логической структурированности.
E. Морфологические маркеры
Падежные ошибки и согласования, которые ловят RuBERT-детекторы, неправильное использование деепричастий (конструкции, которые согласуются не с подлежащим), нарушения синтаксической гармонии, которые не видны на первый взгляд, но портят авторитетность текста.
F. Тональные маркеры
Эмоциональная стерильность — четыре подтипа нейтральности, которая граничит с холодностью. Отсутствие иронии, которая присуща живым русским текстам. Полное отсутствие метафор, сравнений и образности. Текст звучит как технический отчёт, а не как рассказ человека.
G. Структурные маркеры
Разорванные абзацы без смысловой связи, narrative drift (уход от исходной темы), галлюцинации (придумывание деталей, которые не проверены), прерывистая логика повествования.
H. Маркеры идеальности
Идеальная грамотность без ошибок (люди иногда опечатываются), вылизанная типографика (правильные кавычки, неразрывные пробелы везде), отсутствие личных оговорок и поправок, которые естественны для живого письма.
I. Паттерны убеждения
Негативные параллелизмы в аргументации, авторитетные трюизмы (истины, преподносимые как откровения), манипулятивные структуры, которые часто видны в маркетинговых текстах, созданных нейросетями.
J. Информационный ритм
Равномерная плотность информации на протяжении всего текста (у людей плотность скачет), гладкие переходы между идеями без резких скачков, macro-burstiness структурных блоков — предсказуемое распределение длинных и коротких предложений.
K. Хеджирование и специфика
Модальная неопределённость («может быть», «похоже на то, что»), translationese (признаки машинного перевода в контексте оригинального текста), отсутствие идиом и крылатых выражений, которые украшают живой русский язык.
L. Стилистические фингерпринты 2025-2026
Новые маркеры современных моделей: рваная медитативность (попытка выглядеть глубокомысленно через фрагментацию), контр-вопросы (вопросы, которые не требуют ответа, для видимости размышления), эмодзи-декор (неправильное использование эмодзи как стилистического средства), псевдо-терапевтические конструкции («ты не ошибаешься, что так чувствуешь»).
20 жёстких банов — запрещённые конструкции
Помимо 52 паттернов, скилл определяет 20 жёстких банов — конструкций, которые имеют абсолютный запрет на появление в естественном русском тексте. Это фразы и структуры, которые используют практически только нейросети или спаммеры. Вот полный список:
- «В современном мире...» — классический AI-маркер, который открывает 40%+ машинных текстов
- «Стоит отметить, что...» — характерная галантность чат-ботов, редко встречается в живой речи
- «Данная технология» — официальный канцелярит вместо просто «эта технология»
- «Является мощным инструментом» — маркетинговый клише, излюбленное выражение nейросетей
- «Играет важную роль» — шаблонное выражение, которое ничего не говорит
- «Раскрыть потенциал» — маркетинговое клише, типично для AI
- «Комплексный подход» — бюрократическое выражение, редко в живых текстах
- «Открывает новые горизонты» — торжественное пусто, признак AI
- «Способствует развитию» — канцелярит, неестественное для разговора выражение
- «Позвольте предположить» — излишне вежливое заискивание, типично для чат-ботов
- «Как известно» — попытка звучать авторитетно, но фальшиво
- «Не просто X, а Y» — встречается в 80%+ AI-текстов, очень характерный маркер
- «Вместе с тем» — письменный канцеляризм, редко в устной речи
- «Осуществить внедрение» — двойной канцелярит, буквально невозможно услышать от человека
- «Оптимизация рабочих процессов» — маркетинговый сленг, переусложнение
- «Надлежащее внимание» — чиновничий язык, признак неживого текста
- «Ключевым моментом является» — многословная структура вместо просто «ключевой момент»
- «Привлечение внимания» — канцелярит вместо «привлечь внимание»
- «На современном этапе развития» — расширенная версия «в современном мире», ещё более подозрительна
- «Исходя из вышесказанного» — формальная отсылка, которую люди не используют в письме
Если скилл обнаруживает в тексте любую из этих конструкций, он немедленно заменяет её на естественный эквивалент. Эти 20 фраз — своего рода сигнатура AI-генерации на русском языке.
Quad-pass аудит: четырёхуровневая проверка
humanizer-ru использует уникальный quad-pass метод аудита — четыре независимых прохода через текст, каждый с собственной логикой и целью. Это значительно повышает точность обнаружения и снижает количество ложных срабатываний.
Проход 1: Детектор (Detector Pass)
Первый проход — это поиск всех 52 паттернов и 20 жёстких банов. Детектор ищет ключевые слова, синтаксические структуры, морфологические ошибки, стилистические маркеры. На выходе — полный список всех найденных маркеров с координатами (параграф, строка, слово). Это механический проход, без субъективных оценок.
Проход 2: Человек с улицы (Street Reader Pass)
Второй проход имитирует взгляд обычного читателя, который читает текст просто так, без аналитики. На этом проходе скилл ищет места, где текст «звучит странно» или «звучит как робот», даже если технически паттернов не обнаружено. Проход использует эвристики естественности и врождённое чувство языка, которое нейросеть выучила на миллиардах русских текстов.
Проход 3: Кардиограмма (Cardiogram Pass)
Третий проход анализирует вариативность информационной плотности по всему тексту. Скилл строит метрику информационной плотности для каждого предложения и смотрит на её график. У AI-текстов график выглядит как скучная кардиограмма — почти плоская линия. У живых текстов график имеет скачки: короткие предложения низкой плотности чередуются с длинными предложениями высокой плотности. Кардиограмма ловит ритмические маркеры.
Проход 4: Скелет (Skeleton Pass)
Четвёртый проход анализирует только первые строки пунктов списков и первые предложения параграфов на шаблонность. Именно с начало абзаца часто выдаёт AI — там обычно стоит какой-то стандартный ход («Важно отметить, что...», «Следует подчеркнуть...»). Скелет достаёт скелет текста и смотрит, не выглядит ли он как набор стандартных фраз.
По результатам всех четырёх проходов скилл выдаёт единый отчёт с рекомендациями. Если проходы расходятся в оценке (например, детектор не нашёл маркер, но street reader проход говорит, что звучит странно), скилл указывает на зону повышенного внимания.
Калибровка под голос автора
Один из самых мощных инструментов humanizer-ru — это способность анализировать образец письма конкретного автора и применять его личный стиль при очеловечивании. Это не просто замена слов — это сохранение авторского голоса.
Если вы предоставите скилю образцы своего письма (например, несколько статей, писем или постов, которые вы писали раньше), скилл проанализирует:
- Ритм речи — какие паттерны длин предложений вы предпочитаете, как часто вы используете короткие рубленые предложения или, наоборот, длинные периоды
- Лексика — какие слова и выражения появляются в вашем текстах часто, какой диапазон синонимов вы используете
- Любимые обороты — фразы, которые вам нравятся и которые характеризуют ваш стиль
- Пунктуация — как часто вы используете многоточие, тире, запятые, как оформляете списки
- Тон — формальность, ироничность, эмоциональность, ироничность, серьёзность
- Лингвистические маркеры — частицы «же/ведь/вот/ну», которые вы часто используете, сленг, региональные особенности
После анализа скилл применяет ваш личный стиль вместо средне-нейтрального стиля при очеловечивании. Это значит, что текст не просто перестанет звучать как AI — он будет звучать как вы. Это огромное преимущество для авторов, которые хотят сохранить узнаваемость своего голоса.
Три режима работы скилла
Режим 1: Полное редактирование (по умолчанию)
В этом режиме скилл применяет все 52 паттерна и все 20 жёстких банов. Текст полностью переписывается с целью максимально очеловечить его. Используется quad-pass аудит для поиска маркеров, затем все они заменяются на живые альтернативы. Это самый агрессивный режим, который даёт самый заметный результат.
Режим 2: Аудит (только диагностика)
В этом режиме скилл не трогает текст — только проверяет его и выдаёт диагностический отчёт. Вы видите, какие маркеры найдены, где они находятся, какой категории относятся. Полезно для понимания того, в чём именно проблема с текстом, и для самостоятельного редактирования. Аудит показывает места для максимального внимания.
Режим 3: Точечная правка
В этом режиме вы работаете с одной конкретной категорией паттернов. Например, вы можете сказать: «Убери только канцелярит» или «Избавь от жёстких банов» или «Убери длинные тире». Это полезно, если вы понимаете, в чём именно проблема, и хотите работать целенаправленно, не трогая остальное.
Установка и настройка
humanizer-ru разворачивается четырьмя различными путями в зависимости от вашего сценария использования: веб-интерфейс Claude.ai, организационное развёртывание для команды, локальные агенты (Claude Code, Cowork, API) или полностью ручная установка.
Способ 1: Claude.ai (веб-интерфейс)
Это самый простой способ для индивидуального пользователя. Скилл загружается прямо в ваш аккаунт Claude.ai и сразу становится доступным.
Пошаговая инструкция:
- Скачайте репозиторий ZIP-архивом, перейдя по ссылке:
https://github.com/ilyautov/humanizer-ru/archive/refs/heads/main.zip - Откройте Claude.ai в браузере и авторизуйтесь с вашим аккаунтом
- Перейдите в **Settings** (Параметры) → **Capabilities** (Возможности) → **Skills** (Скиллы)
- Нажмите кнопку **Upload skill** (Загрузить скилл)
- Выберите скачанный ZIP-архив и дождитесь завершения загрузки
Важное примечание: Если Claude.ai не принимает архив, потому что в нём вложена папка humanizer-ru-main, проделайте следующее:
git clone https://github.com/ilyautov/humanizer-ru.git zip -r humanizer-ru.zip humanizer-ru/
Затем загрузите новый архив в Claude.ai.
Способ 2: Организация (Enterprise и Team)
Если вы администратор Claude for Work в компании, вы можете развернуть скилл централизованно через workspace skill library. После централизованного развёртывания скилл станет доступным всем сотрудникам вашей организации без необходимости индивидуальной загрузки.
Пошаговая инструкция:
- Перейдите в **Admin Console** (Консоль администратора)
- Найдите раздел **Workspace Skills** (Скиллы рабочего пространства)
- Нажмите **Add skill** (Добавить скилл)
- Загрузите ZIP-архив humanizer-ru
- Выберите группы пользователей, которые получат доступ к скилу
- Подтвердите развёртывание
После этого скилл будет доступен всем в организации автоматически.
Способ 3: Claude Code, Cowork и API (локальные агенты)
Для работы со скиллом в локальных агентах (Claude Code, Cowork) или через API, используйте один из следующих методов.
Метод A: Через плагин-маркетплейс (рекомендуется)
/plugin marketplace add ilyautov/humanizer-ru /plugin install humanizer-ru@ilyautov-plugins
После установки плагин автоматически подгружает скилл при срабатывании триггеров вроде «очеловечь», «убери канцелярит», «перепиши как человек».
Метод B: Через skills.sh CLI (универсальный путь)
npx skills add ilyautov/humanizer-ru
После выполнения команды CLI создаст файл SKILL.md в директории ~/.claude/skills/humanizer-ru/ и автоматически зарегистрирует скилл в индексе skills.sh.
Метод C: Через Claude API
Если вы используете Claude API напрямую, передайте скилл параметром container.skills при вызове /v1/messages. Подробные инструкции смотрите в документации вашего API-клиента.
Пример вызова API:
curl https://api.anthropic.com/v1/messages \
-H "x-api-key: $ANTHROPIC_API_KEY" \
-H "anthropic-version: 2023-06-01" \
-H "content-type: application/json" \
-d '{
"model": "claude-opus-4-1",
"max_tokens": 2048,
"container": {
"skills": ["ilyautov/humanizer-ru"]
},
"messages": [{
"role": "user",
"content": "Очеловечь этот текст: [ваш текст]"
}]
}'
Способ 4: Ручная установка
Если ни один из способов выше не подошёл, вы можете установить скилл полностью вручную.
Вариант A: Через curl
mkdir -p ~/.claude/skills/humanizer-ru curl -o ~/.claude/skills/humanizer-ru/SKILL.md \ https://raw.githubusercontent.com/ilyautov/humanizer-ru/main/skills/humanizer-ru/SKILL.md
Вариант B: Через git clone
git clone https://github.com/ilyautov/humanizer-ru.git ~/.claude/skills/humanizer-ru
После ручной установки файл SKILL.md будет доступен локально, и вы сможете использовать его как с локальными агентами Claude, так и вставлять его содержимое в системный промпт любой другой LLM.
Использование скилла
humanizer-ru активируется через естественный язык. Вы просто говорите Claude, что хотите сделать с текстом, используя определённые ключевые слова (триггеры), и скилл понимает вашу команду.
Основные триггеры активации
Скилл срабатывает при следующих командах или их вариациях:
- «Очеловечь этот текст:» — полное редактирование с применением всех 52 паттернов
- «Перепиши, звучит как робот:» — очеловечивание, подчёркивающее неестественность текста
- «Убери следы нейросети:» — удаление AI-маркеров
- «Сделай живым:» — добавление жизни, ритма и эмоциональности
- «Звучит искусственно» — диагностика и очеловечивание
- «Перепиши как человек:» — полное переписывание в человеческом стиле
- «Убери канцелярит:» — точечная работа только с канцеляризмами
- «Слишком формально» — снижение формальности тона
- «Очистить от AI» — полная очистка от признаков машинного текста
- «Гуманизировать текст:» — альтернативное название полного редактирования
Режим аудита (только диагностика)
Если вы хотите, чтобы скилл только проверил текст без изменений, используйте эти команды:
- «Проверь этот текст на AI-маркеры:» — полная диагностика всех 52 паттернов
- «Найди признаки нейросети:» — поиск маркеров без редактирования
- «Проанализируй текст на AI:» — аналитический взгляд на текст
- «Есть ли здесь следы ChatGPT?» — поиск следов конкретной нейросети
Точечная правка отдельных категорий
Если вы знаете, в чём именно проблема, можете работать целенаправленно:
- «Убери канцелярит:» — работа только с категорией B (языковые маркеры)
- «Удали жёсткие баны:» — удаление 20 запрещённых конструкций
- «Исправь морфологию:» — работа с категорией E (морфологические маркеры)
- «Добавь иронии:» — работа с категорией F (тональные маркеры)
- «Убери избыточный болд:» — работа с категорией C (стилистические маркеры)
- «Упрости стиль:» — упрощение сложных конструкций
Примеры использования
Пример 1: Полное редактирование
Вы пишете Claude:
Очеловечь этот текст: В современном мире искусственный интеллект становится всё более важным инструментом. Стоит отметить, что данная технология способствует оптимизации рабочих процессов и повышению производительности. Комплексный подход к внедрению AI открывает новые горизонты для развития бизнеса. Позвольте предположить, что в ближайшем будущем эта технология будет иметь ещё большее значение.
Claude ответит очеловеченным текстом:
За последний год я работал с AI в пяти проектах. Два ускорились вдвое. Один развалился, потому что команда перестала думать и слепо верила алгоритму. В остальных AI помогал, но не решал основные проблемы. Короче говоря, AI работает, когда ты понимаешь его границы. Без этого понимания это просто ещё одна трата денег.
Пример 2: Режим аудита
Вы пишете:
Проверь этот текст на AI-маркеры: [вставьте текст]
Claude выдаст подробный отчёт:
[A] HARD BAN: "В современном мире..." [A] HARD BAN: "Стоит отметить, что..." [A] Empty authority: "важным инструментом" [B] Nominalization: "осуществляет внедрение" [B] Calque: "данная технология" [D] Ingratiating tone: "Позвольте предположить" [F] Emotional sterility: lack of irony, no personal judgment [J] Information rhythm: uniform density throughout Вероятность AI-текста: 94%
Пример 3: Точечная правка
Вы пишете:
Убери только канцелярит из этого текста: [вставьте текст]
Claude заменит только канцеляризмы вроде «осуществление внедрения» → «внедрили», но не будет трогать остальное.
Примеры до и после
Пример 1: Полное редактирование типичного AI-текста
ДО (AI-текст):
В современном мире искусственный интеллект играет всё более важную роль в различных сферах деятельности. Стоит отметить, что данная технология является мощным инструментом для оптимизации рабочих процессов. Комплексный подход к внедрению AI открывает новые горизонты для развития бизнеса. Позвольте предположить, что в ближайшем будущем эта технология будет иметь ещё большее значение для компаний всех размеров.
ПОСЛЕ (humanizer-ru):
За последний год я внедрил AI-инструменты в три проекта. Два ускорились вдвое. Третий развалился, потому что команда перестала проверять то, что выдаёт модель. Короче, AI работает, когда ты понимаешь его ограничения. Без этого понимания — это ещё одна трата денег.
Что изменилось:
- ✅ Убран HARD BAN «В современном мире...»
- ✅ Убран HARD BAN «Стоит отметить, что...»
- ✅ Убран HARD BAN «является мощным инструментом»
- ✅ Убран HARD BAN «играет важную роль»
- ✅ Канцелярит: «оптимизация рабочих процессов» → просто описание действий
- ✅ Канцелярит: «внедрение» (существительное) → «внедрил» (глагол)
- ✅ Маркетинговое клише «открывает новые горизонты» → конкретный результат
- ✅ Заискивание «позвольте предположить» убрано, добавлена уверенность
- ✅ Информационная плотность варьируется: есть короткие рублёные предложения и более длинные
- ✅ Добавлена личная точка зрения, опыт, нюансы реальности
- ✅ Добавлена ирония («третий развалился»), практический взгляд
Пример 2: Очеловечивание маркетингового текста
ДО (типичный маркетинговый AI-текст):
Решение SaaS компании X способствует развитию бизнеса и раскрыванию потенциала ваших сотрудников. Данный сервис открывает новые горизонты для оптимизации финансовых процессов. Позвольте предположить, что внедрение платформы обеспечивает комплексный подход к управлению ресурсами, что в свою очередь способствует долгосрочному развитию организации.
ПОСЛЕ (humanizer-ru):
Наше решение экономит время бухгалтерии на 5-6 часов в неделю. Ввод данных автоматизируется, ошибок стало меньше. У половины наших клиентов сокращается отдел, вторая половина просто нанимает меньше народу. За три года компании экономят в среднем 200 тысяч рублей в год.
Что изменилось:
- ✅ Все 20 жёстких банов убраны (способствует, раскрытию потенциала, открывает горизонты, комплексный подход)
- ✅ Вместо абстрактных выражений — конкретные цифры и результаты
- ✅ Вместо многословности — ясность и краткость
- ✅ Добавлены реальные примеры и побочные эффекты (часть клиентов сокращает отдел)
- ✅ Тон стал более уверенным и менее заискивающим
- ✅ Появилась вариативность информационной плотности
Пример 3: Выходные данные режима аудита
Исходный текст:
В современном мире искусственный интеллект становится всё более важным инструментом. Стоит отметить, что данная технология способствует оптимизации рабочих процессов и повышению производительности.
Отчёт аудита (режим 2: Человек с улицы):
═══════════════════════════════════════════════════════════════
QUAD-PASS AUDIT REPORT FOR HUMANIZER-RU
═══════════════════════════════════════════════════════════════
Проход 1: ДЕТЕКТОР (Pattern Matching)
[A] Пустое открытие: "В современном мире..."
Позиция: Абзац 1, Предложение 1
[A] HARD BAN: "Стоит отметить, что..."
Позиция: Абзац 1, Предложение 2
[A] HARD BAN: "является мощным инструментом"
Не найдено, но близко: "становится всё более важным инструментом"
[B] Nominalization: "оптимизации"
Замена рекомендуется: "оптимизации" → "оптимизировать"
[B] Calque from English: "данная технология"
Замена: "данная технология" → "эта технология" или просто "технология"
[D] Ingratiating tone: "Стоит отметить"
Удалить заискивание
Проход 2: ЧЕЛОВЕК С УЛИЦЫ (Street Reader)
⚠ Звучит неестественно на позиции 1-25 слов
⚠ Текст звучит как инструкция или отчёт, а не живой рассказ
Проход 3: КАРДИОГРАММА (Information Rhythm)
Средняя информационная плотность: 0.67
Вариативность: 0.12 (ОЧЕНЬ НИЗКАЯ - признак AI)
Рекомендация: Добавить вариативность (короткие и длинные предложения)
Проход 4: СКЕЛЕТ (First-Line Analysis)
"В современном мире..." - типичный AI-трюк (82% встречаемость в AI-текстах)
"Стоит отметить, что..." - шаблонная фраза (94% в AI-текстах)
Рекомендация: Полностью переписать первые два предложения
═══════════════════════════════════════════════════════════════
ВЕРОЯТНОСТЬ AI-ТЕКСТА: 91%
УЖАС: КРИТИЧЕСКИЙ
═══════════════════════════════════════════════════════════════
Обход детекторов: как это работает
humanizer-ru специально разработан для работы против современных AI-детекторов 2025-2026 годов. Вот что известно о каждом из них и как скилл их обходит.
GPTZero: perplexity и burstiness
Как работает детектор: GPTZero измеряет два основных метрики:
- Perplexity — насколько непредсказуем текст. AI-текст низкий perplexity (высокая предсказуемость)
- Burstiness — вариативность длин предложений. AI выравнивает длины, люди варьируют
Как humanizer-ru обходит:
- Контрастное вычитание: замена самого предсказуемого слова в каждом предложении на менее вероятное, но всё ещё естественное. Это повышает perplexity
- Рваный ритм: применение чередования коротких рублёных предложений и длинных периодов. Это повышает burstiness
- Адверсарный парафраз: переписывание сложных конструкций на более неожиданный способ
Эффективность по исследованиям (NeurIPS 2025): Адверсарный парафраз снижает true positive rate GPTZero на 87.88%.
DivEye: вторые производные surprisal
Как работает детектор: DivEye анализирует вторые производные surprise values (насколько каждое слово неожиданно). AI-текст имеет гладкие кривые, люди создают резкие скачки.
Данные по точности:
- DivEye на вторых производных surprisal: 39.4% точности на русском корпусе (т.е. часто ошибается)
- Perplexity gap: человеческие тексты 29.5, AI-тексты 15.2 — двукратная разница
Как humanizer-ru обходит: Вводя непредсказуемость на микроуровне (выбор редких, но правильных синонимов, нестандартный порядок слов), скилл создаёт резкие скачки в surprisal values, которые выглядят как признак человеческого письма.
RuBERT-детекторы: морфологический анализ
Как работает детектор: RuBERT обучена на 52K русских текстов с разметкой AI/человек. Детектор ищет морфологические и синтаксические аномалии, которые типичны для AI.
Данные по точности (AINL-Eval 2025):
- RuRoBERTa точность: 86.35% на корпусе из 52K русских текстов
- CoPA контрастное вычитание: +57.7% улучшения детекции (когда система знает о попытке обхода)
Как humanizer-ru обходит: Скилл использует лингвистическое знание русской морфологии (падежи, согласования, правильное использование деепричастий), которое недостижимо для BERT-моделей. Если RuBERT ищет «неправильные падежи», humanizer-ru заботится о том, чтобы все падежи были идеальными.
CoPA: контрастное вычитание (EMNLP 2025)
Как работает детектор: CoPA (Contrastive Perturbation Analysis) — это новый метод, который в EMNLP 2025 показал очень хорошие результаты. Система изменяет части текста и смотрит, насколько логика нарушается. AI-текст логически хрупче.
Как humanizer-ru обходит: Скилл создаёт не просто альтернативные формулировки, а форматирует текст так, чтобы любые изменения были логически значимыми, как в естественном тексте человека.
PIFE: фонетико-информационные признаки
Как работает детектор: PIFE анализирует паттерны распределения информации с фокусом на фонетические и ритмические паттерны русского языка.
Как humanizer-ru обходит: Калибровка под голос автора учитывает фонетические предпочтения — какие гласные и согласные скопления вам нравятся, как часто вы используют звонкие согласные.
MASH, Antislop и другие
Дополнительные исследовательские детекторы (MASH, Antislop, AINL-Eval) используют комбинацию методов выше. humanizer-ru охватывает их через комбинацию всех вышеперечисленных техник.
Важное замечание
humanizer-ru — это не инструмент для обмана. Это инструмент для очеловечивания. Если вы использовали AI для черновика (что совершенно нормально в 2025-2026), humanizer-ru помогает сделать финальный результат звучащим как ваш собственный текст, а не как дампованный вывод из чат-бота. Это этично.
Сравнение с англоязычным humanizer
Существует известный проект humanizer на английском языке (blader/humanizer). humanizer-ru принципиально отличается от него. Вот подробное сравнение.
| Характеристика | humanizer-ru | blader/humanizer |
|---|---|---|
| Язык | Русский (с учётом русской морфологии) | Английский |
| Количество паттернов | 52 паттерна | 29 паттернов |
| Жёсткие баны | 20 жёстких запрещённых конструкций | Не реализовано |
| Метод аудита | Quad-pass (4 независимых прохода) | Single-pass (один проход) |
| Калибровка под голос | Да, анализирует ритм, лексику, пунктуацию, тон | Да, но базовая версия |
| Фингерпринты 2025-2026 | Да (рваная медитативность, контр-вопросы, эмодзи-декор, псевдо-терапия) | Нет |
| Морфологический анализ RuBERT | Да, полная поддержка русской морфологии | Английская морфология |
| Macro-burstiness структурных блоков | Да, анализ на уровне абзацев | Нет |
| Режим аудита | Полный диагностический отчёт | Базовая диагностика |
| Три режима работы | Полное редактирование, аудит, точечная правка | Principalmente полное редактирование |
| Поддержка Claude | Скилл Claude (native) | Не специализирован для Claude |
Почему humanizer-ru нужен отдельно
Фундаментальная причина: англоязычный humanizer ловит универсальные маркеры, которые работают на любых языках (например, низкий perplexity, равномерная информационная плотность). Но русский язык имеет свои уникальные маркеры, которые англоязычный проект не может охватить:
- Канцелярит — уникальный русский феномен, номинализация глаголов («осуществление внедрения» вместо «внедрили»)
- Кальки с английского — русские AI-модели часто копируют английский синтаксис, который выглядит странно на русском
- Частицы — русские частицы «же», «ведь», «вот» почти не встречаются в AI-текстах, но частые в живой речи
- Падежные согласования — RuBERT-детекторы обучены выявлять морфологические ошибки, специфичные русскому
- Стилистические фингерпринты 2025-2026 — новые паттерны Claude и GPT (рваная медитативность, эмодзи-декор, псевдо-терапия) появились позже англоязычного humanizer и требуют отдельной валидации
Научные источники и исследования
humanizer-ru собран из четырёх независимых источников, включая официальные исследования и архивные статьи. Это делает его обоснованным на науке, а не на эмпирике.
Основные источники разработки
- Wikipedia: WikiProject AI Cleanup — базовый каталог признаков AI-текста на русском языке, поддерживаемый русскоязычным сообществом
- 15+ русскоязычных публикаций:
- Habr (популярный сайт о технологиях на русском)
- vc.ru (портал о стартапах и технологиях)
- Gramota.ru (авторитетный справочник русского языка)
- Стилометрические исследования ВШЭ (Высшей школы экономики)
- Dialog Conference (RuATD-2022 и AINL-Eval 2025) — специализированные конференции по русскому NLP
- TechInsider (русскоязычное издание о технологиях)
- Kokoc.com (база знаний о русском языке и обработке текста)
- 106 arxiv-статей (2024-2026) по специализированным методам:
- Biber framework (для анализа стилистических вариаций)
- DivEye и методы анализа surprisal
- CoPA (Contrastive Perturbation Analysis) EMNLP 2025
- PIFE (Phonetic-Informatical Feature Extraction)
- MASH и Antislop методы
- AINL-Eval 2025 русскоязычные бенчмарки
- NeurIPS 2025 исследования по адверсарному парафразу
Конкретные результаты исследований
На что опирается эффективность humanizer-ru:
- DivEye точность на русском: 39.4% на вторых производных surprisal (исследование 2025)
- Perplexity gap между человеком и AI: 29.5 vs 15.2 (двукратная разница)
- CoPA контрастное вычитание: +57.7% улучшения при знании о попытке обхода
- AINL-Eval 2025: RuRoBERTa выходит на 86.35% точности на 52K русских размеченных текстов
- Адверсарный парафраз (NeurIPS 2025): снижает true positive rate детекторов на 87.88%
Полный changelog с ссылками на источники находится в файле SKILL.md прямо в репозитории на GitHub.
Часто задаваемые вопросы
Как обойти GPTZero на русском?
GPTZero измеряет perplexity (предсказуемость) и burstiness (вариативность длин предложений). humanizer-ru использует два приёма: контрастное вычитание (замена самого предсказуемого слова в каждом предложении на менее вероятное) повышает perplexity, а рваный ритм (чередование коротких и длинных предложений) повышает burstiness. Адверсарный парафраз по данным NeurIPS 2025 снижает true positive rate на 87.88%.
Как убрать признаки ChatGPT из текста?
Главные сигналы ChatGPT на русском: «не просто X, а Y» (встречается в 80%+ AI-текстов), «стоит отметить», «является», длинное тире, отсутствие частиц «же/ведь/вот», равномерная информационная плотность. humanizer-ru ловит и заменяет все эти 52 паттерна, включая 20 жёстких банов. После обработки текст звучит как написанный человеком.
Как сделать текст ChatGPT человеческим на русском?
Есть три основных шага: (1) убрать 20 жёстких банов — обязательные конструкции, которые используют только AI; (2) пройти контрастным вычитанием — одна замена на предложение, которая повышает непредсказуемость; (3) добавить речевые привычки — частицы, иронию, личное мнение, метафоры. Калибровка под голос автора усиливает эффект, заставляя текст звучать именно как вы.
Что такое канцелярит и как его убрать?
Канцелярит — это превращение глаголов в отглагольные существительные: «осуществление внедрения» вместо «внедрили», «проведение анализа» вместо «проанализировали». Это главный маркер русских AI-текстов. Соотношение существительных к глаголам у AI примерно 3:1, а у людей 2:1. humanizer-ru разворачивает номинализации обратно в глаголы, делая текст более живым и энергичным.
Работает ли humanizer-ru с Claude Sonnet / Opus 4?
Да, абсолютно. humanizer-ru — это каталог инструкций, которые работают с любой версией Claude (Sonnet 3.5, Opus 4, Haiku). Скилл работает через естественный язык, поэтому чем больше контекст модели, тем глубже она может применять правила. На Claude Opus результат заметно сильнее на длинных текстах (от 2000+ слов), потому что модель может держать в памяти весь текст целиком и применять quad-pass аудит глубже.
Можно ли использовать humanizer-ru без плагина?
Да, есть несколько способов: (1) скачайте SKILL.md из репозитория и используйте его как чек-лист для ручной правки; (2) вставьте содержимое SKILL.md в системный промпт любой LLM (ChatGPT, Gemini, YandexGPT, GigaChat) и дайте ей инструкции очеловечивания; (3) клонируйте репозиторий и интегрируйте в свой pipeline обработки текста. humanizer-ru — это просто набор правил, а не proprietary код, так что вы можете использовать его как угодно.
Что произойдёт, если я загружу текст, который уже написан человеком?
Если текст действительно написан человеком, quad-pass аудит не найдёт маркеров AI, и скилл вернёт его почти без изменений (только небольшие улучшения стиля при необходимости). Если скилл кое-что поменяет, это будут только улучшения (например, замена прессованных фраз на более живые), а не ломание авторского голоса. Проход 2 (Человек с улицы) специально разработан для минимизации ложных срабатываний.
Как обучить скилл на свой стиль письма?
Дайте Claude несколько своих текстов (3-5 статей или постов по 500+ слов каждая) и попросите: «Проанализируй мой стиль письма». Claude выделит ваши лингвистические маркеры — любимые слова, ритм, пунктуацию, тон. Затем скажите: «Используй мой стиль при очеловечивании текста». После этого все улучшения будут применяться с учётом вашей личной манеры письма.
Полезные ссылки и ресурсы
Официальные ссылки
- GitHub репозиторий: https://github.com/ilyautov/humanizer-ru
- SKILL.md (полное описание всех 52 паттернов): https://github.com/ilyautov/humanizer-ru/blob/main/skills/humanizer-ru/SKILL.md
- Releases (история версий): https://github.com/ilyautov/humanizer-ru/releases
- skills.sh регистрация: https://skills.sh/ilyautov/humanizer-ru
Установка и использование
- Claude.ai веб-интерфейс: https://claude.ai
- Claude API документация: https://docs.anthropic.com
- skills.sh CLI: https://skills.sh
- GitHub CLI для клонирования: https://cli.github.com
Релевантные исследования
- AINL-Eval 2025: Русскоязычные бенчмарки для оценки AI-текстов
- Dialog Conference 2022-2026: Конференция по обработке естественного языка
- NeurIPS 2025: Исследования по адверсарному парафразу
- EMNLP 2025: CoPA (Contrastive Perturbation Analysis) метод
- ВШЭ стилометрия: Исследования русского языка и стилистики
Смежные инструменты
- GPTZero: Детектор AI-текстов https://www.gptzero.me
- DivEye: Анализ surprisal и burstiness
- RuBERT: Русская BERT-модель для анализа морфологии
- Gramota.ru: Справочник русского языка
