Преобразование и трансформация текста
Цели урока
После прохождения этого урока вы сможете:
- 1Освоить техники изменения тона и стиля текста
- 2Научиться преобразовывать форматы данных
- 3Применять трансформации для локализации и адаптации
Трансформация: изменение формы без потери смысла
Трансформация — это преобразование текста из одной формы в другую: перевод, изменение тона, конвертация форматов, адаптация под аудиторию. LLM справляется с этим блестяще.
Перевод и локализация
LLM — это не просто переводчик, а локализатор. Он может адаптировать культурные отсылки, идиомы, форматы дат и валют.
# Простой перевод
prompt_translate = "Переведи на английский: Привет, как дела?"
# Локализация с адаптацией
prompt_localize = """
Локализуй текст для американской аудитории.
Адаптируй:
- Культурные отсылки
- Единицы измерения (метры → футы)
- Валюту (рубли → доллары по курсу 90)
- Формат даты (ДД.ММ.ГГГГ → MM/DD/YYYY)
Текст: """
Скидка 30% на все товары до 31.12.2024!
Доставка по Москве — 300 ₽, от 5000 ₽ — бесплатно.
Наш магазин работает как часы уже 10 лет.
"""
"""Изменение тона и стиля
Один и тот же текст может звучать совершенно по-разному в зависимости от аудитории.
original = """
В связи с проведением технических работ на сервере,
доступ к личному кабинету будет временно ограничен
в период с 02:00 до 06:00 по московскому времени.
Приносим извинения за доставленные неудобства.
"""
prompt = f"""
Перепиши текст в трёх разных стилях:
1. ДРУЖЕЛЮБНЫЙ (для email молодой аудитории):
- Неформальный тон
- Можно использовать эмодзи
- Лёгкий юмор уместен
2. КОРПОРАТИВНЫЙ (для B2B клиентов):
- Формальный тон
- Профессиональная лексика
- Акцент на надёжность
3. TELEGRAM-КАНАЛ (для поста):
- Короткий формат
- Attention-grabbing
- Чёткий призыв к действию
Исходный текст: """{original}"""
""""Привет! 🌙 Сегодня ночью мы немного поколдуем над серверами (с 2 до 6 утра). Личный кабинет будет спать вместе с вами. Утром всё заработает как новенькое! ✨"
Преобразование форматов данных
LLM отлично справляется с конвертацией между форматами: JSON ↔ XML ↔ YAML ↔ таблицы ↔ текст.
# JSON → Markdown таблица
json_data = """
[
{"name": "iPhone 15", "price": 89990, "stock": 50},
{"name": "Samsung S24", "price": 79990, "stock": 30},
{"name": "Pixel 8", "price": 69990, "stock": 15}
]
"""
prompt = f"""
Преобразуй JSON в Markdown-таблицу.
Добавь колонку "Статус" на основе stock:
- stock > 30: "В наличии ✅"
- stock 10-30: "Мало 🟡"
- stock < 10: "Заканчивается 🔴"
JSON: {json_data}
"""
# HTML → Чистый текст с сохранением структуры
prompt_html = """
Преобразуй HTML в чистый текст, сохранив структуру:
- Заголовки → ## Заголовок
- Списки → маркированные списки
- Ссылки → [текст](url)
- Убери все стили и скрипты
HTML: """{html_content}"""
"""Проверка грамматики и стиля
LLM — мощный инструмент для редактирования. Он может не только исправить ошибки, но и объяснить их.
text_with_errors = """
Компания обЪявила о выходи нового продукта.
Это будет самый лутший смартфон на рынке которые мы когда либо выпускали.
Презинтация состоиться 15ого марта.
"""
prompt = f"""
Проверь текст и исправь ошибки.
ФОРМАТ ВЫВОДА:
1. Исправленный текст
2. Список найденных ошибок с объяснением:
- Ошибка: что было → что стало
- Тип: орфография/пунктуация/грамматика/стилистика
- Правило: краткое объяснение
Текст: """{text_with_errors}"""
"""Практический кейс: универсальный адаптер контента
Представьте: у вас есть один пресс-релиз, и нужно адаптировать его для 5 каналов.
press_release = """
Компания TechStartup привлекла $10 млн инвестиций в раунде Series A.
Лид-инвестор — фонд VentureCapital Partners. Средства будут направлены
на масштабирование AI-платформы и выход на международные рынки.
Основатель компании Иван Петров прокомментировал: "Это важная веха
в развитии компании. Мы планируем удвоить команду и запустить
продукт в 10 новых странах до конца года."
"""
prompt = f"""
Адаптируй пресс-релиз для разных каналов:
1. LINKEDIN (для профессиональной аудитории):
- 150-200 слов
- Профессиональный тон
- Добавь 3-5 релевантных хэштегов
2. TWITTER/X (для широкой аудитории):
- До 280 символов
- Attention-grabbing
- 2-3 хэштега
3. TELEGRAM-КАНАЛ (для tech-аудитории):
- 100-150 слов
- Можно эмодзи
- Добавь свой комментарий от лица редакции
4. EMAIL для ИНВЕСТОРОВ:
- Формальный тон
- Фокус на метриках и перспективах
- Структура: тема письма + тело
5. ВНУТРЕННЯЯ РАССЫЛКА для сотрудников:
- Праздничный тон
- Фокус на команде и достижениях
- Мотивирующее завершение
Пресс-релиз: """{press_release}"""
"""Сохраняйте шаблоны трансформаций! Если вы регулярно адаптируете контент для одних и тех же каналов, создайте библиотеку промптов.
Вопросы для размышления
- •Какой контент вы регулярно адаптируете для разных аудиторий?
- •Как автоматическая трансформация могла бы сэкономить ваше время?
