LLM простыми словами
Цели урока
После прохождения этого урока вы сможете:
- 1Понять концепцию "предсказания следующего слова"
- 2Узнать, что такое токены и почему они важны
- 3Увидеть, как из простого принципа рождается "интеллект"
Одна простая идея, невероятные результаты
LLM (Large Language Model) — это программа, обученная одной задаче: предсказать следующее слово в тексте. Звучит просто? Но когда эту задачу выполняет нейросеть с сотнями миллиардов параметров, обученная на триллионах слов — результаты поражают.
Модель предсказывает: "Москва" (с высокой вероятностью)
Промпт: "Напиши бизнес-план для кофейни"
Модель предсказывает слово за словом: "1." → "Резюме" → "проекта" → ":" → ...
Каждое слово — предсказание на основе всего предыдущего контекста.
Что такое токены?
LLM не работает с буквами или словами напрямую. Она разбивает текст на "токены" — кусочки, которые могут быть словом, частью слова или даже одним символом.
Токены определяют стоимость использования AI (вы платите за токены) и ограничения по длине текста. Русский текст обычно требует больше токенов, чем английский — это влияет на цену.
Температура: креативность vs точность
Когда модель предсказывает следующий токен, она выдаёт вероятности для всех возможных вариантов. Параметр "температура" определяет, насколько "смело" модель выбирает:
| Температура | Поведение | Когда использовать |
|---|---|---|
| 0 (низкая) | Всегда выбирает самый вероятный вариант | Факты, анализ, код |
| 0.7 (средняя) | Баланс между точностью и разнообразием | Большинство задач |
| 1.0+ (высокая) | Более случайный, креативный выбор | Брейншторм, творчество |
Откуда берётся "понимание"?
LLM не понимает мир как человек. Но обучившись на триллионах текстов, она "выучила":
- Факты — кто такой Пушкин, какая столица Японии
- Логику — если A больше B, а B больше C, то A больше C
- Стиль — как пишут юристы, поэты, программисты
- Контекст — что уместно в деловом письме, а что в мемах
- Структуру — как выглядит бизнес-план, научная статья, код
LLM может уверенно утверждать, что 2+2=5, если контекст промпта направляет её в эту сторону. Она оптимизирована для правдоподобия, не для истины.
Думайте об LLM как о блестящем имитаторе, а не о мыслителе. Это меняет подход: вы не "спрашиваете мудрого советника", а "инструктируете мощный инструмент".
Вопросы для размышления
- •Как знание о токенах может помочь вам экономить при использовании AI API?
- •Почему AI иногда даёт разные ответы на один и тот же вопрос?
