LLM
Определение
Большая языковая модель (LLM) — нейронная сеть с миллиардами параметров, обученная на огромных текстовых корпусах для понимания и генерации естественного языка.
Простое объяснение
LLM — это суперумная программа, которая прочитала почти весь интернет и научилась писать тексты как человек.
Подробнее
Характеристики LLM:
- Миллиарды/триллионы параметров
- Обучение на интернет-масштабных данных
- Способность к few-shot learning
- Emergent abilities (рассуждения, код)
Примеры: GPT-4, Claude 3, Gemini, LLaMA, Mistral.
Связанные термины
Context Window
Контекстное окно — максимальный объём текста (в токенах), который языковая модель может обработать за один раз, включая входной запрос и генерируемый ответ.
Промпт
Текстовый запрос или инструкция, которую пользователь даёт AI-модели для получения нужного результата.
Фундаментальная модель
Фундаментальная модель — большая AI-модель общего назначения, обученная на огромных данных и адаптируемая для множества задач.
Token
Токен — минимальная единица текста, обрабатываемая языковой моделью; обычно это слово, часть слова или символ.
