Foundation Model
Определение
Фундаментальная модель — большая AI-модель, предобученная на огромных объёмах данных, которая может быть адаптирована для множества различных задач.
Простое объяснение
Это как универсальный суперумный мозг, который знает очень много всего и может научиться любой новой задаче.
Подробнее
Характеристики foundation models:
- Обучение на интернет-масштабных данных
- Миллиарды параметров
- Emergent abilities — способности, не заложенные явно
- Мультимодальность (текст, изображения, аудио)
Примеры: GPT-4, Claude, Gemini, LLaMA.
Связанные термины
Inpainting
Inpainting — техника заполнения выделенных областей изображения новым контентом, сгенерированным AI с учётом контекста.
Context Window
Контекстное окно — максимальный объём текста (в токенах), который языковая модель может обработать за один раз, включая входной запрос и генерируемый ответ.
Multimodal AI
Мультимодальный AI — системы, способные обрабатывать и генерировать данные разных типов: текст, изображения, аудио, видео — одновременно.
Image-to-Image
Image-to-Image (img2img) — генерация нового изображения на основе входного с учётом текстового промпта и степени изменения.
