LLaMa-2: лучшая опенсорсная языковая модель (by Meta) Авторы | AbstractDL

LLaMa-2: лучшая опенсорсная языковая модель (by Meta)

Авторы обновили обучающий датасет, сделав его чище и больше (2T токенов), добавили более быстрый grouped-query attention, удлинили контекст до 4k токенов и учили в несколько этапов: pretraining, supervised fine-tuning, RLHF.

Из интересных наблюдений — RL не просто портит калибровку вероятностей (что первыми заметили openAI), а на самом деле корректирует температуру, балансируя между фактологической точностью и креативностью, в зависимости от промпта.

Статья, GitHub, HuggingFace

AbstractDL

👨‍🎤 7.44K
Tecnologie

Коротко про классные штуки в CV, NLP и AI 🤷‍♂️. Автор: @razzant . Нейро Конфуций: @neural_chat_bot. Рекламу не публикую...

Join
▲ Vote (1)

LLaMa-2: лучшая опенсорсная языковая модель (by Meta) Авторы | AbstractDL

Login