Category tech Tag: pre-training • luminary.blog

by Oz Akan

Tags

$Which Loss Function Do LLMs use?

Which Loss Function Do LLMs use?

Exploring Cross-Entropy Loss in Large Language Models.

Sep 9, 2025 • Oz Akan • Technical