Start / Microsoft Research Podcast / Abstracts neurips 2024 with weizhu chen

Abstracts: NeurIPS 2024 with Weizhu Chen 

8 min • 6 december 2024

Next-token prediction trains a language model on all tokens in a sequence. VP Weizhu Chen discusses his team’s 2024 NeurIPS paper on how distinguishing between useful and “noisy” tokens in pretraining can improve token efficiency and model performance.

Kategorier

Förekommer på

00:00 -00:00

Abstracts: NeurIPS 2024 with Weizhu Chen

Abstracts: NeurIPS 2024 with Weizhu Chen