Sveriges mest populära poddar

ExplAInable

על למידה חיזוקית באימון מודלי שפה RLHF עם מייק

55 min • 13 juni 2023

קשה לעבור ברחוב היום בלי לשמוע מישהו מספר לחברו על צ'אט ג'י פי טי או
LLM

אחד החידושים באימון שלו, למעשה ב
InstructGPT
היו השימוש בלמידה חיזוקית על בסיס דאטא מתויג אנושי בתהליך הדגימה

נספר על אלגוריתם ה
RLHF
ושילובו בתוך מודלי השפה
LLM

Kategorier
Förekommer på
00:00 -00:00