2023 ReinforcedSelfTrainingReSTforLa

Subject Headings:

Notes

No_abstract

;

	Author	volume	Date Value	title	type	journal	titleUrl	doi	note	year
2023 ReinforcedSelfTrainingReSTforLa	Arnaud Doucet Nando de Freitas Caglar Gulcehre Wolfgang Macherey Alex Ahern Tom Le Paine Srivatsan Srinivasan Ksenia Konyushkova Lotte Weerts Abhishek Sharma Aditya Siddhant Miaosen Wang Chenjie Gu Orhan Firat			Reinforced Self-Training (ReST) for Language Modeling				10.48550/arXiv.2308.08998		2023