And I thinkthattherewas a certainmomentinourtrainingprocesswhereweputmorecomputesinour L thanbeforeandtrainedfirstwhilegeneratingcoherentchainsofthought.
I thinkrelatedtothat, whenwethinkabouttraining a modelforreasoning, onethingthatimmediatelyjumpstomindisyoucouldhavehumanswriteouttheirthoughtprocessandtrainonthat.
For a lotofthetimethat I'vebeenhere, we'vebeentryingtomakethemodelsbetteratsolvingmathproblems, asanexample.
私がここにいる間、私たちは数学の問題を解くのに優れたモデルを作ろうとしてきた。
Andwe'veput a lotofworkintothis.
そして、私たちはこれに多くの労力を費やしてきた。
Andwe'vecomeupwith a lotofdifferentmethods.
そして、私たちはさまざまな方法を考え出した。
Butonethingthat I kept, like, everytime I wouldreadtheseoutputsfromthemodels, I'd alwaysbesofrustratedthatthemodeljustwouldneverseemtoquestionwhatwaswrongorwhenitwasmakingmistakesorthingslikethat.