ryomo's tech blog
タグ
About
『AI』タグ
2025-04-18
日本語LLMのSarashinaをGRPOでトレーニングしてReasoning Modelを作る
2025-02-25
さくらの高火力DOKでLlama3.1をGRPOトレーニング