データベースに戻る
📀 出典のデータベース: LLM強化学習ツール・プラットフォーム一覧
ツール・プラットフォーム名
trlX
🗓 更新日: 5/10/2025
公開中項目
対応するLLMの種類
GPT-NeoXなどの言語モデル(最大200億パラメータ規模),
brainpad.co.jp
強化学習手法の種類
PPOおよびImplicit Language Q-Learning (ILQL),
brainpad.co.jp
主な特徴・機能
CarperAI提供のPythonライブラリで、200億パラメータ規模までのLLMファインチューニングをサポート。PPOに加えILQLも利用可能。, CarperAIが提供するPythonライブラリで、GPT-NeoXなどの言語モデルについて200億パラメータ規模までのファインチューニングをサポート。PPOに加えImplicit Language Q-Learning (ILQL)も利用可能。Hugging Faceのアカウントを通じてヒューマンフィードバック用のデータセットや学習済みモデルにアクセス可能。分散学習フレームワークとしてLLMのファインチューニングを支援。, CarperAI提供のPythonライブラリで、200億パラメータ規模までのLLMファインチューニングをサポート。PPOに加えILQLも利用可能。Hugging Faceのアカウントを通じてヒューマンフィードバック用のデータセットや学習済みモデルにアクセス可能。分散学習フレームワークとしてLLMのファインチューニングを支援。
brainpad.co.jp
利用料金体系
情報なし