llm-agents
stable-baselines3
2.8k starsUpdated 2026-01-03
Compatible with:claude
描述
Use this skill for reinforcement learning tasks including training RL agents (PPO, SAC, DQN, TD3, DDPG, A2C, etc.), creating custom Gym environments, implementing callbacks for monitoring and control, using vectorized environments for parallel training, and integrating with deep RL workflows. This s
如何使用
- 访问 GitHub 仓库获取 SKILL.md 文件
- 将文件复制到您的项目根目录或 .cursor/rules 目录
- 重启您的 AI 助手或编辑器以应用新技能
Tags
#stable-baselines3#claude
相关技能
agent-identifier
当用户要求创建代理、添加代理、编写子代理,或需要代理结构、系统提示、触发条件的指导时使用。
47.9k
configured-agent
当用户询问插件设置、存储插件配置、用户可配置插件、.local.md 文件或插件状态文件时使用。
47.9k
command-name
当用户要求创建插件、搭建插件、理解插件结构、组织插件组件或设置 plugin.json 时使用。
47.9k
claude-opus-4-5-migration
将提示和代码从 Claude Sonnet 4.0、Sonnet 4.5 或 Opus 4.1 迁移到 Opus 4.5。处理模型字符串更新和提示调整。
47.9k
PPTX creation, editing, and analysis
AI翻译暂未集成: description: "Presentation creation, editing, and analysis. When Claude needs to work with presentat
31.9k