AI新工具

blog-thum
Logic Rl

Logic RL是一个基于强化学习的逻辑推理模型,成功在2K逻辑难题数据集上复现DeepSeek R1 Zero。

read more
blog-thum
OpenHealth

OpenHealth是一个本地运行的AI健康助手,可帮助您管理和理解个人健康数据。

read more
blog-thum
deepseek.cpp

deepseek.cpp 是一个基于 C++ 的 CPU-only 推理实现,旨在为 DeepSeek 大语言模型提供支持,专注于简洁性和低硬件需求。

read more
blog-thum
R1-V

R1-V项目旨在通过强化学习提升视觉语言模型的泛化能力与训练效率,贡献开源研究。

read more
blog-thum
s1

s1是一个简单的测试时间缩放方法,能基于1000个示例和预算限制实现强推理性能。

read more