Featured image of post 低成本实验首选:单 GPU 上快速训练完整 LLM 流程 | 开源日报 No.877

低成本实验首选:单 GPU 上快速训练完整 LLM 流程 | 开源日报 No.877

nanochat 是一个极简的开源大型语言模型训练框架,专为单 GPU 节点设计,涵盖模型训练的完整流程,包括分词、预训练、微调、评估和推理,配有类似 ChatGPT 的交互界面。它支持在 8XH100 GPU 节点上以低成本快速训练模型,代码结构简洁,适合快速实验和定制,提供一键启动的标准化脚本,显著降低训练时间和成本。

Awesome Claude Skills:实用技能、资源和工具的精选集合 | 开源日报 No.875

awesome-claude-skills 是一个为 Claude AI 定制工作流的资源集合,提供多种可定制的 Claude Skills,支持在 Claude.ai、Claude Code 和 Claude API 上执行任务。该项目通过 connect-apps 插件连接超过 500 个第三方应用,支持自动化功能,涵盖文档处理、开发工具和数据分析等多种技能,此外还支持将 Markdown 转换为 EPUB 电子书,并集成安全测试和调试工具,提升开发效率和产品质量。

移动设备也能全双工,实时“看听说”交互新模型 | 开源日报 No.876

MiniCPM-o 是一款针对移动设备的多模态大语言模型,支持视觉、语音及全双工多模态实时流处理,具备 90 亿参数,能够处理图像、视频、文本和音频输入,提供高质量的文本和语音输出。其全双工设计支持同步的多模态交互,具备中英双语实时对话和声音克隆能力,延续了 MiniCPM-V 系列的强大功能,配备了低延迟的推理框架和演示,适用于本地设备。