LangBot 是一个开源的即时通信机器人平台,支持多种消息平台 (如 QQ、微信、飞书、Discord) 和大型语言模型 (如 OpenAI GPT 和 ChatGPT)。它具备高稳定性和完整的功能 (如访问控制和敏感词过滤),支持插件扩展,拥有活跃的社区生态,并提供 Web 管理面板以便于管理实例。
wechat-bot 是一个基于 WeChaty 的开源微信机器人,结合多种 AI 服务 (如 DeepSeek、ChatGPT、Kimi 和讯飞),能够自动回复微信消息、管理微信群和好友,检测僵尸粉,提升群聊质量。该项目简单易用,支持多种 AI 服务配置和自定义白名单,灵活性高。
OmniParser 是一个开源的屏幕解析工具,旨在为基于视觉的 GUI 代理提供支持,能够将用户界面截图解析为结构化元素,增强 GPT-4V 生成界面交互的能力,支持多种大型语言模型,提供细粒度的图标检测和交互预测,尤其在 Windows Agent Arena 中表现突出,受到广泛欢迎。
OCRmyPDF 是一个开源工具,旨在为扫描的 PDF 文件添加可搜索的 OCR 文本层,支持生成 PDF/A 文件,保持图像分辨率,优化文件大小,并可在多个 CPU 核心上并行处理,使用 Tesseract OCR 引擎支持多语言识别,确保用户数据的私密性。
Onlook 是一个开源设计工具,允许用户在实时的 React 应用中进行设计,支持与 TailwindCSS 集成,提供实时编辑、项目聊天功能、快速定位代码的右键功能,旨在提升设计与代码的无缝协作。
ImageToolbox 是一款功能强大的开源图像处理应用,支持批量处理和 230 多种滤镜,提供裁剪、背景擦除、EXIF 数据编辑等基本工具,能够将图片转换为 PDF,适合摄影师和开发者使用,界面简洁,功能丰富。
asdf 是一个可扩展的版本管理工具,支持多种编程语言的运行时版本管理,提供统一的命令行工具和全局配置,允许每个项目使用独立的版本配置文件,支持现有配置文件的迁移,自动切换运行时版本,并具备简单的插件系统和多种 shell 的补全功能。
Lucide 是一个开源的图标工具包,源自 Feather Icons,提供超过 1000 个矢量图标,旨在简化设计师和开发者在项目中整合图标的过程。它提供多种官方软件包,完全免费,适用于商业和个人用途,采用 ISC 许可证。
browser-use 是一个开源工具,旨在使网站能够被 AI 代理访问,支持自动化操作,提供即用型托管版本,支持多种任务执行,用户可通过简单的 Python 代码快速启动,且附有丰富的示例和演示,便于理解和使用。
Janus 是一个开源的统一多模态理解和生成模型系列,支持多模态数据的理解与生成,提升文本到图像的指令跟随能力。它采用解耦视觉编码,增强了框架的灵活性和有效性。Janus-Pro 和 JanusFlow 提供了更先进的功能,显著提升视觉生成质量,成为下一代统一多模态模型的有力候选。