LLM 评测利器：一站式自动化评估框架 | 开源日报 No.647

LLM 评测利器：一站式自动化评估框架 | 开源日报 No.647

deepeval 是一个开源 LLM 评估框架，提供端到端测试、多种现成评估指标 (如 G-Eval、RAG)、合成数据集生成、CI/CD 集成和自定义指标功能，并支持与 Confident AI 平台集成。

confident-ai/deepeval

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-deepeval

deepeval 是一个简单易用的开源大型语言模型（LLM）评估框架，旨在对大型语言模型系统进行评估和测试。

支持端到端和组件级别的 LLM 评估。
提供多种现成可用的 LLM 评估指标，包括 G-Eval、RAG 和 Agentic 指标等。
能够生成合成数据集以进行评估，并与任何 CI/CD 环境无缝集成。
可自定义度量标准并自动与 DeepEval 的生态系统集成。
集成 Confident AI 平台，实现完整的评价生命周期管理。

xiangechen/chili3d

Github Repo Stars License: `AGPL-3.0` Language: `Unknown`

demo-picture-of-chili3d

Chili3D 是一个基于网页的 3D CAD 应用程序，用于在线模型设计和编辑。

支持创建基本形状（如立方体、圆柱、锥体等）和 2D 草图
提供布尔运算、挤出与旋转等高级操作
精确的对象捕捉与跟踪功能，确保准确对齐
强大的编辑工具，包括修改、变换及复杂形状处理
测量工具可计算角度和长度，并支持文档管理功能
友好的用户界面，具备多语言支持（中文与英文）

albertobsd/keyhunt

Github Repo Stars License: `MIT` Language: `Unknown`

cover

keyhunt 是一个用于寻找使用 secp256k1 椭圆曲线的加密货币私钥的工具。

支持比特币和以太坊地址的压缩与解压缩
提供多种模式，包括地址模式、rmd160 模式和 bsgs 模式
允许用户通过文本文件输入公钥列表进行搜索
可在 Linux 环境中编译并运行，适合开发者使用

aaedmusa/Capstan-Drive

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

Capstan-Drive 是一个利用 Capstan Drive 减速器的机器人执行器测试台。

采用 PLA 材料进行 3D 打印
重量为 852 克
提供 120° 的旋转范围
实现了 8.55:1 的减速（准直接驱动）
两个鼓轮上有螺旋图案以引导绳索展开
配备用于张紧绳索的丝杠装置
使用 ODrive S1 FOC 控制器
搭载 Eagle Power 90KV BLDC 电机

tjdevries/config.nvim

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

config.nvim 是一个为 TJ 定制的 Neovim 配置文件。

适用于个人化的 Neovim 设置
提供了 TJ 的特定配置示例
可供他人参考以了解如何定制自己的配置