Featured image of post LLM 评测利器:一站式自动化评估框架 | 开源日报 No.647

LLM 评测利器:一站式自动化评估框架 | 开源日报 No.647

deepeval 是一个开源 LLM 评估框架,提供端到端测试、多种现成评估指标 (如 G-Eval、RAG)、合成数据集生成、CI/CD 集成和自定义指标功能,并支持与 Confident AI 平台集成。

confident-ai/deepeval

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-deepeval

deepeval 是一个简单易用的开源大型语言模型(LLM)评估框架,旨在对大型语言模型系统进行评估和测试。

  • 支持端到端和组件级别的 LLM 评估。
  • 提供多种现成可用的 LLM 评估指标,包括 G-Eval、RAG 和 Agentic 指标等。
  • 能够生成合成数据集以进行评估,并与任何 CI/CD 环境无缝集成。
  • 可自定义度量标准并自动与 DeepEval 的生态系统集成。
  • 集成 Confident AI 平台,实现完整的评价生命周期管理。

xiangechen/chili3d

Github Repo Stars License: `AGPL-3.0` Language: `Unknown`

demo-picture-of-chili3d

Chili3D 是一个基于网页的 3D CAD 应用程序,用于在线模型设计和编辑。

  • 支持创建基本形状(如立方体、圆柱、锥体等)和 2D 草图
  • 提供布尔运算、挤出与旋转等高级操作
  • 精确的对象捕捉与跟踪功能,确保准确对齐
  • 强大的编辑工具,包括修改、变换及复杂形状处理
  • 测量工具可计算角度和长度,并支持文档管理功能
  • 友好的用户界面,具备多语言支持(中文与英文)

albertobsd/keyhunt

Github Repo Stars License: `MIT` Language: `Unknown`

cover

keyhunt 是一个用于寻找使用 secp256k1 椭圆曲线的加密货币私钥的工具。

  • 支持比特币和以太坊地址的压缩与解压缩
  • 提供多种模式,包括地址模式、rmd160 模式和 bsgs 模式
  • 允许用户通过文本文件输入公钥列表进行搜索
  • 可在 Linux 环境中编译并运行,适合开发者使用

aaedmusa/Capstan-Drive

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

Capstan-Drive 是一个利用 Capstan Drive 减速器的机器人执行器测试台。

  • 采用 PLA 材料进行 3D 打印
  • 重量为 852 克
  • 提供 120° 的旋转范围
  • 实现了 8.55:1 的减速(准直接驱动)
  • 两个鼓轮上有螺旋图案以引导绳索展开
  • 配备用于张紧绳索的丝杠装置
  • 使用 ODrive S1 FOC 控制器
  • 搭载 Eagle Power 90KV BLDC 电机

tjdevries/config.nvim

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

config.nvim 是一个为 TJ 定制的 Neovim 配置文件。

  • 适用于个人化的 Neovim 设置
  • 提供了 TJ 的特定配置示例
  • 可供他人参考以了解如何定制自己的配置
Licensed under CC BY-NC-SA 4.0