Featured image of post 多类型数据标注工具:加速机器学习算法研发 | 开源日报 No.393

多类型数据标注工具:加速机器学习算法研发 | 开源日报 No.393

label-studio 是一个强大的多类型数据标注和注释工具,具有标准化的输出格式,提供简单直观的用户界面,支持标记音频、文本、图像、视频和时间序列等多种数据类型。它能够导出至不同模型格式,帮助改进训练数据以提高机器学习模型的准确性,同时还包含了数据标记模板和机器学习模型设置功能。label-studio 支持与现有工具集成,同时能够满足个性化需求,是一个不可多得的数据标注利器。

hibernate/hibernate-orm

Github Repo Stars License: Language:

cover

hibernate-orm 是 Hibernate 的核心对象/关系映射功能。

  • 提供强大的 Java 对象/关系映射解决方案
  • 实现了 JPA 标准 API,但也提供了超出规范的功能和 API
  • 使用 Gradle 作为构建工具
  • 支持在不同数据库上进行测试

HumanSignal/label-studio

Github Repo Stars License: Language:

demo-picture-of-label-studio

label-studio 是一个多类型数据标注和注释工具,具有标准化的输出格式。

  • 提供简单直观的用户界面用于标记音频、文本、图像、视频和时间序列等各种数据类型。
  • 可以导出至不同模型格式,帮助准备原始数据或改进现有训练数据以获得更精确的机器学习模型。
  • 包含了用于在 Label Studio 中进行数据标记的模板,并可设置机器学习模型。
  • 可与现有工具集成,并支持自定义适应个性化需求。

livekit/agents

Github Repo Stars License: Language:

demo-picture-of-agents

agents 是一个构建实时多模态人工智能应用程序的项目。

  • 提供插件支持,包括流行的 LLM、转录和文本到语音服务以及 RAG 数据库
  • 高级抽象层,可用于构建具有自动对话检测、中断处理、函数调用和转录功能的语音代理或助手
  • 兼容 LiveKit 的电话堆栈,允许您的代理向电话发出呼叫或接收来自电话的呼叫
  • 集成负载均衡系统,在边缘进行分发管理代理池,并提供监控和透明故障切换
  • 在 localhost、自托管和 LiveKit Cloud 环境下运行您的代理完全相同

lxc/incus

Github Repo Stars License: Language:

cover

incus 是一款强大的系统容器和虚拟机管理工具。

  • 提供统一体验,可在容器或虚拟机内运行和管理完整的 Linux 系统。
  • 支持多种 Linux 发行版镜像,并基于功能强大且简单易用的 REST API 构建。
  • 适用于从单台机器上的一个实例到整个数据中心机架上集群规模,既适合开发环境又适合生产环境。
  • 可轻松搭建私有云般感觉的系统,高效运行各种工作负载并优化资源利用率。
  • 通过迁移工具 lxd-to-incus 方便地从 LXD 迁移到 Incus。

AbanteAI/mentat

Github Repo Stars License: Language:

cover

mentat 是一个 AI 编程助手。

  • 可协助完成任何编码任务,无需复制粘贴。
  • 能够理解新代码库、添加新功能、重构现有代码。
  • 支持多个位置和文件的编辑协调。
  • 提供安装和设置演示视频以及详细文档。
Licensed under CC BY-NC-SA 4.0