Featured image of post 微软开源:将办公文档转为 Markdown 格式! | 开源日报 No.534

微软开源:将办公文档转为 Markdown 格式! | 开源日报 No.534

markitdown 是一个开源的 Python 工具,旨在将多种文件格式 (如 PDF、PowerPoint、Word、Excel) 转换为 Markdown 格式。它提供易于使用的命令行和 Python 接口,具备插件架构以支持扩展,能够与 Microsoft Document Intelligence 集成,且支持 Docker 部署。

meshtastic/firmware

Github Repo Stars License: `GPL-3.0` Language: `Unknown`

demo-picture-of-firmware

firmware 是 Meshtastic 的官方固件,旨在提供一个开源的、离网的网状通信系统。

  • 支持多种硬件平台,包括 ESP32、nRF52、RP2040/RP2350 和基于 Linux 的设备
  • 实现长距离、低功耗的通信,无需依赖互联网或蜂窝基础设施
  • 允许文本消息发送、位置共享和遥测功能
  • 适用于户外探险、应急准备和远程操作

souzatharsis/podcastfy

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-podcastfy

Podcastfy 是一个开源的 Python 包,旨在将多模态内容(文本、图像)转化为引人入胜的多语言音频对话,利用生成式人工智能技术。

  • 从多个来源和格式(图像、文本、网站、YouTube 和 PDF)生成对话内容。
  • 支持短篇(2-5 分钟)或长篇(30+ 分钟)的播客制作。
  • 可定制转录和音频生成风格,包括语言和结构。
  • 使用超过 100 种 LLM 模型进行转录生成,提高隐私性与控制力。
  • 集成先进的文本到语音模型,如 OpenAI 和 Google。

microsoft/markitdown

Github Repo Stars License: `MIT` Language: `Unknown`

cover

markitdown 是一个用于将文件和办公文档转换为 Markdown 格式的 Python 工具。

  • 支持多种文件格式,包括 PDF、PowerPoint、Word、Excel 等。
  • 提供命令行和 Python 接口,易于使用。
  • 具有插件架构,支持第三方插件扩展功能。
  • 可与 Microsoft Document Intelligence 集成,实现智能转换。
  • 支持 Docker 容器化部署。

BCG-X-Official/agentkit

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-agentkit

agentkit 是一个基于 LangChain 的启动工具包,旨在帮助开发者快速构建受限代理应用程序。

  • 快速构建高质量的代理应用:使用基于 FastAPI/Nextjs 的模块化技术栈和有用的 GenAI 工具库,在几小时内创建强大的演示。
  • 灵活、反应式的 UI/UX 设计:易于配置的 React/Nextjs 聊天界面,支持流式传输、表格/可视化渲染等功能。
  • ️ 专注可靠性:易于配置的路由架构提高了代理可能路径控制,增加了可靠性,使其适用于现实场景。
  • 可扩展设置:配备现成队列管理、身份验证、缓存和监控等功能,以便扩展到 MVP。

uclaml/SPIN

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-SPIN

SPIN 是自我对弈微调(Self-Play Fine-Tuning)的官方实现。

  • 通过自我对弈机制,允许语言模型在没有额外人类标注数据的情况下自行改进。
  • 显著提升了经过微调后的语言模型在多个基准测试上的表现。
  • 理论基础扎实,并通过多项数据集的广泛评估进行实证验证。
  • 提供生成和微调所需的数据及训练脚本,便于用户复现结果。
Licensed under CC BY-NC-SA 4.0