Featured image of post 自托管在线文件转换器,千种格式轻松转换 | 开源日报 No.852

自托管在线文件转换器,千种格式轻松转换 | 开源日报 No.852

ConvertX 是一个自托管的在线文件转换器,支持超过一千种文件格式的转换,涵盖图片、视频、文档、电子书及 3D 资产等。它具备批量处理、密码保护和多账户管理等功能,确保安全性和管理便利。该项目基于现代技术栈 (TypeScript、Bun、Elysia) 开发,支持 Docker 部署,具备灵活的配置选项。

C4illin/ConvertX

Github Repo Stars License: `AGPL-3.0` Language: `Unknown`

demo-picture-of-ConvertX

ConvertX 是一个自托管的在线文件转换器,支持超过一千种不同格式的文件转换。

  • 支持多种主流和专业格式,包括图片、视频、文档、电子书及 3D 资产等
  • 可批量处理多个文件,提高转换效率
  • 提供密码保护和多账户管理功能,增强安全性与用户管理能力
  • 基于 TypeScript、Bun 和 Elysia 开发,具备现代化技术栈优势
  • 支持 Docker 部署,方便快速搭建使用环境
  • 配置灵活,可通过环境变量调整服务行为,如自动删除旧文件、多语言支持等

xerrors/Yuxi-Know

Github Repo Stars License: `MIT` Language: `Unknown`

cover

Yuxi-Know 是一个融合了知识库与知识图谱技术的智能体开发平台,基于 LangChain v1、Vue 和 FastAPI 构建,支持多模态和深度分析能力。

  • 集成 LightRAG 知识库与 Neo4j 图数据库,实现统一的知识管理与可视化
  • 支持多种文件格式上传(包括文件夹和压缩包),并具备同名文件处理机制
  • 提供 DeepAgents 智能体,支持任务管理、文件渲染及下载功能
  • 新增思维导图及示例问题生成功能,加强对知识库内容的结构化理解
  • 兼容多模态模型(当前支持图片)以丰富交互表现形式
  • 内置文档解析中间件,适配 MinerU 官方格式及 Markdown Zip 等复杂文档类型
  • 优化异步操作能力,提高 DBManager 和 ConversationManager 的响应效率
  • 支持自定义模型接入,包括 dashscope rerank 与 embeddings 模型扩展
  • 配备生产环境部署脚本,保障依赖版本稳定性和系统可靠运行
  • 移除部分旧版组件如 Chroma 和 TogetherAI 配置预设,以保持架构简洁高效

flowsurface-rs/flowsurface

Github Repo Stars License: `GPL-3.0` Language: `Unknown`

cover

flowsurface 是一款面向加密货币市场的本地桌面图表分析平台。

  • 支持多种图表类型,包括历史 DOM 热力图、传统 K 线、足迹图、时间与成交列表以及市场深度(DOM)/阶梯视图
  • 实时交易数据通过交易所公共 REST API 和 WebSocket 直接获取,支持 Binance 历史及实时数据回溯,Bybit 和 Hyperliquid 仅支持实时流
  • 多窗口、多显示器支持及窗格联动功能,实现跨多个窗格快速切换行情标的
  • 可自定义布局与主题配色方案,并具备基于成交流触发的实时音效反馈
  • 开源且跨平台,提供预编译二进制文件并可通过 Rust 工具链从源码构建

kirodotdev/Kiro

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

Kiro 是一款智能集成开发环境(IDE),旨在通过规范驱动开发和自然语言辅助,支持从原型设计到生产部署的全流程软件构建。

  • 采用结构化规格(Specs)细化需求,实现有序的功能规划与开发
  • 利用智能钩子(Hooks)自动响应文件变更及开发事件,减少重复操作
  • 通过具备项目上下文理解能力的对话代理,实现自然语言交互式编码辅助
  • 支持自定义规则和项目上下文引导(Steering),提升 AI 行为针对性与准确度
  • 提供模型上下文协议服务器接口(MCP Servers),便于外部工具和数据源集成
  • 注重企业级安全隐私保护,保障代码资产安全

HKUDS/VideoRAG

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

cover

VideoRAG 是一个基于先进人工智能技术的桌面应用框架,旨在实现对任意长度视频内容的深度理解与自然语言交互。

  • 支持拖拽上传多种格式视频(MP4、MKV、AVI 等),跨平台运行于 macOS、Windows 和 Linux
  • 具备极长时长视频处理能力,可分析数百小时的视频内容并精准检索特定片段
  • 采用双通道架构融合图驱动知识索引与层级上下文编码,实现结构化、多模态的视频语义理解
  • 支持多视频同时分析及跨视频语义关系建模,提升综合比较和检索效果
  • 提供导出功能以保存洞察结果,并开放完整开源代码及基准数据集供研究者使用
Licensed under CC BY-NC-SA 4.0