Featured image of post Qwen2.5-VL:强大的多模态大型语言模型 | 开源日报 No.524

Qwen2.5-VL:强大的多模态大型语言模型 | 开源日报 No.524

Qwen2.5-VL 是由阿里云 Qwen 团队开发的多模态大型语言模型,具备强大的文档解析能力,支持多种语言和文档格式,具备精确的对象定位和超长视频理解能力,能够处理长达数小时的视频并提取事件片段,同时提升了在计算机和移动设备上的推理和决策能力。

ossu/math

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-math

math 是一个提供免费自学数学教育的项目。

  • 提供完整的在线数学教育课程,适合希望深入理解各个数学学科基础概念的人。
  • 课程来自世界顶尖大学,如哈佛、麻省理工和斯坦福,确保高质量教学材料。
  • 学习时间灵活,可以选择独立学习或小组合作,建议按照预设顺序进行学习。
  • 目标是在大约两年内完成整个课程,每周投入 18 到 22 小时的学习时间。
  • 强调使用免费的资源来实现学习目标,但部分课程可能会收取费用。

Ajaxy/telegram-tt

Github Repo Stars License: `GPL-3.0` Language: `Unknown`

cover

telegram-tt 是一个基于 Teact 框架的 Telegram Web 客户端,旨在提供轻量级和高效的用户体验。

  • 获得 Telegram 轻量级客户端比赛一等奖,现为官方客户端
  • 几乎零依赖,完全基于自有框架构建
  • 支持现代 Web API,如 WebSockets、Web Workers 和 WebAssembly
  • 实现多层缓存和渐进式网络应用(PWA)
  • 提供语音录制、媒体流传输及复杂动画效果等先进功能
  • 可通过 Electron 构建跨平台原生应用程序

QwenLM/Qwen2.5-VL

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

demo-picture-of-Qwen2.5-VL

Qwen2.5-VL 是阿里云 Qwen 团队开发的多模态大型语言模型系列。

  • 强大的文档解析能力,支持多场景、多语言及各种内置文档格式(手写、表格、图表等)的处理。
  • 精确的对象定位功能,提升了检测、指向和计数对象的准确性。
  • 超长视频理解与细粒度视频定位能力,可以理解持续数小时的视频并快速提取事件片段。
  • 增强计算机和移动设备上的代理功能,提高了推理和决策能力。

scroll-tech/contribute-to-scroll

Github Repo Stars License: `NOASSERTION` Language: `Unknown`

demo-picture-of-contribute-to-scroll

contribute-to-scroll 是一个指导开发者如何为 Scroll 生态系统做贡献的仓库。

  • 提供指导,帮助开发者为 Scroll 做出贡献
  • 可以立即开始贡献,查看问题标签获取初始想法
  • 提供了如何进行贡献的指南页面
  • 在一些项目中已经集成了 Scroll,例如 ethereum-lists/chains
  • Scroll 是一个开源 zkEVM Layer 2,有助于扩展以太坊网络规模,并且与 EVM 兼容。

Nutlope/notesGPT

Github Repo Stars License: `MIT` Language: `Unknown`

demo-picture-of-notesGPT

notesGPT 是一个用于记录语音笔记并进行转录、总结和生成任务的工具。

  • 快速从笔记中生成行动项
  • 支持语音记录和存储
  • 使用先进的技术栈,包括 Convex、Next.js 和 Whisper
  • 提供用户身份验证功能,确保安全性
  • 未来计划包括改进搜索体验和集成 Notion 等功能
Licensed under CC BY-NC-SA 4.0