Featured image of post 深度信息检索的强大助手:高效长文本处理与推理能力再升级 | 开源日报 No.752

深度信息检索的强大助手:高效长文本处理与推理能力再升级 | 开源日报 No.752

DeepResearch 是由 Tongyi Lab 开发的开源大型语言模型代理,专为深度信息检索设计,拥有 305 亿参数,且每次激活 33 亿参数。该项目具备全自动数据生成流水线,支持代理预训练、监督微调和强化学习,利用大规模预训练提升模型能力。采用端到端强化学习策略,支持 ReAct 和 IterResearch-based 推理范式,且在多个复杂搜索基准测试中表现优异。

Alibaba-NLP/DeepResearch

Github Repo Stars License: `Apache-2.0` Language: `Unknown`

cover

DeepResearch 是一个由 Tongyi Lab 开发的开源大型语言模型代理,专为长时间深度信息检索任务设计,拥有 305 亿参数但每次仅激活 33 亿参数。

  • 具备全自动合成数据生成流水线,实现代理预训练、监督微调和强化学习的高效支持
  • 利用大规模持续预训练提升模型能力、保持数据新鲜度并增强推理性能
  • 采用端到端强化学习策略,通过定制化 Group Relative Policy Optimization 框架稳定非平稳环境下的训练过程
  • 支持两种推理范式:ReAct 用于评估核心能力,IterResearch-based ‘Heavy’ 模式通过测试时扩展策略释放最大性能潜力
  • 在多个复杂搜索基准测试中表现出领先水平,包括 Humanity’s Last Exam、BrowserComp 等多项任务

mnh-jansson/open-battery-information

Github Repo Stars License: `MIT` Language: `Unknown`

cover

open-battery-information 是一个旨在提供电池相关工具和信息以辅助维修的开源项目。

  • 解决制造商在检测到故障时锁定电池管理系统(BMS)导致无法使用的问题,避免因软件误判而浪费完好电池。
  • 提供 Arduino 硬件配置指南,支持用户搭建相应的硬件环境进行数据读取。
  • 支持 Windows 预编译二进制文件和 Python 源码两种使用方式,方便不同技术背景用户操作。
  • 通过公开信息帮助延长电池寿命并节省维修成本。

EthanArbuckle/Apollo-CustomApiCredentials

Github Repo Stars License: `GPL-3.0` Language: `Unknown`

demo-picture-of-Apollo-CustomApiCredentials

Apollo-CustomApiCredentials 是一个用于在 Apollo 中使用自定义 Reddit 和 Imgur API 凭证的工具。

  • 支持用户使用自己的 Reddit API 凭证
  • 简化创建和配置开发者应用的过程
  • 提供直观的步骤指导,方便用户操作
  • 兼容性强,可与 Apollo 应用无缝集成

Not-Quite-RARBG/main

Github Repo Stars License: `AGPL-3.0` Language: `Unknown`

cover

main 是 Not Quite RARBG 的主要网站,旨在继承原 RARBG 的遗产,为用户提供全面的电影、电视节目、动漫、软件和游戏的种子集合。

  • 提供丰富多样的种子资源,涵盖多个类别
  • 计划开放注册,让用户上传自己的种子
  • 所有上传内容将经过严格审核,以确保安全性
  • 致力于重现 RARBG 社区精神与体验

TheMCHK/WindowsXPKg

Github Repo Stars License: `MIT` Language: `Unknown`

cover

WindowsXPKg 是一个用于生成和验证 Windows XP 密钥的程序。

  • 允许无限生成 Windows XP 密钥
  • 可以检查现有密钥的有效性
  • 基于破解的 Microsoft 私钥进行签名和验证
  • 使用简单,仅需四个步骤即可完成安装与激活
Licensed under CC BY-NC-SA 4.0