OpenGenerativeAI/llm-colosseum
llm-colosseum 是一个通过在《街头霸王 3》中对抗来评估大型语言模型(LLM)质量的新方法。
- 实时评估:在《街头霸王 3》中实时测试 LLM 的表现。
- 快速决策:要求模型能够迅速做出反应。
- 智能策略:优秀的战斗者需要考虑多步棋局。
- 创新思维:通过意想不到的举动超越对手。
- 适应能力强:从错误中学习并调整策略。
- 抗压性高:保持高水平表现直至比赛结束。
openai/simple-evals
simple-evals 是一个用于评估语言模型的轻量级库。
- 透明度:开源以展示发布最新模型时所附带的准确性数据。
- zero-shot 设置:强调 zero-shot、思维链式设置,使用简单指令来反映模型在实际使用中的表现。
- 包含多个评估项目:包括 MMLU、MATH、GPQA 等不同类型的评估项目。
- 支持多种语言模型 API 的采样接口。
opentiny/tiny-engine
tiny-engine 是一个低代码引擎,基于这个引擎可以构建或者开发出不同领域的低代码平台。
- 支持跨端跨框架的前端组件
- 在线实时构建、二次开发或集成能力
- 直接生成可部署的源代码,无需引擎支持
- 允许访问第三方组件和自定义扩展插件
- 支持高代码与低代码混合开发和部署应用程序
- 平台接入 AI 大模型能力,帮助开发者构建应用
THUDM/CodeGeeX2
CodeGeeX2 是更强大的多语言代码生成模型。 该项目的主要功能、关键特性、核心优势包括:
- 基于 ChatGLM2 架构加入代码预训练,提升了多项指标性能
- 支持超过 100 种编程语言,新增上下文补全、跨文件补全等实用功能
- 模型特性更好支持中英文输入,推理速度大幅提升
- 权重对学术研究完全开放,并支持轻量级本地化部署
vuejs/core
vuejs/core 是一个渐进式的、可逐步采用的 JavaScript 框架,用于构建网页上的用户界面。
- 适用于构建现代化的用户界面
- 渐进式框架,易于上手和集成
- 强大的生态系统和社区支持
- 提供灵活性以满足不同项目需求