blaze/blaze
Blaze 是一个将 NumPy 和 Pandas 接口扩展到大数据的工具。
- 提供熟悉的 Python 接口,便于查询存储在其他数据库中的数据。
- 支持多种后端,包括 SQL、Spark 等,灵活处理不同的数据源。
- 允许用户执行小规模但强大的操作来查询和转换结果,以适应各种 Python 工具。
- 不直接进行计算,而是依赖其他系统完成实际的数据处理。
- 易于安装和使用,可通过 conda 或 PyPI 获取。
0hq/WebGPT

WebGPT 是一个在浏览器中运行 GPT 模型的实现,利用 WebGPU 技术。
- 使用不到 1500 行原生 JavaScript 进行 GPT 推理的实现。
- 支持高达 500M 参数的模型,并有潜力支持更大的模型。
- 兼容主流浏览器,简单易用,只需 HTML 和 JS 文件即可运行。
- 提供了两个不同的模型示例:玩具版 GPT-Shakespeare 和 117M 参数的 GPT-2
- 包含优化计划以提升性能,包括缓存机制、内存重用等。
protectai/ai-exploits

ai-exploits 是一个针对机器学习工具的真实世界 AI/ML 漏洞的集合,旨在负责任地披露这些漏洞。
- 提供多种利用和扫描模板,帮助安全专业人士识别和利用机器学习工具中的脆弱性。
- 包含 Metasploit 模块、Nuclei 模板和 CSRF 模板,以支持不同类型的攻击与扫描需求。
- 通过 Docker 简化了环境设置,使用户能够快速启动并运行所需工具。
- 提高对 AI/ML 生态系统中存在的脆弱组件意识,有助于信息安全社区了解实际攻击方式。
pandas-dev/pandas
pandas 是一个灵活且强大的 Python 数据分析和处理库,提供类似于 R 的数据框对象的标签数据结构、统计函数等功能。
- 轻松处理缺失数据(NaN、NA 或 NaT)。
- 支持动态调整大小,可以在 DataFrame 中插入或删除列。
- 自动和显式的数据对齐,简化计算过程。
- 强大的分组功能,可进行拆分应用合并操作。
- 便捷地将不同索引的数据转换为 DataFrame 对象。
- 智能的基于标签切片、高级索引和子集选择大数据集的能力。
- 直观的数据集合并与连接功能。
- 灵活的数据重塑与透视操作。
- 层次化轴标记支持多个标签每个刻度。
- 强大的输入输出工具,从多种格式加载和保存数据。
meta-pytorch/segment-anything-fast
segment-anything-fast 是一个面向批量离线推理的版本,旨在加速 segment-anything 的性能。
- 支持快速推理,适合大规模数据处理
- 兼容原有的 segment-anything 接口,易于替换
- 自动应用评估模式和 bfloat16 精度
- 启用 torch.compile 和最大自动调优功能,提高运行效率
- 使用自定义 Triton 内核优化长序列相对位置编码性能