Featured image of post 互联网时代的文学复兴:中文诗词大数据分析 | 开源日报 No.170

互联网时代的文学复兴:中文诗词大数据分析 | 开源日报 No.170

《中文诗歌古典文集数据库》是一个包含了大量中文古典诗歌作品的数据库,包括了 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词以及其他古典文集。这个开源项目以 JSON 格式分发,方便用户在自己的项目中使用,并且可以通过技术生成格式化的 JSON 数据来构建诗词类的应用程序。这个数据库丰富多样,包含了古代中国各种经典作品,还提供了高频次分析图等功能。

citra-emu/citra

Github Repo Stars License: Language:

demo-picture-of-citra

Citra 是世界上最受欢迎的开源任天堂 3DS 模拟器。该项目使用 C++ 编写,注重可移植性,并积极维护适用于 Windows、Linux、Android 和 macOS 的版本。

以下是 Citra 项目的关键特性和核心优势:

  • 兼容性:该模拟器能够以全速运行大多数商业游戏,前提是您满足必要的硬件需求。
  • 多平台支持:Citra 提供了针对不同操作系统 (Windows、Linux、Android 和 macOS) 的构建版本,方便用户在各种设备上体验游戏。
  • 持续更新与发展:团队定期发布新功能和进度报告,在 GitHub 上进行活跃地开发讨论,并通过 Discord 群组为贡献者们提供交流机会。
  • 易于安装和使用:可以从官网下载并安装 Nightly 或 Canary 版本;此外还有 Android 版本可在 Google Play 商店中获取。同时也提供 Flatpak 构建来简化部署过程。

chinese-poetry/chinese-poetry

Github Repo Stars License: Language:

demo-picture-of-chinese-poetry

最全的中文诗歌古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。数据来源于互联网。该开源项目旨在通过 JSON 格式分发,方便用户开始自己的项目,并借助技术生成格式化 (JSON) 数据来构建诗词类应用程序。案例展示了一些基于该仓库创建的相关应用。

  • 数据集丰富
  • 古代中国各种经典作品齐全
  • 提供高频次分析图等功能
  • 开放给用户参与贡献

ricklamers/gpt-code-ui

Github Repo Stars License: Language:

demo-picture-of-gpt-code-ui

这个项目是 OpenAI 的 ChatGPT 代码解释器的开源实现。用户可以简单地向 OpenAI 模型提出要求,它将为您生成并执行代码。该项目具有以下主要功能和核心优势:

  • 文件上传
  • 文件下载
  • 上下文感知 (可以参考先前的消息)
  • 生成代码
  • 运行代码 (Python 内核)
  • 模型切换 (GPT-3.5 和 GPT -4)

e2b-dev/E2B

Github Repo Stars License: Language:

cover

这个项目是一个为 AI 应用程序和代理人提供的安全沙盒云环境,允许它们长时间运行。E2B Sandbox 可以连接到任何 LLM 和任何 AI 代理或应用程序,并且具有以下主要功能:

  • 可以使用与人类相同的工具
  • 具有云浏览器、GitHub 存储库和命令行界面等功能
  • 支持编码工具如代码检查、自动补全、“跳转至定义”
  • 能够运行由 LLM 生成的代码 该项目包含 Python SDK、JS SDK、CLI 以及文档等内容。

hemansnation/God-Level-Data-Science-ML-Full-Stack

Github Repo Stars License: Language:

cover

这个项目是一个数据科学和机器学习全栈的集合,包括了科学方法、流程、算法和系统来构建故事与模型。主要功能包括 Python 编程逻辑搭建、数据结构与算法以及 Git & GitHub 等内容。该项目的核心优势和特点有:

  • 包含 16 章节的路线图,涵盖从新手到经验专业人士转向数据科学与 AI 所需的知识;
  • 提供丰富资源库,并使用多种技术栈如 Python,NumPy,Pandas,Matplotlib 等工具进行实践;
  • 重点介绍了各阶段需要掌握的关键概念和技能,例如统计分析、机器学习算法应用以及自然语言处理等。
Licensed under CC BY-NC-SA 4.0