Featured image of post 小红书 抖音 快手 B站 微博爬虫:可爬取视频、图片和评论 | 开源日报 No.363

小红书 抖音 快手 B站 微博爬虫:可爬取视频、图片和评论 | 开源日报 No.363

《MediaCrawler:多平台多功能爬虫项目》是一个专注于抓取小红书、抖音、快手、B 站和微博视频、图片和评论等信息的爬虫项目。通过利用 playwright 技术和执行 JS 表达式获取加密参数的方式,实现了高效的数据爬取功能。该项目不仅支持关键词搜索和指定帖子/视频 ID 爬取,还提供了 IP 代理池和滑块验证码处理功能,让数据获取更加稳定和可靠。数据还可保存到数据库或文件中,方便后续处理和分析。是爬虫爱好者和数据分析师不可多得的利器!

Team-xManager/xManager

Github Repo Stars License: Language:

demo-picture-of-xManager

xManager 是一个无广告、新增功能和自由的管理应用。

  • 所有功能集中在一个地方
  • 随时随地升级或降级
  • 管理工具:卸载、打开设置、清除缓存数据和启动应用程序
  • 实验性功能:可使用一些 A/B 测试特性
  • 友好界面:简洁流畅的极简主题用户界面
  • 占用空间少:轻量级管理器,易于使用
  • 提供全新特性,让用户体验更丰富。
  • 无广告干扰,提供更纯净的使用环境。
  • 自由度高,可以随时根据需求升级或降级版本。

NanmiCoder/MediaCrawler

Github Repo Stars License: Language:

cover

MediaCrawler 是一个爬虫项目,用于抓取小红书、抖音、快手、B 站和微博的视频、图片以及评论等信息。该项目利用 playwright 搭桥,通过执行 JS 表达式获取加密参数来实现爬取数据,并提供了多种功能和平台支持。

  • 可进行关键词搜索和指定帖子/视频 ID 爬取
  • 提供 IP 代理池和滑块验证码处理功能
  • 数据保存到数据库或文件中

krishnaik06/Perfect-Roadmap-To-Learn-Data-Science-In-2024

Github Repo Stars License: Language:

demo-picture-of-Perfect-Roadmap-To-Learn-Data-Science-In-2024

Perfect-Roadmap-To-Learn-Data-Science-In-2024 是一个完美的数据科学学习路线图项目。 该项目的主要功能、关键特性、核心优势:

  • 提供了详细的数据科学学习路线图,包括 Python 编程语言、统计知识、数据库技能以及机器学习和深度学习等方面。
  • 包含丰富的教育资源,如视频播放列表和实时直播课程。
  • 强调端到端机器学习(ML)、深度学习(DL)和自然语言处理(NLP)项目实施,并介绍 MLOPS 操作以及部署在 AWS、AZURE 等平台上。

matt8707/ha-fusion

Github Repo Stars License: Language:

demo-picture-of-ha-fusion

ha-fusion 是一个现代、易于使用且性能优越的自定义 Home Assistant 仪表板。

  • 提供现代化、易于使用和高性能的自定义 Home Assistant 仪表板。
  • 支持通过不同安装方法(如 Add-on、Docker)进行安装。
  • 可以通过查询字符串定制视图,禁用菜单按钮,并提供键盘快捷键功能。
  • 提供调试指南和开发说明,方便用户贡献代码。

huntabyte/shadcn-svelte

Github Repo Stars License: Language:

demo-picture-of-shadcn-svelte

shadcn-svelte 是 shadcn/ui 的 Svelte 非官方社区移植版。

  • 提供易于访问和定制的组件,可直接复制粘贴到您的应用程序中。
  • 免费、开源,可用于构建自己的组件库。
  • 由 @huntabyte、CokaKoala 和社区共同打造。
Licensed under CC BY-NC-SA 4.0