CyberScraper 2077 是一款先进的网页数据抓取工具,采用 Python 编写,并整合了 OpenAI、Gemini 和 LocalLLM 等大型语言模型,以实现对网页数据的智能分析与精准处理。
该工具支持从单个或多个网页中提取数据,并可通过 Docker 或虚拟环境灵活部署,适用于研究和自动化信息收集的需求。操作简便,只需轻松点击鼠标,数据便可轻松获取。此外,该工具是免费的!无论是进行学术研究还是希望自动化信息收集,CyberScraper 2077 都是您理想的助手!
截图
特色
- AI 集成:使用 OpenAI API 和 Ollama 进行智能化数据提取和分析。
- 多页面抓取(BETA):支持从网站的多个页面中提取数据。
- 多种导出格式:可以将数据导出为 JSON、CSV、HTML、SQL 或 Excel 格式。
- 用户友好的界面:提供 Streamlit GUI,使得操作直观简便。
- 隐形模式:采用隐蔽参数帮助避免作为机器人被检测。
- 异步操作:快速进行数据抓取。
- 智能解析:优化的内容解析技术。
- 缓存机制:减少重复的 API 调用。
- 上传至 Google Sheets:方便地将 CSV 数据上传到 Google Sheets。
- 代理模式(即将推出):内置代理支持以增强隐私保护。
工具下载
https://github.com/itsOwen/CyberScraper-2077/releases
最新评论
已经在内容偏好选择关闭了 还是看不到的 去搜索R18,TIKTOK直接显示社区没这样的内容
看不到R18内容的
能不能传个蓝奏云
网盘里的文件无法下载,被屏蔽了,请重新打包上传。