立即注册 登录
AdvertCN - 广告中国 返回首页

affiliateberry的个人空间 https://www.advertcn.com/?26 [收藏] [复制] [分享] [RSS]

日志

GPT爬虫 - 不错的GPTs抓取工具

已有 92 次阅读2024-1-7 17:29 |个人分类:爬虫| gpts

GPT Scraper 是一种自动化工具,允许通过其独特的 gizmoId 提取有关任何公共 GPT 的详细信息。只需输入 gizmoId,抓取工具就会输出一个结构化 JSON 文件,其中包含有关目标 GPT 的元数据。这提供了一种收集 ChatGPT 扩展信息以用于分析或研究目的的简单方法。

输入 Gizmo ID

GPT Scraper 接受单个输入——与公共 GPT 关联的唯一 gizmoId。此 ID 包含在 ChatGPT 上的 GPT URL 中,位于“/g/”之后。

例如,对于https://chat.openai.com/g/g-EgRT6abr4-gpt-explorer的 GPT ,这是一个 GPT 浏览器,可以帮助您找到 ChatGPT 上最好的 GPT,由GPTsApp.io开发gizmoId 是:

g-EgRT6abr4

通过将此 ID 输入到抓取工具中,它可以找到目标 GPT 并提取其元数据。

了解 JSON 输出

抓取工具输出一个 JSON 文件,其中包含有关 GPT 的全面信息。这包括:

  • GPT 名称、描述、作者详细信息
  • 配置如所用型号、说明
  • 元数据,例如创建日期、使用统计信息
  • 相关工具和服务
  • 和更多

将所有这些数据采用结构化、机器可读的 JSON 格式,可以轻松以编程方式解析和分析。

JSON 输出示例

以下是假设的 GPT 的 JSON 输出示例:

{ "gizmo": { "id": "g-EgRT6abr4", "organization_id": "org-eVJFbTXEADCyFwCzIkZJTaIx", "short_url": "g-EgRT6abr4-gpt-explorer", "author": { "user_id": "user-I4jEsKxow4YaAGFePprBYOp2", "display_name": "gptsapp.io", "link_to": "https://gptsapp.io", "selected_display": "website", "is_verified": true }, "voice": { "id": "ember"}, "workspace_id": null, "model": null, "instructions": null, "settings": null, "display": { "name": "GPT Explorer", "description": "A guide to recommending GPTs using user queries and API.", "welcome_message": "Hello! I'm GPT Explorer. How can I assist you today?", "prompt_starters": [ "Recommend a GPT for learning languages", "What are the top GPTs for travel advice?", "Find me a GPT for cooking recipes", "Suggest a GPT for coding tutorials" ], "profile_picture_url": "https://files.oaiusercontent.com/file-TQqtVSiCTBpzjkGw7HVLkaN0?se=2123-12-02T06%3A38%3A44Z&sp=r&sv=2021-08-06&sr=b&rscc=max-age%3D1209600%2C%20immutable&rscd=attachment%3B%20filename%3Da84cb259-3ef2-458b-b83c-b3a84a170c1f.png&sig=CW4WJ%2B/p9PaQqnzM1Z%2BavtFT/UHeCqAIsFD/ZyKVv1E%3D", "categories": ["other"] }, "share_recipient": "link", "updated_at": "2023-12-26T07:34:11.785757+00:00", "last_interacted_at": null, "tags": ["public","reportable","uses_function_calls"], "version": null, "live_version": null, "training_disabled": null, "allowed_sharing_recipients": null, "review_info": null, "appeal_info": null, "vanity_metrics": { "num_conversations_str": "5", "num_pins": 0, "num_users_interacted_with": 0 } }, "tools": [ { "id": "gzm_cnf_4FV9fcScgNMw47GIT4cGrdYX~gzm_tool_oOnVBMhnOJ82SL1HhI88uklI", "type": "plugins_prototype", "settings": null, "metadata": { "action_id": "g-770ffd1996213259c666756e704fc8263cd87b56", "domain": "api.smartproxt.com", // 其他 metadata } }, { "id": "gzm_cnf_7FeZ1BrGP1vgewZgGSCLu7eH~gzm_tool_xsDPbTo7C3IhbWyRlzwcd7El", "type": "python", "settings": null, "metadata": null }, { "id": "gzm_cnf_VRQOeDHb85H6CGV1v9NNniQM~gzm_tool_uqfnomcmSwddUOrq0SLxWKrS", "type": "browser", "settings": null, "metadata": null }, { "id": "gzm_cnf_VRQOeDHb85H6CGV1v9NNniQM~gzm_tool_cZwFEan0DJZ5K2VO00HOJT3Y", "type": "dalle", "settings": null, "metadata": null } ], "files": [], "product_features": { "attachments": { "type": "retrieval", "accepted_mime_types": [ "application/msword","application/vnd.openxmlformats-officedocument.presentationml.presentation","text/x-script.python","text/x-c","application/x-latext","text/x-php","text/markdown","application/json","text/x-csharp","application/vnd.openxmlformats-officedocument.wordprocessingml.document","text/html","text/x-java","text/x-sh","text/x-typescript","text/x-c++","application/pdf","text/plain","text/javascript","text/x-tex","text/x-ruby" ], "image_mime_types": [ "image/gif","image/png","image/jpeg","image/webp" ], "can_accept_all_mime_types": true } } }

 

这涵盖了爬虫公开的所有关键细节,从作者信息到工具集成。

JSON 文件中包含的信息

JSON 输出中包含的主要信息部分是:

gizmo – 有关 GPT 本身的元数据,如名称、描述、作者、统计信息等。

工具– 与 GPT 相关的任何工具,例如插件、Python 脚本等。

文件– 对为 GPT 上传的文件的引用。

Product_features – 附件等功能的配置。

这套全面的详细信息可以根据 JSON 输出彻底分析和理解 GPT 的用途、创建、配置和使用。

开始使用刮刀

要开始使用 GPT Scraper:

  1. 获取目标 GPT 的 gizmoId,包含在其 ChatGPT URL 中
  2. 当抓取工具提示时输入此 ID
  3. 抓取工具将获取 GPT 的元数据并将其输出为 JSON 文件
  4. JSON 包含本指南中介绍的有关 GPT 的大量信息

使用刮刀不需要编码或技术专业知识。只需传递有效的 gizmoId 并通过 JSON 接收结构化 GPT 英特尔即可。

用例

GPT Scraper 支持多种有用的应用程序:

  • GPT 分析 – 研究 GPT 配置、使用模式、作者趋势
  • GPT 归档 – 创建 GPT 元数据数据集以供研究
  • 竞争情报 – 分析竞争对手的 GPT 战略和产品
  • GPT 发现– 根据标签、作者等元数据搜索 GPT,例如GPT 存储
  • 情感分析 – 从 GPT 中提取非结构化文本进行文本分析

这些只是结构化 JSON 输出如何为更广泛的 GPT 趋势分析以及单个 GPT 性能和特征提供信息的一些示例。

局限性

虽然功能强大,但 GPT Scraper 确实有一些需要注意的关键限制:

  • 仅适用于公共 GPT – 私有或受限 GPT 无法被抓取
  • 需要知道确切的 gizmoId,而不仅仅是名称或 URL
  • 仅提取 ChatGPT 的 API 公开的数据
  • 不捕获对话日志或使用数据
  • 如果 ChatGPT API 更改可能会失败

尽管存在这些限制,抓取工具通过易于获取的 JSON 格式为大多数公共 GPT 提供了极其有用的元数据。

常见问题解答

该抓取工具适用于私人 GPT 吗?

不可以,它只能访问有关 ChatGPT 上可用的公共 GPT 的信息。

如果我不知道确切的 gizmoId 怎么办?

您需要 GPT URL 中包含的完整唯一 gizmoId 才能让抓取工具找到它并提取元数据。

输出是什么格式?

抓取工具返回一个包含 GPT 元数据的 JSON 文件。这允许对数据进行编程处理和分析。

我可以使用抓取的 GPT 数据分析什么?

许多方面,如作者趋势、工具使用、配置、标签、时间分析等等。结构化的 JSON 可以灵活地对数据进行切片和切块。

我也可以抓取对话日志吗?

不,抓取工具仅返回通过 ChatGPT 的 API 公开的元数据,而不是实际的对话或使用日志。

这涵盖了 GPT Scraper 的关键功能和价值主张,可轻松提取有关公共 ChatGPT 扩展的丰富知识。通过一些巧妙的努力,JSON 输出可以解锁更深入的 GPT 见解。

工具链接,

https://apify.com/seadapp/free-gpts-scraper


路过

雷人

握手

鲜花

鸡蛋

评论 (0 个评论)

facelist

您需要登录后才可以评论 登录 | 立即注册

关于我们|联系我们|DMCA|广告服务|小黑屋|手机版|Archiver|Github|网站地图|AdvertCN

GMT+8, 2024-4-27 21:26 , Processed in 0.023627 second(s), 8 queries , Gzip On, MemCache On.

Copyright © 2001-2023, AdvertCN

Proudly Operating in Hong Kong.

返回顶部