0°

关于2023年ChatGPT的一切:OpenAI聊天机器人统计数据大揭秘

  自发布以来,ChatGPT作为一款类似人类的聊天机器人已经广为人知,它能根据用户输入的内容进行回应。

  这款工具能够基于3000亿词汇和1750亿参数的数据集回答问题并生成回应。它势必将成为推动企业发展和最大化效率的关键工具。

  我深入研究了一些2023年最新数据和报告中最有趣的ChatGPT统计数据和事实。

  关键统计数据

  • ChatGPT在发布后的第一周就获得了100万用户。

  • ChatGPT网站目前每月预计有10亿网站访问量,其中约有1亿活跃用户。

  • 该工具在消费者应用领域创下了用户增长速度最快的记录,仅用5天时间便获得了100万用户。

  • OpenAI预测,到2023年底,ChatGPT的收入将达到2亿美元;到2024年底,收入将达到10亿美元。

  • ChatGPT包含570 GB的文本数据,相当于整个《指环王》系列(包括《霍比特人》)词汇数量的164,129倍左右。

  • 估计训练这个模型只需34天。

  • 该工具在微软Azure云上的运行成本约为每天10万美元或每月300万美元,生成的每个单词的成本为0.0003美元。

  • 2023年1月,该网站每天平均接收1300万独立访客,流量每天大约增长3.4%。

  • OpenAI网站访问者中,62.52%的年龄在18岁至34岁之间,65.68%为男性,34.32%为女性。

  • 平均有53%的人无法分辨出ChatGPT生成的内容是由AI生成的。

  • 当GPT-3发布时,AI代币加密货币价格上涨了高达76.7%。

  什么是ChatGPT?

  ChatGPT(Chat Generative Pretrained Transformer,聊天生成预训练变换器)是一款聊天机器人,根据用户提供的输入生成类似人类的AI生成内容。它由OpenAI开发,并于2022年11月发布。

  自发布以来,ChatGPT作为一款类似人类的聊天机器人已经广为人知,它能根据用户输入的内容进行回应。

  这款工具能够基于3000亿词汇和1750亿参数的数据集回答问题并生成回应。它势必将成为推动企业发展和最大化效率的关键工具。

  我深入研究了一些2023年最新数据和报告中最有趣的ChatGPT统计数据和事实。

  关键统计数据

  • ChatGPT在发布后的第一周就获得了100万用户。

  • ChatGPT网站目前每月预计有10亿网站访问量,其中约有1亿活跃用户。

  • 该工具在消费者应用领域创下了用户增长速度最快的记录,仅用5天时间便获得了100万用户。

  • OpenAI预测,到2023年底,ChatGPT的收入将达到2亿美元;到2024年底,收入将达到10亿美元。

  • ChatGPT包含570 GB的文本数据,相当于整个《指环王》系列(包括《霍比特人》)词汇数量的164,129倍左右。

  • 估计训练这个模型只需34天。

  • 该工具在微软Azure云上的运行成本约为每天10万美元或每月300万美元,生成的每个单词的成本为0.0003美元。

  • 2023年1月,该网站每天平均接收1300万独立访客,流量每天大约增长3.4%。

  • OpenAI网站访问者中,62.52%的年龄在18岁至34岁之间,65.68%为男性,34.32%为女性。

  • 平均有53%的人无法分辨出ChatGPT生成的内容是由AI生成的。

  • 当GPT-3发布时,AI代币加密货币价格上涨了高达76.7%。

  什么是ChatGPT?

  ChatGPT(Chat Generative Pretrained Transformer,聊天生成预训练变换器)是一款聊天机器人,根据用户提供的输入生成类似人类的AI生成内容。它由OpenAI开发,并于2022年11月发布。

  ChatGPT是如何工作的?

  ChatGPT使用“变换器架构”,这是一种深度学习技术,通过处理包含数十亿词汇的兆字节数据来为用户输入的问题或提示创建答案。它是一种机器学习自然语言处理模型,称为大型语言模型(LLMs)。

  在OpenAI首席执行官兼联合创始人Sam Altman在2023年的播客中谈论OpenAI的历史。他谈到了AI当前面临的挑战,他在其他方面描述了,当前的GPT版本主要是为了训练听起来连贯但不验证事实的能力。

  ChatGPT何时发布?

  原始版本GPT-1于2018年6月11日发布,最新版本GPT-4于2023年3月14日发布。

  该工具的第一个版本,GPT-1,是使用大型BooksCorpus数据集进行训练的。这个版本能够获取大量具有不同文本序列的数据,并学习各种依赖关系。

  GPT-2 使用了更大的数据集,参数更多(与GPT-1中的1.5亿相比,GPT-1为1.5亿),使其成为一个更丰富的语言模型。

  2020年的GPT-3包含了更多的参数(大约是GPT-2的116倍),并且是比前几代更强大、更快的版本。

  ChatGPT-4

  2023年3月发布的ChatGPT-4是该工具的最新版本。自从使用GPT-4语言模型进行更新后,ChatGPT可以使用多达25,000个词汇(比前一个版本多8倍)进行响应,并且具有处理图像输入以及文本的能力,使其成为多模态的。

  据估计,ChatGPT-4将在100万亿个参数上进行训练,这大约相当于人类大脑。这表明,最新版本的训练数据可能比用于ChatGPT-3的1750亿参数大571倍。

  OpenAI报告称,最新版本能产生40%更多的事实回答,并且回应禁止内容请求的可能性降低了82%。

  ChatGPT:GPT-3.5与GPT-4

  GPT-3.5和GPT-4之间的关键区别是它们的能力,包括它们可以处理的信息量和类型。GPT-4有两个变体,一个是8K版本,其上下文长度约为8,000个令牌,另一个是32K,可以处理大约32,000个令牌。

  这意味着该工具的最新版本可以处理更长的文档,创建更大的文本,并进行更长的对话,而不会丢失上下文。

  模型请求的最大上下文长度英语单词数单间距英文文本页数输入类型

  GPT-3.54,096约3,0006文本

  GPT-4-8K8,192约6,00012文本和图像

  GPT-4-32K32,768约24,00050文本和图像

  ChatGPT有多少用户?

  ChatGPT在发布后的第一周就获得了100万用户,这创下了消费者应用程序史上增长最快的用户群纪录。

  ChatGPT网站在过去一个月内估计接收了10亿次访问(比前一个月增长了62.5%)。当前活跃用户的确切数量尚不清楚,猜测是大约有1亿(假设10%的网站访问者注册免费服务)。

  ChatGPT的用户遍布全球,最大的一部分(据估计为15.73%)来自美国。据推测,第二大用户群来自印度,约有7.1%的用户生活在这里。

  国家ChatGPT用户百分比

  美国11.72%

  印度10.67%

  日本4.29%

  法国3.98%

  印度尼西亚3.45%

  加拿大3.04%

  其他国家62.85%

  ChatGPT支持哪些国家?

  据OpenAI称,ChatGPT目前支持161个国家。

  除以下国家外,所有国家均可使用:

  • 中国

  • 俄罗斯

  • 乌克兰

  • 白俄罗斯

  • 委内瑞拉

  • 阿富汗

  • 伊朗

  ChatGPT支持哪些语言?

  ChatGPT主要以英语为主,但是,据SEO.ai报道,它确实理解世界上其他95种语言,包括法语、西班牙语、德语和中文。

  该模型主要是用Python计算机编程语言编写的。它能理解多种编程语言,包括:

  • Python

  • JavaScript

  • C++

  • C#

  • Java

  • Ruby

  • PHP

  • Go

  • Swift

  • TypeScript

  • SQL

  • Shell

  与其他流行平台相比,ChatGPT增长得非常快。它在短短五天内达到了100万用户,比Instagram(第二快达到100万用户的平台)快了70天。

  ChatGPT的基础设施

  ChatGPT运行在图形处理单元(GPU)上,这是一种专用处理器,具有专用内存,旨在提高图形渲染速度。这种处理器由许多较小、更专业的内核组成。

  据马里兰州的副教授Tom Goldstein介绍,一台NVIDIA A100 GPU可以在大约6毫秒的时间内运行一个拥有30亿参数的模型。以这个速度,一台NVIDIA A100 GPU可能需要350毫秒才能在ChatGPT上打印出一个单词。

  ChatGPT的上一版本(3.5)拥有超过1750亿个参数,相当于800GB的存储数据。为了生成单个查询的输出,它需要至少五个A100 GPU来加载模型和文本。ChatGPT每秒能输出约15-20个单词,因此ChatGPT-3.5需要一台至少配备8个A100 GPU的服务器。

  训练数据集和输出

  OpenAI使用人类反馈强化学习(RLHF)训练模型。ChatGPT使用的训练数据集非常庞大。据Wired报道,它包含:

  • 100万亿参数

  • 3000亿单词

  • 570GB的文本数据——这大约是包括《霍比特人》在内的整个《指环王》系列词汇量的164,129倍。(来源:Foster Grant)

  ChatGPT无法访问互联网,仅能使用其训练数据集中收集到的信息。数据集的60%基于经过筛选的“常见抓取”数据。简而言之,这相当于从网页、文本和元数据中抓取的8年的数据。

  训练ChatGPT花了多长时间?

  据估计,如果使用一台NVIDIA Tesla V100 GPU训练该工具,使用当前数据集进行训练可能需要大约355年。但据报道,OpenAI使用了1,023台A100 GPU来训练ChatGPT。这意味着训练过程可能在短短34天内完成。

  ChatGPT赚了多少钱?

  OpenAI预测,到2023年底,ChatGPT的收入将达到2亿美元;到2024年底,它的收入将达到10亿美元。如果这些预测正确,那么这个工具在2023年每天将平均赚取547,945美元,在2024年每天将赚取2,732,240美元。

  据Semafor称,微软计划向OpenAI投资100亿美元,这将使该公司估值达到290亿美元。

  运行ChatGPT的成本

  该工具每天的运行成本约为10万美元,或每月300万美元。微软的Azure云目前托管着ChatGPT,因此OpenAI不必购买并建立自己的实体服务器房。以微软每小时3美元的单个A100 GPU费率计算,ChatGPT生成的每个单词可能需要0.0003美元。

  用户成本

  自发布以来,ChatGPT一直免费使用,但在2023年2月1日,OpenAI开始了一项名为ChatGPT Plus的试点订阅计划,每月收费20美元。付费订阅的主要功能包括:

  • 在高峰时期也可以通用地访问ChatGPT

  • 相比免费使用,响应时间更快

  • 优先获取新功能和改进的权限

  ChatGPT Plus目前已经向用户开放,并计划将支持扩展到更多地区,

  ChatGPT API的等待名单也已经推出,一旦发布,开发人员将能够访问官方的ChatGPT API。

  ChatGPT网站流量统计数据

  • 2023年1月,ChatGPT每天平均接收1300万独立访问者,是2022年12月的每日访问量的两倍多。过去一个月内,网站的流量每天平均增长3.4%。

  • 2月份,ChatGPT估计接收到10亿访客,平均每天超过3500万访客。网站的流量从1月到2月增长了62.37%。

  • 访问OpenAI网站的用户平均每次访问查看6.22个页面,每次访问的平均时长为8分钟24秒。

  • 访问量最高的一天是1月31日,当天该网站接收到来自1570万独立访客的2800万访问量。

  ChatGPT是如何工作的?

  ChatGPT使用“变换器架构”,这是一种深度学习技术,通过处理包含数十亿词汇的兆字节数据来为用户输入的问题或提示创建答案。它是一种机器学习自然语言处理模型,称为大型语言模型(LLMs)。

  在OpenAI首席执行官兼联合创始人Sam Altman在2023年的播客中谈论OpenAI的历史。他谈到了AI当前面临的挑战,他在其他方面描述了,当前的GPT版本主要是为了训练听起来连贯但不验证事实的能力。

  ChatGPT何时发布?

  原始版本GPT-1于2018年6月11日发布,最新版本GPT-4于2023年3月14日发布。

  该工具的第一个版本,GPT-1,是使用大型BooksCorpus数据集进行训练的。这个版本能够获取大量具有不同文本序列的数据,并学习各种依赖关系。

  GPT-2 使用了更大的数据集,参数更多(与GPT-1中的1.5亿相比,GPT-1为1.5亿),使其成为一个更丰富的语言模型。

  2020年的GPT-3包含了更多的参数(大约是GPT-2的116倍),并且是比前几代更强大、更快的版本。

  ChatGPT-4

  2023年3月发布的ChatGPT-4是该工具的最新版本。自从使用GPT-4语言模型进行更新后,ChatGPT可以使用多达25,000个词汇(比前一个版本多8倍)进行响应,并且具有处理图像输入以及文本的能力,使其成为多模态的。

  据估计,ChatGPT-4将在100万亿个参数上进行训练,这大约相当于人类大脑。这表明,最新版本的训练数据可能比用于ChatGPT-3的1750亿参数大571倍。

  OpenAI报告称,最新版本能产生40%更多的事实回答,并且回应禁止内容请求的可能性降低了82%。

  ChatGPT:GPT-3.5与GPT-4

  GPT-3.5和GPT-4之间的关键区别是它们的能力,包括它们可以处理的信息量和类型。GPT-4有两个变体,一个是8K版本,其上下文长度约为8,000个令牌,另一个是32K,可以处理大约32,000个令牌。

  这意味着该工具的最新版本可以处理更长的文档,创建更大的文本,并进行更长的对话,而不会丢失上下文。

  模型请求的最大上下文长度英语单词数单间距英文文本页数输入类型

  GPT-3.54,096约3,0006文本

  GPT-4-8K8,192约6,00012文本和图像

  GPT-4-32K32,768约24,00050文本和图像

  ChatGPT有多少用户?

  ChatGPT在发布后的第一周就获得了100万用户,这创下了消费者应用程序史上增长最快的用户群纪录。

  ChatGPT网站在过去一个月内估计接收了10亿次访问(比前一个月增长了62.5%)。当前活跃用户的确切数量尚不清楚,猜测是大约有1亿(假设10%的网站访问者注册免费服务)。

  ChatGPT的用户遍布全球,最大的一部分(据估计为15.73%)来自美国。据推测,第二大用户群来自印度,约有7.1%的用户生活在这里。

  国家ChatGPT用户百分比

  美国11.72%

  印度10.67%

  日本4.29%

  法国3.98%

  印度尼西亚3.45%

  加拿大3.04%

  其他国家62.85%

  ChatGPT支持哪些国家?

  据OpenAI称,ChatGPT目前支持161个国家。

  除以下国家外,所有国家均可使用:

  • 中国

  • 俄罗斯

  • 乌克兰

  • 白俄罗斯

  • 委内瑞拉

  • 阿富汗

  • 伊朗

  ChatGPT支持哪些语言?

  ChatGPT主要以英语为主,但是,据SEO.ai报道,它确实理解世界上其他95种语言,包括法语、西班牙语、德语和中文。

  该模型主要是用Python计算机编程语言编写的。它能理解多种编程语言,包括:

  • Python

  • JavaScript

  • C++

  • C#

  • Java

  • Ruby

  • PHP

  • Go

  • Swift

  • TypeScript

  • SQL

  • Shell

  与其他流行平台相比,ChatGPT增长得非常快。它在短短五天内达到了100万用户,比Instagram(第二快达到100万用户的平台)快了70天。

  ChatGPT的基础设施

  ChatGPT运行在图形处理单元(GPU)上,这是一种专用处理器,具有专用内存,旨在提高图形渲染速度。这种处理器由许多较小、更专业的内核组成。

  据马里兰州的副教授Tom Goldstein介绍,一台NVIDIA A100 GPU可以在大约6毫秒的时间内运行一个拥有30亿参数的模型。以这个速度,一台NVIDIA A100 GPU可能需要350毫秒才能在ChatGPT上打印出一个单词。

  ChatGPT的上一版本(3.5)拥有超过1750亿个参数,相当于800GB的存储数据。为了生成单个查询的输出,它需要至少五个A100 GPU来加载模型和文本。ChatGPT每秒能输出约15-20个单词,因此ChatGPT-3.5需要一台至少配备8个A100 GPU的服务器。

  训练数据集和输出

  OpenAI使用人类反馈强化学习(RLHF)训练模型。ChatGPT使用的训练数据集非常庞大。据Wired报道,它包含:

  • 100万亿参数

  • 3000亿单词

  • 570GB的文本数据——这大约是包括《霍比特人》在内的整个《指环王》系列词汇量的164,129倍。(来源:Foster Grant)

  ChatGPT无法访问互联网,仅能使用其训练数据集中收集到的信息。数据集的60%基于经过筛选的“常见抓取”数据。简而言之,这相当于从网页、文本和元数据中抓取的8年的数据。

  训练ChatGPT花了多长时间?

  据估计,如果使用一台NVIDIA Tesla V100 GPU训练该工具,使用当前数据集进行训练可能需要大约355年。但据报道,OpenAI使用了1,023台A100 GPU来训练ChatGPT。这意味着训练过程可能在短短34天内完成。

  ChatGPT赚了多少钱?

  OpenAI预测,到2023年底,ChatGPT的收入将达到2亿美元;到2024年底,它的收入将达到10亿美元。如果这些预测正确,那么这个工具在2023年每天将平均赚取547,945美元,在2024年每天将赚取2,732,240美元。

  据Semafor称,微软计划向OpenAI投资100亿美元,这将使该公司估值达到290亿美元。

  运行ChatGPT的成本

  该工具每天的运行成本约为10万美元,或每月300万美元。微软的Azure云目前托管着ChatGPT,因此OpenAI不必购买并建立自己的实体服务器房。以微软每小时3美元的单个A100 GPU费率计算,ChatGPT生成的每个单词可能需要0.0003美元。

  用户成本

  自发布以来,ChatGPT一直免费使用,但在2023年2月1日,OpenAI开始了一项名为ChatGPT Plus的试点订阅计划,每月收费20美元。付费订阅的主要功能包括:

  • 在高峰时期也可以通用地访问ChatGPT

  • 相比免费使用,响应时间更快

  • 优先获取新功能和改进的权限

  ChatGPT Plus目前已经向用户开放,并计划将支持扩展到更多地区,

  ChatGPT API的等待名单也已经推出,一旦发布,开发人员将能够访问官方的ChatGPT API。

  ChatGPT网站流量统计数据

  • 2023年1月,ChatGPT每天平均接收1300万独立访问者,是2022年12月的每日访问量的两倍多。过去一个月内,网站的流量每天平均增长3.4%。

  • 2月份,ChatGPT估计接收到10亿访客,平均每天超过3500万访客。网站的流量从1月到2月增长了62.37%。

  • 访问OpenAI网站的用户平均每次访问查看6.22个页面,每次访问的平均时长为8分钟24秒。

  • 访问量最高的一天是1月31日,当天该网站接收到来自1570万独立访客的2800万访问量。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论