0°

ChatGPT 已过时?无需人类插手自主解决复杂任务,GitHub 标星 5 万

  据国际数据公司IDC预测,到2025年,全球IoT连接的设备数量将达到519亿,其中中国将达到80亿。尽管相较之前,近两年IoT的讨论热度有所消减,但并没有影响到在产业界的持续布局。

  如何实现万物智联是产业界长期以来主要关注的方向。如同互联网通过人作为主脑和终端的连接方式,物联网也需要主脑进行数据的搜集、决策和分析,同时也需要智能终端进行执行操作。AI+IoT,即实现了AI作为大脑和终端实施,以及IoT作为神经网络的融合落地。

  伴随着AIoT相关技术的不断成熟,越来越多的企业开始投入到AIoT领域的研发和应用当中,除了传统制造、能源等产业,还涉及金融、医疗健康、农业、城市建设和管理等多个领域,让众多开发者看到了巨大的机会。

  为了帮助AIoT技术从业者和生产企业探索更多可能,CSDN重磅发布《2022-2023 中国AIoT开发者调查报告》,从开发者生态、技术工具、行业场景、发展路径、未来范式等维度展开分析。同时,我们也特邀该领域意见领袖对报告进行深度解析和点评。

  纵览本报告,我们有几个重点发现:

  大部分AIoT的开发者工作状态较为自在,其中自由开发者占到39%;

  拥有3-5年技术开发经验的开发者人数成倍数增长,说明这一领域的爆发期是在五年前;

  有38.5%的开发者最感兴趣的AIoT技术是数据科学/数据挖掘/数据分析,其次是机器学习/深度学习/神经网络,占比37.6%;

  生成式大模型技术的突然爆发对于开发者来说还有待观察,但预期向好;

  42.5%的开发者表示所在公司生产的AIoT设备用于制造业,41%的开发者认为感知/控制是自动驾驶技术中最具挑战性的环节;

  43%的开发者认为,国际上AIoT的发展以底层技术作为主导,国内则以平台、应用和服务层主导AIoT产业价值链;

  30%的开发者表示,国外在可穿戴设备、智能家居,以及智能电网等的应用上更加超前;

  超过9成开发者认为机器可以胜任部分到大部分人类工作,41%的开发者认为人工智能有可能产生出意识。

  开发者生态:时间自由、人数增长、聚焦机器学习/深度学习

  近来,ChatGPT引发国内AI产业爆火,大佬们纷纷布局大语言模型。从美团“退休”后,王慧文在上个月创办“光年之外”,收购袁进辉的一流科技,旨在打造中国版ChatGPT。王慧文的英雄帖显然召唤出了产业界的热情,李开复开始筹组Project AI 2.0,王小川携带5000万美元入场费,创办百川智能……

  当AI大佬们跑步进入新的战场,从事AIoT的开发者又呈现出怎样的生态?

  从调查数据来看,大部分AIoT开发者工作状态较为自在,图1中,自由开发者占到39%,作为兼职和利用业余时间参与的比例为40.0%,和自由开发者数量相当。相较而言,全职开发者最少,只占到调查人群的五分之一左右。这一方面说明开发者群体愈加倾向自由职业,另一方面也说明AIoT是自由开发者聚集的领域。

  图1 开发者参与AIoT状态

  从2017年开始,AIoT被频繁提及,在此之前,开发者更多是在AI或者IoT的独立领域。而当智能家居、智能制造、智能城市等落地应用端被推向风口,AIoT逐渐成为产业界的主流讨论方向。从图2不难看出,拥有3-5年技术开发经验的开发者人数成倍数增长,说明这一领域的爆发期正是在五年前。

  而近年来,得益于市场潜力地不断挖掘,越来越多的开发者选择进入这一领域。据调查显示,近1-2年进入这一领域的开发者占比为32%,而就在去年,这一数据进一步增长到41%。

  图2 开发者从事AIoT技术开发的时间

  具体到所从事的技术领域,机器学习/深度学习算法工程师、数据科学家/数据分析师/数据挖掘工程师和计算机视觉/图像识别/图像处理工程师的队伍较为庞大,位列前三,分别占比10.5%、10.4%及9.1%。另外,在软件工程师和硬件工程师的统筹统计中,软件工程师以38.5%的占比远高于硬件(芯片、传感器、控制器工程师+智能硬件工程师)9.2%的占比。

  图3 开发者从事AI/IoT的技术领域

  技术工具:数据科学/机器学习+AI大模型+存储/云计算+工具箱

  李彦宏今年初曾公开表示:“如果让我来判断第四次科技革命的标志,我认为是深度学习算法”。同时,他也认为“大语言模型的出现对于云计算来说,是一个 Game Changer,会改变云计算的游戏规则。”

  和他预判相一致的是,在AIoT领域,开发者最感兴趣的技术是数据科学/数据挖掘/数据分析(见图4),有38.5%的开发者做出了这一选择,以及机器学习/深度学习/神经网络,占比37.6%,这样的结果也完全符合AI算据、算法、算力的三大要义。在通用技术上,29.4%的开发者选择了计算机视觉/图像识别/图像处理,可见视觉仍然被赋予极高期待。

  以上AI技术为AIoT发挥的作用主要体现在,可以帮助开发者处理和分析从各种物联设备中收集到的海量数据,从而为企业提供更准确、更有用的洞察和决策支持。与此同时,可以帮助开发人员构建智能应用程序,在实时监测和控制物联设备方面发挥着重要作用。

  此外,比较出乎意料的是,AIGC/大语言模型的选择人数只占到4.8%,本调查的收集期限覆盖了ChatGPT的起势期(去年12月-今年1月),国内大语言模型的火爆期主要集中在今年2-3月。

  图4 开发者对AIoT感兴趣的技术方向

  在另一个关于AI热点技术突破的问题上,26.6%的开发者表示看好生成式人工智能(图5)。上述4.8%,以及这里的26.6%两个数据恰好说明了,生成式大模型技术的突然爆发对于开发者来说还有待观察,但预期向好。而除了生成式人工智能之外,大规模数据集和大模型开源也是开发者看好的方向,两个选项分别占比23.4%和20.9%。

  图5 开发者看好的AI热点技术突破

  另外,大规模物联网应用还需要处理海量数据,这些数据需要进行有效的存储和管理。云计算是建立在大规模数据存储之上的一项关键技术,它提供了强大的计算能力和可扩展性,帮助开发人员更好地处理和分析数据。据调查显示(图6),超过3成的开发者日常会处理数据存储相关的问题,其次是云计算,占比28%。

  图6 开发者接触最多的AIoT技术

  目前AIoT的开发者工具应用主要集中在视觉图像、语音合成和自然语言处理等领域(见图7)。调查数据显示,近三成开发者会用到AI人像修复工具,该技术可以帮助开发者对人像进行自动修复和增强,提高应用设备上人脸检测的效果以及准确性。排在二、三位的分别是AI目标检测和AI视频抠像/人像抠像,均与机器视觉相关,之后是人工智能语音合成。

  图7 开发者使用的AI工具箱

  行业场景:制造业+自动驾驶+供应商

  AIoT作为人工智能和物联网技术结合的产物,它使物联网设备更加自动化和智能化,制造领域基于降本增效的底层诉求,也与AIoT进行了紧密的融合。

  42.5%的开发者表示所在公司生产的AIoT设备用于制造业,帮助制造企业进行数据分析和优化,实现智能制造。当然,其它领域也在飞速发展,其中金融、交通物流也是AIoT技术应用的重要领域(见图8)。

  图8 AIoT技术应用的行业领域

  另据调查数据显示(图9),开发者们开发出来的产品应用场景非常广泛,没有出现某些领域特别高的现象,分布相对均匀。其中,用于图像识别和推荐系统的产品占比相对较高,分别为19%和18%。

  图9 AIoT产品应用场景

  自动驾驶被称为是AI皇冠上的明珠,同时也是IoT的重要应用场景。但在相关技术的系统设计和实现方面,开发者仍面临着诸多挑战(图10)。其中,41%的开发者认为感知/控制是自动驾驶技术中最具挑战性的环节,紧随其后的是预测/规划、硬件系统以及视觉,分别占比28%、26%和26%。未来,开发者需要持续地深入研究和努力,克服这些难点,提高自动驾驶技术的性能和可靠性。

  图10 自动驾驶面临的主要痛点

  在AIoT供应商的排名中(图11),26%的开发者表示其所在公司主要与华为合作,位列第一。除了华为,国内其他IoT供应商也发展迅速,其中小米也是重要的供应商之一,有14%的开发者表示,他们在使用小米提供的IoT服务。排在国内前五的还包括中兴、新华三和TP-LINK。

  图11 AIoT领域供应商

  发展路径:平台、应用和服务层主导,可穿戴设备未来可期

  对比来看,国内和国际在选择AIoT的发展路径上存在较大差异。其中,有43%的开发者认为,国际上AIoT的发展以底层技术作为主导,国内则以平台、应用和服务层主导AIoT产业价值链。与此同时,30%的开发者表示,国外在可穿戴设备、智能家居,以及智能电网等的应用上更加超前(图12)。

  图12 AIoT国内外发展路径差异

  事实上,经过多年的发展,国内很多厂商已经开始制造头戴式VR/AR设备。这类设备具有更高的沉浸感和自由度,用户可以随时随地享受更加真实的VR/AR体验。调查显示,59%的开发者表示他们自己或者周围朋友有VR/AR设备,此外41%的开发者对于这一领域的兴趣尚待挖掘(图13)。

  图13 VR/AR穿戴设备目前发展情况

  对于虚拟和增强现实的未来应用,几近一半开发者看好该技术在游戏娱乐等日常消遣场景中的应用。还有27%的开发者非常看好这一领域,认为《头号玩家》在未来将会成为现实。另外,也有近五分之一的开发者认为这一技术没有实际意义,或者技术本身面临难以解决的问题,因而并不看好(图14)。

  图14 VR/AR穿戴设备未来趋势

  未来范式:人、机、物大融合,AIoT带来的巨变和社会影响

  未来,AIoT的演进范式会体现在人、机、物的大融合上。一方面机器将可以代替人类劳动,另一方面也可以实现人机协作。对于机器替换人类工作,超过9成的开发者认为机器可以部分到大部分胜任(图15),其中更有4%的人认为人类将不再需要工作,只有8%的开发者认为机器不能替代人类。

  图15 机器会在多大程度上改变人类工作

  至于AIoT将在未来带来哪些巨变,53%的开发者认同AIoT会增强工作效率(图16),通过设备和系统的互联实现智能化和自动化管理,使得工作流程更加高效和精确。此外,30%的开发者表示期待更加智能的家居系统,提升生活质量。对AIoT抱持不安全感态度的开发者占比6%,也有11%的开发者担心AIoT会加剧失业问题。

  图16 AIoT在未来将带来的最大改变是什么

  伴随AIoT技术的广泛应用,也会带来一系列伦理、法律和社会影响,将改变我们经济发展路径和社会生活形态。因此,在AIoT技术普及之前,需要开展广泛的社会、文化和伦理的探讨研究。那么,关

  ChatGPT 之所以能风靡全球,很大程度上要归功于其简单的功能框架。作为一款 AI 聊天机器人,它唯一的作用就是生成令人信服的自然语言文本、顺畅回应用户的提问。

  但 AI 聊天机器人的使用体验,往往由用户设计提示词的水平所决定。有鉴于此,新型应用 Auto-GPT 应运而生,它允许 AI 自主行动 — 即实现“自我提示”,并彻底改变我们对于这项技术的看法和感受。对于这一工具,有外媒的标题甚至称,“ChatGPT 已经过时”。

  Auto-GPT 项目地址:

  https://github.com/Torantulino/Auto-GPT

  Auto-GPT 是什么?

  Auto-GPT是一款开源 Python 应用程序,由开发者用户 Significant Gravitas 于 2023 年 3 月 30 日发布至 GitHub。该应用程序以 GPT-4 为基础,允许 AI“自主”行动,无需用户详尽提示每个动作。大家可以为 Auto-GPT 制定一个总体目标,再由它逐步采取行动以实现目标。这就是“AI 智能体”概念的来源 — 使用互联网资源以完全独立的方式在 PC 上执行操作,不再需要一步步接受提示和引导。

  GitHub 上还发布了一个简单示例,展示 Auto-GPT 如何浏览网络并为“即将到来的下一个节假日”准备聚餐食谱。这时 Auto-GPT 会化身“大厨 Chef-GPT”,帮助用户在网上搜索正确答案。之后,它会将食谱以文件的形式保存在用户计算机内。

  就功能本身来看,这似乎算不上什么创新大事件。但 Auto-GPT 代表用户搜索互联网并执行文件保存操作的能力,已经让这款AI远远超越了简单的聊天机器人。

  Auto-GPT 是如何工作的?

  Auto-GPT 的迷人之处,在于它能够对 AI 的运行步骤做拆分,真正把 GPT 模型出色的文本生成能力转化为可用功能。Auto-GPT 把整个过程分解成“思考”、“推理”和“评价”几个环节,准确告知用户 AI 正在做什么、为什么这么做。在前面的 Chef-GPT 示例中,它的“思考”方式如下:“我将搜索即将到来的节假日,据此创建出独特的食谱。”而“推理”部分,则是“只要确定了节假日的具体内容,就能确定食谱的相应设计。”

  至于“评价”环节,Auto-GPT 会对所做工作表达一些担忧和限制。可以看到,Auto-GPT 正在以完全自主的方式一步步达成用户指定的目标。

  Auto-GPT 还拥有其他一些神奇的能力,包括长/短期记忆和集成 ElevenLabs 提供的文本到语音实现。所有这些功能的结合,让 Auto-GPT 在感受上更像是能与人类真正互动的AI智能体。

  Auto-GPT 用例

  人们正在发掘 Auto-GPT 的各种可能用例。虽然目前仍处于起步阶段,但因为它属于纯开源项目,所以任何人都可以尝试这款工具。Twitter 上就出现了一个简单的“Ecommerce-GPT”示例,其目标是自主开发和运营电子商务业务,旨在帮助用户增加净资产。

  我的 Auto-GPT 来自 @SigGravitas,正在开发电子商务业务。它决定检索互联网以寻找商业创意,并将结果保存在文件中以供后续参考。

  另一个有趣的用例出现在编码领域。Twitter 上的一位用户想出了“Robo-GPT”,负责分析、重写并保存程序代码。

  今天我编写了 Auto-GPT 的变体 Robo-GPT,希望让代码更干净、依赖关系更简单。它目前的功能还不像 Auto-GPT 那么完备,但希望它能易于理解、运行和更新。

  类似的例子还有很多,也许这款 AI 智能体最终将帮助我们创建网站、组织社交媒体活动等等。

  与此同时,具备类似功能的竞争系统也纷纷亮相,包括微软 Jarvis 和 BabyAGI。这些方案都允许 GPT“自我提示”并实现自主行动。

  如何使用 Auto-GPT

  与其他 GitHub 项目一样,Auto-GPT的设置过程不只是下载文件或者访问网站。在上手之前还需要满足一些重要的前提条件,比如安装有 Python 3.8(或更高版本)、OpenAI API 密钥和 Pinecone API 密钥。如果希望使用可选的文本转语音功能,还需要用到 ElevenLabs API。

  用户可以在 Auto-GPT GitHub 页面上找到相关链接及其他重要信息。在满足以上三项要求后,单击“Code”并下载 Zip 文件。当然,用户也也可以通过 Git 应用程序获取这些文件。

  首先打开命令行程序,例如 PowerShell,并在其中输入“git clone

  https://github.com/Torantulino/Auto-GPT.git”以克隆代码仓库。

  第二步是在 PowerShell 中输出“cd ‘Auto-GPT’”以导航至项目目录。之后,输入“pip install -r requirements.txt”来安装所需的依赖项。最后,将文件“.env.template”重命名为“.env”并填写您的 OpenAI API 密钥。

  在安装完成之后,Auto-GPT 的实际使用其实非常简单。它会要求用户先为机器人命名,之后再提供想达成的目标。它甚至提供两个示例,引导朝着正确的方向前进。

  Auto-GPT 实现通用人工智能了吗?

  不少 AI 爱好者把 Auto-GPT 视为通往人工通用智能(AGI)的第一步。确实,Auto-GPT 表现出了推理和通过多个自主步骤达成目标的能力,其长/短期记忆机制也让它能够不断学习更多新鲜事物。

  但很多人仍然认为,一系列相互关联的提示并不能让系统真正获得“智能”;也有人坚称,人类的大部分智能和行为就是以这种方式实现的。

  无论是 AGI 的开端、还是 AI 标准化道路上的重要一步,Auto-GPT 的出现必然引发新的哲学思考。这些运行在互联网上、活动在数字世界中的 AI 智能体,究竟是不是“智能生物”?也许只有时间能给出答案。

于伦理、法律和社会影响的讨论应该在什么时间点展开?36%的开发者表示越早越好,在基础研究阶段就应该开始。也有同样数量的开发者表示,在产品化、服务化之后社会使用和实施阶段再考虑也可以(图17)。

  图17 哪个阶段开始考虑AIoT的伦理、法律和社会影响

  万物智联之下,人工智能是否具有意识的能力,一直是哲学、心理学、神经科学等领域探讨的问题,近年来也逐渐成为更多人关注的焦点。数据显示,41%的开发者认为人工智能有可能产生出意识(图18),看来不少人对于硅基生命的想像还是很丰富的。

0 条回复 A 作者 M 管理员
    所有的伟大,都源于一个勇敢的开始!
欢迎您,新朋友,感谢参与互动!欢迎您 {{author}},您在本站有{{commentsCount}}条评论