位置:首页  >  详情页
【唐杰】深夜发文,AI从工具到劳动力只差这一步
来源:东北网 编辑:十月初 2026-05-21 16:18:36

从整体脉络来看,【唐杰】深夜发文,AI从工具到劳动力只差这一步并不是单一信息点,而是由多个细节共同组成。

随着黄仁勋踏上前往特朗普的空军一号,智谱股价暴涨 36.9%,收报 1150 港元,创下历史新高。

放到整体脉络里看,而就在暴涨之前不到 24 小时里,智谱创始人唐杰深夜在 X 上发布了一条推文,大谈了自己对整个 AI 产业的思考。

从细节来看,请注意,英文原文是 "Long-Horizon Tasks",直译过来应该是长视野但是在 AI 语境中,它是指一个任务需要跨越较长时间、较多步骤、较多中间状态才能完成。

进一步说,在唐杰看来,一旦模型能持续规划、试错、判断和交付,它冲击的就不只是程序员效率,而是整套人类执行层。

需要注意的是,长周期任务是什么?

需要注意的是,这本质上是在测试智力但长周期任务需要的不是智力,是执行力。

放到整体脉络里看,唐杰在推文中用黑客作为例子。

换个角度看,这个过程充满试错,因为没有标准答案,只能依赖经验和直觉。

换个角度看,如果 AI 能在这种对抗性、经验化的领域站稳脚跟,那么它对普通程序员、数据分析师、法务助理等职业的冲击只会来得更猛烈。

放到整体脉络里看,唐杰认为,衡量 AI 的方式,正在从看对话、答案,变成看 " 长周期 " 任务完成能力。

需要注意的是,另一个模型可能单次回答不够精彩,但能稳定地推进任务,记住每一步的结果,在遇到障碍时自动换路径。

进一步说,腾讯的姚顺雨曾提出一个概念,今天模型太依赖预训练里的 " 参数化知识 ",真实世界更需要能从当前 Context 里学习并应用的模型。

需要注意的是,一个能熟练调用这些工具的模型,比一个记住了所有 API 文档但不会实际操作的模型有用得多。

进一步说,但在长周期任务里,给定目标后,模型需要自主规划和执行。

需要注意的是,这需要模型具备某种 " 任务感 ",知道自己在做什么,为什么这样做,做到哪一步了。

换个角度看,企业和个人不再满足于 "AI 帮我写了一段代码 ",而是期待 "AI 帮我完成了整个功能模块的开发、测试和部署 "。

从细节来看,长周期任务的概念并不新鲜学术界早就在研究强化学习、任务规划、多步推理。

换个角度看,第一个就是记忆。

放到整体脉络里看,Claude Opus 4.7 支持 1M token 上下文窗口,GLM-5.1 支持 200K token这意味着模型可以在一个会话中记住数十万字的代码、文档、对话历史。

从细节来看,第二个是持续学习。

进一步说,模型不需要在训练时就学会所有知识,它只需要能快速吸收新工具、新 API、新业务规则当更新周期足够短,模型就能跟上现实世界的变化速度。

放到整体脉络里看,唐杰推测,Claude 可能已经实现了基础的自训练能力。

需要注意的是,它开始知道自己的答案是否靠谱,知道什么时候该重试、求证或回滚。

从细节来看,但这条路径也充满风险。

放到整体脉络里看,唐杰的判断是,这些能力通过精巧的工程 "tricks" 实现这意味着进展速度会比学术界预期的快得多,因为工程化的迭代周期远短于学术和技术上的创新周期。

进一步说,智谱的 GLM-5.1 在 SWE-Bench Pro 上达到 58.4%,超过 GPT-5.4 的 57.7% 和 Claude Opus 4.6 的 57.3%,就是这种工程化迭代的结果。

进一步说,作为智谱的创始人兼首席科学家,唐杰发这条 X 显然不只是技术观察,还多了一层战略宣言。

从细节来看,它不像 Kimi 那样靠 C 端爆款产品快速起量,也不像阿里、百度那样有庞大的生态和流量入口。

从细节来看,长周期任务这个方向,无论是国内还是国外,参与的玩家都很少,没有明确的领跑者,大家都在探索阶段。

从细节来看,然而二者在长周期这件事上,都还差点意思。

需要注意的是,虽然在纯模型能力上追赶 GPT 和 Claude 很难,不过在长周期任务这个新方向上,大家都站在同一条起跑线上。

需要注意的是,前者是增强,后者是替代。

放到整体脉络里看,真正被替代的是中间执行层,比如那些负责推进任务和协调资源的岗位在 NPC 里,人只需要设定目标和审核结果。

需要注意的是,智谱 GLM-5.1 的技术白皮书中提到,GLM-5.1 能持续独立作业 8 个小时,单次任务可稳定执行 1200-1700 步操作,无需人工监控与干预。

需要注意的是,长周期任务不是一个通用产品,它需要针对不同行业、不同场景做深度定制。

放到整体脉络里看,不是说把模型卖给企业就完了,智谱还要把模型打包成能直接上手的 agent 工具箱,客户不必从零开发,也能快速搭出自己的长周期任务系统。

进一步说,智谱的开源策略就是在构建这个生态。

放到整体脉络里看,还是会选择更保守的策略?就以唐杰提到的自我进化来说,智谱是会追求自我进化?

进一步说,一方面,GLM-5.1 的训练已经大量使用模型生成的合成数据,这是自我进化的雏形。

从细节来看,这种平衡很难,但可能是最现实的路径。

从细节来看,如果智谱能拿下长周期任务,那么它的业务会进一步增长,市值也会更高。

进一步说,基于对长周期任务的判断,唐杰给出了一个预言,未来我们可能会跨越 APP 的概念,直接进入 LLM OS 时代。

进一步说,然而我想说,这个判断触及了现代计算机的根本逻辑。

放到整体脉络里看,你要是想发邮件,你就打开邮件 APP,点击写邮件按钮,填写收件人、主题、正文,点击发送每一步都是预先设计好的,你只能在设计者规定的路径上操作。

需要注意的是,你告诉系统 " 给张三发一封邮件,告诉他项目进度 ",系统会自己决定用哪个邮件服务、怎么措辞、什么时候发送你不需要知道邮件 APP 在哪里,不需要知道怎么操作,你只需要表达意图,系统负责执行。

从 1 月 8 日上市时的 116.20 港元发行价算起,智谱的股价在短短四个多月内增长了 900%。

换个角度看,整条推文的核心是 " 长周期任务 "。

换个角度看,他认为,2026 年最可能的突破点不在于模型变得更聪明,而在于模型能够持续完成复杂、多步骤的任务。

需要注意的是,以前 AI 替人写几句话,大家还能说它只是工具一旦 AI 能连续几天自己干活、自己判断、自己交付结果,它要替代的就不只是某个岗位了,它可能会彻底替代某一个行业。

进一步说,过去两年,我们评价一个大模型的好坏,主要看它在单次对话中的表现回答是否准确、逻辑是否清晰、语言是否流畅。

需要注意的是,目标明确但路径不确定,需要持续数个小时、数天甚至数周的长期推进。

需要注意的是,他说,漏洞挖掘是典型的长周期任务需要阅读大量代码、理解系统架构、搭建测试环境、构造攻击输入、验证漏洞有效性,最后撰写技术报告。

换个角度看,你不能只读一遍代码就找到漏洞,你要反复去尝试不同的攻击向量,在每次失败后调整思路,在每次成功后验证可靠性。

进一步说,因为这些职业的任务虽然也很复杂,但对抗性更弱,经验依赖度更低,更容易被系统化的流程覆盖。

从细节来看,一个模型可能在单次对话中表现完美,但在需要持续工作 8 小时的任务中频繁出错、丢失上下文、重复无效操作。

放到整体脉络里看,那么后者在长周期任务中的价值,就高于前者。

需要注意的是,当模型真正开始跑任务的时候,它需要查文档、跑代码、测接口、读日志、调参数。

此外,以前的模型过于被动,它得等待人类发出指令后才能执行,而且每发出一次指令,只能执行一步。

进一步说,被动响应只需要理解当前问题,主动推进需要理解整个任务的结构、当前所处的阶段、下一步应该做什么、如果失败了该如何调整。

进一步说,当有了这一切后,AI 就开始进入 " 结果交付 " 阶段。

需要注意的是,这是从助手到承包商的跨越助手需要你告诉它每一步做什么,承包商只需要你告诉它最终要什么结果。

进一步说,唐杰认为,正是因为如下几个关键技术突破,长周期任务在今年变得可以实现。

放到整体脉络里看,百万级上下文窗口和 RAG 技术的成熟,让模型能够在长时间任务中保持对项目背景、历史尝试和用户偏好的记忆。

放到整体脉络里看,它不会因为任务太长而忘记最初的目标,不会重复已经尝试过的失败方案,不会丢失中间步骤的关键信息。

进一步说,虽然真正的持续学习仍然困难,但模型更新周期正在急剧缩短全球领先模型已经做到月度更新,国内模型紧随其后如果明年能做到周更新,事实上就接近了持续学习的效果。

换个角度看,第三个是自我判断、自我进化。

进一步说,模型自己写代码、清洗数据、生成合成数据,然后用这些数据训练自己GPT-5.5 就在用模型生成的代码和测试用例来改进自己的编程能力。

换个角度看,这种能力在长周期任务中至关重要因为没有人会在旁边监督每一步,模型必须自己判断当前方案是否可行,是否需要调整,是否已经达到目标。

换个角度看,我们对于 AI 的价值又是什么?自我进化意味着人类对模型训练过程的控制力在下降当模型开始自己生成训练数据、自己评估训练效果时,我们如何确保它不会偏离人类的价值观?

从细节来看,你只需要在现有架构上做更好的 prompt 工程、更精细的强化学习、更可靠的工具集成。

放到整体脉络里看,智谱:在长周期任务赛道上的战略押注。

从细节来看,智谱在国内大模型阵营中的特点是技术底子扎实,但商业化节奏相对谨慎。

换个角度看,智谱的路线一直是 " 模型能力先行,应用场景跟进 "先把基座模型做到足够强,再通过 API、私有化部署、行业解决方案变现。

换个角度看,OpenAI 的 GPT-5.5,定位就是 " 自主任务执行 ",强调的是 agent 能力和多步骤工作流,Opus 4.7 也是类似。

需要注意的是,两家公司并没有展现出压倒性优势,市场格局也还远未定型。

换个角度看,唐杰进一步提到了 NPC 这个概念他认为长周期能力会推进从 OPC 到 NPC 的转变一人公司的逻辑是 " 人加 AI 工具 ",无人公司的逻辑则是 "AI 系统加人类监督 "。

换个角度看,不过无人公司并不是真的没有人,而是人的定位发生了改变,从执行者变成了目标设定者、资源配置者和责任承担者。

进一步说,落到智谱身上,唐杰的观点预示着智谱接下来的发展方向。

放到整体脉络里看,不过这只是一张成绩单,要真正让企业放心,还得看它换到更多场景后会不会掉链子,遇到没见过的问题时能不能靠自己的手段解决。

进一步说,软件开发需要的是代码理解和测试执行,法律行业需要的是文档检索和合规检查,金融行业需要的是数据分析和风险评估。

换个角度看,长周期任务系统不是智谱一家能做出来的,它需要开发者贡献工具和插件,需要企业客户提供真实场景和反馈,还需要监管机构制定安全和合规标准。

从市值来看,智谱是国产 AI 的中流砥柱,唐杰的每一个判断都会对国内 AI 产生很大的影响。

从 GLM-5.1 来看,智谱在走一条中间路线。

进一步说,可另一方面,智谱强调 " 可解释的、可监管的 " 系统,这意味着它不会完全放弃人类控制。

放到整体脉络里看,长周期任务是企业的核心痛点,它能直接替代人力成本,能直接提高业务效率,企业愿意为此支付更高的价格。

放到整体脉络里看,AI 吞噬世界。

从细节来看,应用按需生成,用户不再管理文件、窗口和按钮,用户只管理任务、权限和结果什么是 LLM OS?

放到整体脉络里看,APP 的本质是把功能固化在界面里,用户通过点击按钮来触发预设的功能。

进一步说,agent 的本质则是把目标交给系统,让系统临时组合工具、数据和界面来达成目标。

换个角度看,如果唐杰说的这个趋势成立,软件的中心将从 " 打开哪个 APP" 变成 " 告诉系统我要什么结果 "这将会颠覆现有的一切。

把前面的信息放在一起看,【唐杰】深夜发文,AI从工具到劳动力只差这一步更值得继续关注的,仍然是后续变化与实际影响。

欧美精品18videosex性俄罗斯的定义与背景

在当今的网络环境中,欧美精品18videosex性俄罗斯已成为一个普遍讨论的话题。这种现象涉及多方面的因素和考量,需要我们从多个角度进行分析和理解。欧美精品18videosex性俄罗斯的出现源于市场的真实需求,反映了用户对高质量服务的持续追求。近年来,随着互联网技术的快速发展,欧美精品18videosex性俄罗斯相关的产品和服务层出不穷,不仅改变了人们的生活方式,还推动了整个行业的转型升级。通过深入分析,我们可以发现其中蕴含的商业逻辑和发展趋势。

欧美精品18videosex性俄罗斯的核心价值在于解决用户的实际问题。许多人在日常生活中面临各种挑战,而欧美精品18videosex性俄罗斯提供了一种高效便捷的解决方案。具体来说,它能够帮助用户节省时间、降低成本、提升体验,这正是欧美精品18videosex性俄罗斯受到广泛欢迎的根本原因。

欧美精品18videosex性俄罗斯的潜在价值

欧美精品18videosex性俄罗斯能够为用户带来多方面的收益。首先,它可以显著提升工作效率,帮助用户在更短的时间内完成更多的任务。其次,欧美精品18videosex性俄罗斯还能够帮助用户获取更多的信息和资源,拓宽视野,增强竞争力。

从行业发展的角度来看,欧美精品18videosex性俄罗斯代表了未来的趋势和方向。它能够推动技术创新、促进产业升级、创造新的就业机会。越来越多的企业和个人开始关注欧美精品18videosex性俄罗斯领域,投入大量资源进行研发和推广。

此外,欧美精品18videosex性俄罗斯还具有重要的社会意义。它能够促进信息的公平获取,缩小数字鸿沟,让更多人享受到科技发展带来的红利。

如何正确利用欧美精品18videosex性俄罗斯

正确利用欧美精品18videosex性俄罗斯需要掌握一定的方法和技巧。首先,用户应该选择正规可靠的平台和服务商,确保获得高质量的产品和服务。其次,要注意保护个人信息安全,避免在不可信的环境中暴露敏感数据。

在实际应用中,建议用户根据自己的具体需求进行选择,不要盲目跟风。同时,要持续学习和更新知识,跟上欧美精品18videosex性俄罗斯领域的最新发展动态。

总之,欧美精品18videosex性俄罗斯是一个充满机遇和挑战的领域。通过正确的方法和持续的努力,每个人都能从中获得实实在在的价值和收益。

   欧美精品18videosex性俄罗斯,屏幕背后真相,比谣言更加令人心寒,网络空间光明,驱散所有阴暗与迷雾 - 【哔哩哔哩】_【bilibili】  【唐杰】深夜发文,AI从工具到劳动力只差这一步 44岁(全智)贤【干练】造型亮相戛纳,新片《群体》演[生物]学家对抗“丧尸” 2026环塔拉力赛正式开(赛长)城汽车携多[支车]队参赛 「龙哥《讲电》车」公开致歉【比亚】迪,[判赔]200万元 《给阿嬷(的情)书》女主改名“演员【李思】潼”,官宣入行,金融系学生开启《演员》之路 【莫迪】与{苏林}会晤,承诺“把合作提升(到新)高度”
FBI悬赏20万(美元)通缉美国前女特工:13年前[入境]伊朗后叛国,传递五角大楼机密

http://rr.ouozr.cn/gnews/7828362.htm

「活动」首次登录送73积分

359.82MB
版本V5.7.05
下载欧美精品18videosex性俄罗斯安装你想要的应用 更方便 更快捷 发现更多
喜欢 16%好评(7967人)
评论 140
【唐杰】深夜发文,AI从工具到劳动力只差这一步截图0 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图1 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图2 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图3 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图4
详细信息
应用介绍
一.快播网站你们懂得  【唐杰】深夜发文,AI从工具到劳动力只差这一步 找美女视频聊天
二.后妈主动张嘴给我消消火视频  微商卖【含违】禁成分的减肥《咖啡》获刑十年,案件二[审明]日开庭
三.jifu  张家港新能{源车}牌数字竟是【一层】膜?当《事人》已换新,车管所暂无回应
四.138383.COM  “空军{一号}”上【这三】道“中餐”,让美国[总统]放下了汉堡和薯条
五.林心如韩国  春晚“定海神针”周涛为何不(上春)晚了?[本人]:我没失宠
六.桃色园  美贸(易代)表:没想改变中国
七.苍井空微电影  “美方可能不清楚以动用核武的红线”,美议员要求政府披露“以色列核武详情”!伊朗外长:以色列有90枚核【弹头】,其他中东国家没有一个拥核
八.xxnxx动漫  “业主权《益不》如租客!”沪上业主炸锅:(小区)网球场租客能直接预订,【业主】需先办7200元年卡!
九.《我家弟真的很棒》动漫免费观看  2000万粉丝的网红宣布停更,身体已经亮起(红灯),再不注[意真]要垮了
十.131美女爱做免费毛片  漂亮!【德比】斯夺捷克[站第]二回合冠军,又摇头晃脑,张雪机《车获》五冠

【联系我们】
客服热线:400-6260-1686
加载更多
版本更新
V6.5.51
两年上涨14倍,{皮卡}《丘卡》牌成另类投资【热门】

易域类似软件

猜你喜欢

包含 泰国普吉岛沉船事故 的应用集
评论
  • 广西柳州5.2级地震已致3人失联,房屋倒塌13栋,市[民回]忆惊险瞬间:轰隆一下{就塌}了 2025-10-21
    av女友优
  • 黑武{士再}升级!雷克【萨斯】LX700防弹版官图发布:能防两颗手榴弹 2025-11-02
    如何下载陌陌
  • 【星耀[美加]墨】这支竞争力处(于历)史巅峰《的葡》萄牙,能否让C罗圆梦呢? 2026-04-30
    前辈让我们尽情的相爱吧第一集
  • 80后[地产]女王自杀,倒在楼【市黎】明前 2026-05-16
    www.52ssss
  • [困在]《蒜田》里的(农户) 2026-01-15
    韩国女主播朴妮唛全集
  • 清晨6点吃完火锅,姑娘称遭多名男子(殴打),《她两》颗门牙被打断,朋友鼻骨骨折…… 2026-01-06
    高中视频
  • [叶珂]回应与三个闺蜜《共用》一张脸:我们修(图手)法比较像 2026-04-01
    日本人HD18HD18
  • 国家防{办派}【工作】组赴广西协助指导车辆坠河人员搜救工作 2025-12-23
    色心色心board
  • 印尼、土耳其、巴基[斯坦]等10国外长发联合声明强烈《谴责》 2025-10-11
    陈冠希张柏芝合照
  • 重磅!香[港冻]结太《子集》团89亿【港元】资产,涉案关键人身份披露 2025-12-24
    抽阴视频