位置:首页  >  详情页
【唐杰】深夜发文,AI从工具到劳动力只差这一步
来源:东北网 编辑:洗芝溪 2026-05-21 17:10:37

从整体脉络来看,【唐杰】深夜发文,AI从工具到劳动力只差这一步并不是单一信息点,而是由多个细节共同组成。

随着黄仁勋踏上前往特朗普的空军一号,智谱股价暴涨 36.9%,收报 1150 港元,创下历史新高。

放到整体脉络里看,而就在暴涨之前不到 24 小时里,智谱创始人唐杰深夜在 X 上发布了一条推文,大谈了自己对整个 AI 产业的思考。

从细节来看,请注意,英文原文是 "Long-Horizon Tasks",直译过来应该是长视野但是在 AI 语境中,它是指一个任务需要跨越较长时间、较多步骤、较多中间状态才能完成。

进一步说,在唐杰看来,一旦模型能持续规划、试错、判断和交付,它冲击的就不只是程序员效率,而是整套人类执行层。

需要注意的是,长周期任务是什么?

需要注意的是,这本质上是在测试智力但长周期任务需要的不是智力,是执行力。

放到整体脉络里看,唐杰在推文中用黑客作为例子。

换个角度看,这个过程充满试错,因为没有标准答案,只能依赖经验和直觉。

换个角度看,如果 AI 能在这种对抗性、经验化的领域站稳脚跟,那么它对普通程序员、数据分析师、法务助理等职业的冲击只会来得更猛烈。

放到整体脉络里看,唐杰认为,衡量 AI 的方式,正在从看对话、答案,变成看 " 长周期 " 任务完成能力。

需要注意的是,另一个模型可能单次回答不够精彩,但能稳定地推进任务,记住每一步的结果,在遇到障碍时自动换路径。

进一步说,腾讯的姚顺雨曾提出一个概念,今天模型太依赖预训练里的 " 参数化知识 ",真实世界更需要能从当前 Context 里学习并应用的模型。

需要注意的是,一个能熟练调用这些工具的模型,比一个记住了所有 API 文档但不会实际操作的模型有用得多。

进一步说,但在长周期任务里,给定目标后,模型需要自主规划和执行。

需要注意的是,这需要模型具备某种 " 任务感 ",知道自己在做什么,为什么这样做,做到哪一步了。

换个角度看,企业和个人不再满足于 "AI 帮我写了一段代码 ",而是期待 "AI 帮我完成了整个功能模块的开发、测试和部署 "。

从细节来看,长周期任务的概念并不新鲜学术界早就在研究强化学习、任务规划、多步推理。

换个角度看,第一个就是记忆。

放到整体脉络里看,Claude Opus 4.7 支持 1M token 上下文窗口,GLM-5.1 支持 200K token这意味着模型可以在一个会话中记住数十万字的代码、文档、对话历史。

从细节来看,第二个是持续学习。

进一步说,模型不需要在训练时就学会所有知识,它只需要能快速吸收新工具、新 API、新业务规则当更新周期足够短,模型就能跟上现实世界的变化速度。

放到整体脉络里看,唐杰推测,Claude 可能已经实现了基础的自训练能力。

需要注意的是,它开始知道自己的答案是否靠谱,知道什么时候该重试、求证或回滚。

从细节来看,但这条路径也充满风险。

放到整体脉络里看,唐杰的判断是,这些能力通过精巧的工程 "tricks" 实现这意味着进展速度会比学术界预期的快得多,因为工程化的迭代周期远短于学术和技术上的创新周期。

进一步说,智谱的 GLM-5.1 在 SWE-Bench Pro 上达到 58.4%,超过 GPT-5.4 的 57.7% 和 Claude Opus 4.6 的 57.3%,就是这种工程化迭代的结果。

进一步说,作为智谱的创始人兼首席科学家,唐杰发这条 X 显然不只是技术观察,还多了一层战略宣言。

从细节来看,它不像 Kimi 那样靠 C 端爆款产品快速起量,也不像阿里、百度那样有庞大的生态和流量入口。

从细节来看,长周期任务这个方向,无论是国内还是国外,参与的玩家都很少,没有明确的领跑者,大家都在探索阶段。

从细节来看,然而二者在长周期这件事上,都还差点意思。

需要注意的是,虽然在纯模型能力上追赶 GPT 和 Claude 很难,不过在长周期任务这个新方向上,大家都站在同一条起跑线上。

需要注意的是,前者是增强,后者是替代。

放到整体脉络里看,真正被替代的是中间执行层,比如那些负责推进任务和协调资源的岗位在 NPC 里,人只需要设定目标和审核结果。

需要注意的是,智谱 GLM-5.1 的技术白皮书中提到,GLM-5.1 能持续独立作业 8 个小时,单次任务可稳定执行 1200-1700 步操作,无需人工监控与干预。

需要注意的是,长周期任务不是一个通用产品,它需要针对不同行业、不同场景做深度定制。

放到整体脉络里看,不是说把模型卖给企业就完了,智谱还要把模型打包成能直接上手的 agent 工具箱,客户不必从零开发,也能快速搭出自己的长周期任务系统。

进一步说,智谱的开源策略就是在构建这个生态。

放到整体脉络里看,还是会选择更保守的策略?就以唐杰提到的自我进化来说,智谱是会追求自我进化?

进一步说,一方面,GLM-5.1 的训练已经大量使用模型生成的合成数据,这是自我进化的雏形。

从细节来看,这种平衡很难,但可能是最现实的路径。

从细节来看,如果智谱能拿下长周期任务,那么它的业务会进一步增长,市值也会更高。

进一步说,基于对长周期任务的判断,唐杰给出了一个预言,未来我们可能会跨越 APP 的概念,直接进入 LLM OS 时代。

进一步说,然而我想说,这个判断触及了现代计算机的根本逻辑。

放到整体脉络里看,你要是想发邮件,你就打开邮件 APP,点击写邮件按钮,填写收件人、主题、正文,点击发送每一步都是预先设计好的,你只能在设计者规定的路径上操作。

需要注意的是,你告诉系统 " 给张三发一封邮件,告诉他项目进度 ",系统会自己决定用哪个邮件服务、怎么措辞、什么时候发送你不需要知道邮件 APP 在哪里,不需要知道怎么操作,你只需要表达意图,系统负责执行。

从 1 月 8 日上市时的 116.20 港元发行价算起,智谱的股价在短短四个多月内增长了 900%。

换个角度看,整条推文的核心是 " 长周期任务 "。

换个角度看,他认为,2026 年最可能的突破点不在于模型变得更聪明,而在于模型能够持续完成复杂、多步骤的任务。

需要注意的是,以前 AI 替人写几句话,大家还能说它只是工具一旦 AI 能连续几天自己干活、自己判断、自己交付结果,它要替代的就不只是某个岗位了,它可能会彻底替代某一个行业。

进一步说,过去两年,我们评价一个大模型的好坏,主要看它在单次对话中的表现回答是否准确、逻辑是否清晰、语言是否流畅。

需要注意的是,目标明确但路径不确定,需要持续数个小时、数天甚至数周的长期推进。

需要注意的是,他说,漏洞挖掘是典型的长周期任务需要阅读大量代码、理解系统架构、搭建测试环境、构造攻击输入、验证漏洞有效性,最后撰写技术报告。

换个角度看,你不能只读一遍代码就找到漏洞,你要反复去尝试不同的攻击向量,在每次失败后调整思路,在每次成功后验证可靠性。

进一步说,因为这些职业的任务虽然也很复杂,但对抗性更弱,经验依赖度更低,更容易被系统化的流程覆盖。

从细节来看,一个模型可能在单次对话中表现完美,但在需要持续工作 8 小时的任务中频繁出错、丢失上下文、重复无效操作。

放到整体脉络里看,那么后者在长周期任务中的价值,就高于前者。

需要注意的是,当模型真正开始跑任务的时候,它需要查文档、跑代码、测接口、读日志、调参数。

此外,以前的模型过于被动,它得等待人类发出指令后才能执行,而且每发出一次指令,只能执行一步。

进一步说,被动响应只需要理解当前问题,主动推进需要理解整个任务的结构、当前所处的阶段、下一步应该做什么、如果失败了该如何调整。

进一步说,当有了这一切后,AI 就开始进入 " 结果交付 " 阶段。

需要注意的是,这是从助手到承包商的跨越助手需要你告诉它每一步做什么,承包商只需要你告诉它最终要什么结果。

进一步说,唐杰认为,正是因为如下几个关键技术突破,长周期任务在今年变得可以实现。

放到整体脉络里看,百万级上下文窗口和 RAG 技术的成熟,让模型能够在长时间任务中保持对项目背景、历史尝试和用户偏好的记忆。

放到整体脉络里看,它不会因为任务太长而忘记最初的目标,不会重复已经尝试过的失败方案,不会丢失中间步骤的关键信息。

进一步说,虽然真正的持续学习仍然困难,但模型更新周期正在急剧缩短全球领先模型已经做到月度更新,国内模型紧随其后如果明年能做到周更新,事实上就接近了持续学习的效果。

换个角度看,第三个是自我判断、自我进化。

进一步说,模型自己写代码、清洗数据、生成合成数据,然后用这些数据训练自己GPT-5.5 就在用模型生成的代码和测试用例来改进自己的编程能力。

换个角度看,这种能力在长周期任务中至关重要因为没有人会在旁边监督每一步,模型必须自己判断当前方案是否可行,是否需要调整,是否已经达到目标。

换个角度看,我们对于 AI 的价值又是什么?自我进化意味着人类对模型训练过程的控制力在下降当模型开始自己生成训练数据、自己评估训练效果时,我们如何确保它不会偏离人类的价值观?

从细节来看,你只需要在现有架构上做更好的 prompt 工程、更精细的强化学习、更可靠的工具集成。

放到整体脉络里看,智谱:在长周期任务赛道上的战略押注。

从细节来看,智谱在国内大模型阵营中的特点是技术底子扎实,但商业化节奏相对谨慎。

换个角度看,智谱的路线一直是 " 模型能力先行,应用场景跟进 "先把基座模型做到足够强,再通过 API、私有化部署、行业解决方案变现。

换个角度看,OpenAI 的 GPT-5.5,定位就是 " 自主任务执行 ",强调的是 agent 能力和多步骤工作流,Opus 4.7 也是类似。

需要注意的是,两家公司并没有展现出压倒性优势,市场格局也还远未定型。

换个角度看,唐杰进一步提到了 NPC 这个概念他认为长周期能力会推进从 OPC 到 NPC 的转变一人公司的逻辑是 " 人加 AI 工具 ",无人公司的逻辑则是 "AI 系统加人类监督 "。

换个角度看,不过无人公司并不是真的没有人,而是人的定位发生了改变,从执行者变成了目标设定者、资源配置者和责任承担者。

进一步说,落到智谱身上,唐杰的观点预示着智谱接下来的发展方向。

放到整体脉络里看,不过这只是一张成绩单,要真正让企业放心,还得看它换到更多场景后会不会掉链子,遇到没见过的问题时能不能靠自己的手段解决。

进一步说,软件开发需要的是代码理解和测试执行,法律行业需要的是文档检索和合规检查,金融行业需要的是数据分析和风险评估。

换个角度看,长周期任务系统不是智谱一家能做出来的,它需要开发者贡献工具和插件,需要企业客户提供真实场景和反馈,还需要监管机构制定安全和合规标准。

从市值来看,智谱是国产 AI 的中流砥柱,唐杰的每一个判断都会对国内 AI 产生很大的影响。

从 GLM-5.1 来看,智谱在走一条中间路线。

进一步说,可另一方面,智谱强调 " 可解释的、可监管的 " 系统,这意味着它不会完全放弃人类控制。

放到整体脉络里看,长周期任务是企业的核心痛点,它能直接替代人力成本,能直接提高业务效率,企业愿意为此支付更高的价格。

放到整体脉络里看,AI 吞噬世界。

从细节来看,应用按需生成,用户不再管理文件、窗口和按钮,用户只管理任务、权限和结果什么是 LLM OS?

放到整体脉络里看,APP 的本质是把功能固化在界面里,用户通过点击按钮来触发预设的功能。

进一步说,agent 的本质则是把目标交给系统,让系统临时组合工具、数据和界面来达成目标。

换个角度看,如果唐杰说的这个趋势成立,软件的中心将从 " 打开哪个 APP" 变成 " 告诉系统我要什么结果 "这将会颠覆现有的一切。

把前面的信息放在一起看,【唐杰】深夜发文,AI从工具到劳动力只差这一步更值得继续关注的,仍然是后续变化与实际影响。

女性隐者的定义与背景

在当今的网络环境中,女性隐者已成为一个普遍讨论的话题。这种现象涉及多方面的因素和考量,需要我们从多个角度进行分析和理解。女性隐者的出现源于市场的真实需求,反映了用户对高质量服务的持续追求。近年来,随着互联网技术的快速发展,女性隐者相关的产品和服务层出不穷,不仅改变了人们的生活方式,还推动了整个行业的转型升级。通过深入分析,我们可以发现其中蕴含的商业逻辑和发展趋势。

女性隐者的核心价值在于解决用户的实际问题。许多人在日常生活中面临各种挑战,而女性隐者提供了一种高效便捷的解决方案。具体来说,它能够帮助用户节省时间、降低成本、提升体验,这正是女性隐者受到广泛欢迎的根本原因。

女性隐者的潜在价值

女性隐者能够为用户带来多方面的收益。首先,它可以显著提升工作效率,帮助用户在更短的时间内完成更多的任务。其次,女性隐者还能够帮助用户获取更多的信息和资源,拓宽视野,增强竞争力。

从行业发展的角度来看,女性隐者代表了未来的趋势和方向。它能够推动技术创新、促进产业升级、创造新的就业机会。越来越多的企业和个人开始关注女性隐者领域,投入大量资源进行研发和推广。

此外,女性隐者还具有重要的社会意义。它能够促进信息的公平获取,缩小数字鸿沟,让更多人享受到科技发展带来的红利。

如何正确利用女性隐者

正确利用女性隐者需要掌握一定的方法和技巧。首先,用户应该选择正规可靠的平台和服务商,确保获得高质量的产品和服务。其次,要注意保护个人信息安全,避免在不可信的环境中暴露敏感数据。

在实际应用中,建议用户根据自己的具体需求进行选择,不要盲目跟风。同时,要持续学习和更新知识,跟上女性隐者领域的最新发展动态。

总之,女性隐者是一个充满机遇和挑战的领域。通过正确的方法和持续的努力,每个人都能从中获得实实在在的价值和收益。

   女性隐者,强立意点题向(401–500),优化搜索记录管理 - 【哔哩哔哩】_【bilibili】  【唐杰】深夜发文,AI从工具到劳动力只差这一步 赖清德想(与特)朗普对话?【外交】{部回}应 突发!一艘油轮《在阿》联酋附近海(域遭)不明飞弹袭击!美军4日上午将有重大行动,“由特朗普亲自指示”,伊朗:任何干涉都将被视为违反停火 排队2小[时为]吃碗米其林认证的「预制台《式卤》肉饭」,“号称慢卤6小时不如纯K好吃?” 消息《人士》:美方在回应伊朗提{议时}(列出)5个关键条件 【微特稿】英国《将斥》资10亿英镑采[购榴]弹炮
外媒:两架小型飞机在德国上空发生碰撞,两名飞{行员}均返回机场并安全(着陆)

http://rr.ouozr.cn/tshow/565697.htm

「活动」首次登录送73积分

468.21MB
版本V8.3.51
下载女性隐者安装你想要的应用 更方便 更快捷 发现更多
喜欢 22%好评(9977人)
评论 421
【唐杰】深夜发文,AI从工具到劳动力只差这一步截图0 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图1 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图2 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图3 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图4
详细信息
应用介绍
一.chinese中国帅男飞机  【唐杰】深夜发文,AI从工具到劳动力只差这一步 鲁豫黑丝袜
二.久草论坛  杭州一街道疑因退货率太高,(居民)被多个商家“拉黑”无法下单,【当地】:正在处理
三.兽兽门下载  {概率}46.5%!【阿森】纳11天后冲首座欧冠冠军+大号(双冠)王或创3大神迹
四.教室别恋激情  詹姆斯点赞重返骑士动态!第【三次】加盟家(乡球)队?薪资或成关键阻碍
五.两男吮着她的花蒂尿上映时间  “不打官司就无法治病”,黑龙江一高校宿舍起火致学生中毒失声,校方[三次]{停付}治疗费,(建议)让家长走司法程序,受伤学生家属发声
六.三色堂明星合成论坛  70《岁米》雪自曝患ADHD精{力旺}盛从不午睡仍保持状态
七.两根肉棒  “{我们}舰载航空兵什么都不怕!” 飞行员紧急升空《成功》驱(离外)机
八.七大常任常委是哪七个人  设计调整动力优化新(款沃)尔沃XC60谍照{曝光}
九.夫妻频频吵架致妻子患乳腺癌  中国汽{车专}利公开量全球领先新能源[领域](年均)增长率17.1%
十.冰骨魔君  戛纳造型撑不住、上综艺《翻车》,接连两位贵(妇跨)界被嘲

【联系我们】
客服热线:400-5158-5941
加载更多
版本更新
V3.1.77
泼天的富贵!蜜雪「大佬[同款]」紧(急上)线,CEO隔空【回应】

女人被添荫蒂舒服了A片看AK类似软件

猜你喜欢

包含 美女糟蹋视频大全 的应用集
评论
  • 《搜个》应用却弹出电影Windows11这个槽点【终于】要被修复了! 2026-02-22
    怎样让她出水多
  • 【伊朗】总统发了一棵树,意{味深}长 2026-01-09
    silk labo 快播
  • 千万代言费重仓比亚迪,[王力]宏能否{弥补}十年遗憾? 2026-02-20
    艳遇传奇
  • 网红白冰复更,控诉前员工联合他[人侵]吞公司资金、设局陷害,并称不止要坑我几千万,还要让我家破人亡 2026-04-11
    春暖花开有你地址
  • 5月20日凯迪股份(605288)涨停分析:高分红、【多赛】{道驱}动 2025-11-21
    电影禁片上映4天紧急下架
  • 习近《平谈》中【东局】势 2026-02-19
    演讲台模型
  • 广西柳[州市](柳南)《区地》震区域搜救出最后1名被困人员生命体征平稳 2026-03-28
    华夏人寿山东分公司
  • 停{火成}空文?以军四天发射1300枚弹药,黎巴嫩超百万人【流离】失所 2026-04-30
    人與動物牲交
  • 【伊朗】致谢:{特别}[是中]国 2025-12-05
    狗狗爱爱天涯论坛
  • 多名中国男子赴泰国后失联,家(属曾)接《到来》电“报平安”,但全程哽咽 2025-12-02
    1234bb