位置:首页  >  详情页
【唐杰】深夜发文,AI从工具到劳动力只差这一步
来源:东北网 编辑:宏峰 2026-05-20 14:52:49

从整体脉络来看,【唐杰】深夜发文,AI从工具到劳动力只差这一步并不是单一信息点,而是由多个细节共同组成。

随着黄仁勋踏上前往特朗普的空军一号,智谱股价暴涨 36.9%,收报 1150 港元,创下历史新高。

放到整体脉络里看,而就在暴涨之前不到 24 小时里,智谱创始人唐杰深夜在 X 上发布了一条推文,大谈了自己对整个 AI 产业的思考。

从细节来看,请注意,英文原文是 "Long-Horizon Tasks",直译过来应该是长视野但是在 AI 语境中,它是指一个任务需要跨越较长时间、较多步骤、较多中间状态才能完成。

进一步说,在唐杰看来,一旦模型能持续规划、试错、判断和交付,它冲击的就不只是程序员效率,而是整套人类执行层。

需要注意的是,长周期任务是什么?

需要注意的是,这本质上是在测试智力但长周期任务需要的不是智力,是执行力。

放到整体脉络里看,唐杰在推文中用黑客作为例子。

换个角度看,这个过程充满试错,因为没有标准答案,只能依赖经验和直觉。

换个角度看,如果 AI 能在这种对抗性、经验化的领域站稳脚跟,那么它对普通程序员、数据分析师、法务助理等职业的冲击只会来得更猛烈。

放到整体脉络里看,唐杰认为,衡量 AI 的方式,正在从看对话、答案,变成看 " 长周期 " 任务完成能力。

需要注意的是,另一个模型可能单次回答不够精彩,但能稳定地推进任务,记住每一步的结果,在遇到障碍时自动换路径。

进一步说,腾讯的姚顺雨曾提出一个概念,今天模型太依赖预训练里的 " 参数化知识 ",真实世界更需要能从当前 Context 里学习并应用的模型。

需要注意的是,一个能熟练调用这些工具的模型,比一个记住了所有 API 文档但不会实际操作的模型有用得多。

进一步说,但在长周期任务里,给定目标后,模型需要自主规划和执行。

需要注意的是,这需要模型具备某种 " 任务感 ",知道自己在做什么,为什么这样做,做到哪一步了。

换个角度看,企业和个人不再满足于 "AI 帮我写了一段代码 ",而是期待 "AI 帮我完成了整个功能模块的开发、测试和部署 "。

从细节来看,长周期任务的概念并不新鲜学术界早就在研究强化学习、任务规划、多步推理。

换个角度看,第一个就是记忆。

放到整体脉络里看,Claude Opus 4.7 支持 1M token 上下文窗口,GLM-5.1 支持 200K token这意味着模型可以在一个会话中记住数十万字的代码、文档、对话历史。

从细节来看,第二个是持续学习。

进一步说,模型不需要在训练时就学会所有知识,它只需要能快速吸收新工具、新 API、新业务规则当更新周期足够短,模型就能跟上现实世界的变化速度。

放到整体脉络里看,唐杰推测,Claude 可能已经实现了基础的自训练能力。

需要注意的是,它开始知道自己的答案是否靠谱,知道什么时候该重试、求证或回滚。

从细节来看,但这条路径也充满风险。

放到整体脉络里看,唐杰的判断是,这些能力通过精巧的工程 "tricks" 实现这意味着进展速度会比学术界预期的快得多,因为工程化的迭代周期远短于学术和技术上的创新周期。

进一步说,智谱的 GLM-5.1 在 SWE-Bench Pro 上达到 58.4%,超过 GPT-5.4 的 57.7% 和 Claude Opus 4.6 的 57.3%,就是这种工程化迭代的结果。

进一步说,作为智谱的创始人兼首席科学家,唐杰发这条 X 显然不只是技术观察,还多了一层战略宣言。

从细节来看,它不像 Kimi 那样靠 C 端爆款产品快速起量,也不像阿里、百度那样有庞大的生态和流量入口。

从细节来看,长周期任务这个方向,无论是国内还是国外,参与的玩家都很少,没有明确的领跑者,大家都在探索阶段。

从细节来看,然而二者在长周期这件事上,都还差点意思。

需要注意的是,虽然在纯模型能力上追赶 GPT 和 Claude 很难,不过在长周期任务这个新方向上,大家都站在同一条起跑线上。

需要注意的是,前者是增强,后者是替代。

放到整体脉络里看,真正被替代的是中间执行层,比如那些负责推进任务和协调资源的岗位在 NPC 里,人只需要设定目标和审核结果。

需要注意的是,智谱 GLM-5.1 的技术白皮书中提到,GLM-5.1 能持续独立作业 8 个小时,单次任务可稳定执行 1200-1700 步操作,无需人工监控与干预。

需要注意的是,长周期任务不是一个通用产品,它需要针对不同行业、不同场景做深度定制。

放到整体脉络里看,不是说把模型卖给企业就完了,智谱还要把模型打包成能直接上手的 agent 工具箱,客户不必从零开发,也能快速搭出自己的长周期任务系统。

进一步说,智谱的开源策略就是在构建这个生态。

放到整体脉络里看,还是会选择更保守的策略?就以唐杰提到的自我进化来说,智谱是会追求自我进化?

进一步说,一方面,GLM-5.1 的训练已经大量使用模型生成的合成数据,这是自我进化的雏形。

从细节来看,这种平衡很难,但可能是最现实的路径。

从细节来看,如果智谱能拿下长周期任务,那么它的业务会进一步增长,市值也会更高。

进一步说,基于对长周期任务的判断,唐杰给出了一个预言,未来我们可能会跨越 APP 的概念,直接进入 LLM OS 时代。

进一步说,然而我想说,这个判断触及了现代计算机的根本逻辑。

放到整体脉络里看,你要是想发邮件,你就打开邮件 APP,点击写邮件按钮,填写收件人、主题、正文,点击发送每一步都是预先设计好的,你只能在设计者规定的路径上操作。

需要注意的是,你告诉系统 " 给张三发一封邮件,告诉他项目进度 ",系统会自己决定用哪个邮件服务、怎么措辞、什么时候发送你不需要知道邮件 APP 在哪里,不需要知道怎么操作,你只需要表达意图,系统负责执行。

从 1 月 8 日上市时的 116.20 港元发行价算起,智谱的股价在短短四个多月内增长了 900%。

换个角度看,整条推文的核心是 " 长周期任务 "。

换个角度看,他认为,2026 年最可能的突破点不在于模型变得更聪明,而在于模型能够持续完成复杂、多步骤的任务。

需要注意的是,以前 AI 替人写几句话,大家还能说它只是工具一旦 AI 能连续几天自己干活、自己判断、自己交付结果,它要替代的就不只是某个岗位了,它可能会彻底替代某一个行业。

进一步说,过去两年,我们评价一个大模型的好坏,主要看它在单次对话中的表现回答是否准确、逻辑是否清晰、语言是否流畅。

需要注意的是,目标明确但路径不确定,需要持续数个小时、数天甚至数周的长期推进。

需要注意的是,他说,漏洞挖掘是典型的长周期任务需要阅读大量代码、理解系统架构、搭建测试环境、构造攻击输入、验证漏洞有效性,最后撰写技术报告。

换个角度看,你不能只读一遍代码就找到漏洞,你要反复去尝试不同的攻击向量,在每次失败后调整思路,在每次成功后验证可靠性。

进一步说,因为这些职业的任务虽然也很复杂,但对抗性更弱,经验依赖度更低,更容易被系统化的流程覆盖。

从细节来看,一个模型可能在单次对话中表现完美,但在需要持续工作 8 小时的任务中频繁出错、丢失上下文、重复无效操作。

放到整体脉络里看,那么后者在长周期任务中的价值,就高于前者。

需要注意的是,当模型真正开始跑任务的时候,它需要查文档、跑代码、测接口、读日志、调参数。

此外,以前的模型过于被动,它得等待人类发出指令后才能执行,而且每发出一次指令,只能执行一步。

进一步说,被动响应只需要理解当前问题,主动推进需要理解整个任务的结构、当前所处的阶段、下一步应该做什么、如果失败了该如何调整。

进一步说,当有了这一切后,AI 就开始进入 " 结果交付 " 阶段。

需要注意的是,这是从助手到承包商的跨越助手需要你告诉它每一步做什么,承包商只需要你告诉它最终要什么结果。

进一步说,唐杰认为,正是因为如下几个关键技术突破,长周期任务在今年变得可以实现。

放到整体脉络里看,百万级上下文窗口和 RAG 技术的成熟,让模型能够在长时间任务中保持对项目背景、历史尝试和用户偏好的记忆。

放到整体脉络里看,它不会因为任务太长而忘记最初的目标,不会重复已经尝试过的失败方案,不会丢失中间步骤的关键信息。

进一步说,虽然真正的持续学习仍然困难,但模型更新周期正在急剧缩短全球领先模型已经做到月度更新,国内模型紧随其后如果明年能做到周更新,事实上就接近了持续学习的效果。

换个角度看,第三个是自我判断、自我进化。

进一步说,模型自己写代码、清洗数据、生成合成数据,然后用这些数据训练自己GPT-5.5 就在用模型生成的代码和测试用例来改进自己的编程能力。

换个角度看,这种能力在长周期任务中至关重要因为没有人会在旁边监督每一步,模型必须自己判断当前方案是否可行,是否需要调整,是否已经达到目标。

换个角度看,我们对于 AI 的价值又是什么?自我进化意味着人类对模型训练过程的控制力在下降当模型开始自己生成训练数据、自己评估训练效果时,我们如何确保它不会偏离人类的价值观?

从细节来看,你只需要在现有架构上做更好的 prompt 工程、更精细的强化学习、更可靠的工具集成。

放到整体脉络里看,智谱:在长周期任务赛道上的战略押注。

从细节来看,智谱在国内大模型阵营中的特点是技术底子扎实,但商业化节奏相对谨慎。

换个角度看,智谱的路线一直是 " 模型能力先行,应用场景跟进 "先把基座模型做到足够强,再通过 API、私有化部署、行业解决方案变现。

换个角度看,OpenAI 的 GPT-5.5,定位就是 " 自主任务执行 ",强调的是 agent 能力和多步骤工作流,Opus 4.7 也是类似。

需要注意的是,两家公司并没有展现出压倒性优势,市场格局也还远未定型。

换个角度看,唐杰进一步提到了 NPC 这个概念他认为长周期能力会推进从 OPC 到 NPC 的转变一人公司的逻辑是 " 人加 AI 工具 ",无人公司的逻辑则是 "AI 系统加人类监督 "。

换个角度看,不过无人公司并不是真的没有人,而是人的定位发生了改变,从执行者变成了目标设定者、资源配置者和责任承担者。

进一步说,落到智谱身上,唐杰的观点预示着智谱接下来的发展方向。

放到整体脉络里看,不过这只是一张成绩单,要真正让企业放心,还得看它换到更多场景后会不会掉链子,遇到没见过的问题时能不能靠自己的手段解决。

进一步说,软件开发需要的是代码理解和测试执行,法律行业需要的是文档检索和合规检查,金融行业需要的是数据分析和风险评估。

换个角度看,长周期任务系统不是智谱一家能做出来的,它需要开发者贡献工具和插件,需要企业客户提供真实场景和反馈,还需要监管机构制定安全和合规标准。

从市值来看,智谱是国产 AI 的中流砥柱,唐杰的每一个判断都会对国内 AI 产生很大的影响。

从 GLM-5.1 来看,智谱在走一条中间路线。

进一步说,可另一方面,智谱强调 " 可解释的、可监管的 " 系统,这意味着它不会完全放弃人类控制。

放到整体脉络里看,长周期任务是企业的核心痛点,它能直接替代人力成本,能直接提高业务效率,企业愿意为此支付更高的价格。

放到整体脉络里看,AI 吞噬世界。

从细节来看,应用按需生成,用户不再管理文件、窗口和按钮,用户只管理任务、权限和结果什么是 LLM OS?

放到整体脉络里看,APP 的本质是把功能固化在界面里,用户通过点击按钮来触发预设的功能。

进一步说,agent 的本质则是把目标交给系统,让系统临时组合工具、数据和界面来达成目标。

换个角度看,如果唐杰说的这个趋势成立,软件的中心将从 " 打开哪个 APP" 变成 " 告诉系统我要什么结果 "这将会颠覆现有的一切。

把前面的信息放在一起看,【唐杰】深夜发文,AI从工具到劳动力只差这一步更值得继续关注的,仍然是后续变化与实际影响。

比比影院的定义与背景

在当今的网络环境中,比比影院已成为一个普遍讨论的话题。这种现象涉及多方面的因素和考量,需要我们从多个角度进行分析和理解。比比影院的出现源于市场的真实需求,反映了用户对高质量服务的持续追求。近年来,随着互联网技术的快速发展,比比影院相关的产品和服务层出不穷,不仅改变了人们的生活方式,还推动了整个行业的转型升级。通过深入分析,我们可以发现其中蕴含的商业逻辑和发展趋势。

比比影院的核心价值在于解决用户的实际问题。许多人在日常生活中面临各种挑战,而比比影院提供了一种高效便捷的解决方案。具体来说,它能够帮助用户节省时间、降低成本、提升体验,这正是比比影院受到广泛欢迎的根本原因。

比比影院的潜在价值

比比影院能够为用户带来多方面的收益。首先,它可以显著提升工作效率,帮助用户在更短的时间内完成更多的任务。其次,比比影院还能够帮助用户获取更多的信息和资源,拓宽视野,增强竞争力。

从行业发展的角度来看,比比影院代表了未来的趋势和方向。它能够推动技术创新、促进产业升级、创造新的就业机会。越来越多的企业和个人开始关注比比影院领域,投入大量资源进行研发和推广。

此外,比比影院还具有重要的社会意义。它能够促进信息的公平获取,缩小数字鸿沟,让更多人享受到科技发展带来的红利。

如何正确利用比比影院

正确利用比比影院需要掌握一定的方法和技巧。首先,用户应该选择正规可靠的平台和服务商,确保获得高质量的产品和服务。其次,要注意保护个人信息安全,避免在不可信的环境中暴露敏感数据。

在实际应用中,建议用户根据自己的具体需求进行选择,不要盲目跟风。同时,要持续学习和更新知识,跟上比比影院领域的最新发展动态。

总之,比比影院是一个充满机遇和挑战的领域。通过正确的方法和持续的努力,每个人都能从中获得实实在在的价值和收益。

   比比影院,信息陷阱密布,一不小心就坠入深渊,热搜操纵舆论走向,背后隐患不容忽视 - 【哔哩哔哩】_【bilibili】  【唐杰】深夜发文,AI从工具到劳动力只差这一步 41+24!超[神文]班!一(战逆)转剧本!西决要变天了? 狂轰50分8板0失误!{广东}天才后卫《杀红》眼:别忘了他曾锁死【过赵】继伟 方程豹豹8豹5{闪充}版上市,售(价分)别41.98万和30.58万 香港34岁男子骗诱15岁混血少女,虐杀后多次奸尸,事后还与妻子外出晚饭!【被判】《终身》监禁 内马尔【将战】世界杯!媒体人集体(开炮):安帅屈服了,他违背自[己原]则
你{相信}吗,今天比任何时候都【更容】易《翻身》

http://rr.ouozr.cn/mshow/6348274.htm

「活动」首次登录送73积分

140.45MB
版本V5.0.31
下载比比影院安装你想要的应用 更方便 更快捷 发现更多
喜欢 77%好评(5443人)
评论 258
【唐杰】深夜发文,AI从工具到劳动力只差这一步截图0 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图1 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图2 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图3 【唐杰】深夜发文,AI从工具到劳动力只差这一步截图4
详细信息
应用介绍
一.P站PROUMB网页版  【唐杰】深夜发文,AI从工具到劳动力只差这一步 宝宝我忍不住了我想要
二.淫声淫色  AI概念持续发酵,周四上市的Cerebras{能否}【成为】资本市场下一(个宠)儿
三.欧美亚洲日本一区  限时售21.19万起智己LS6上汽一亿(台限)定版上市《限量》5000台
四.游戏荼苑  马宁执法[泰山]vs重庆铜梁龙!卡牌大(师坐)镇,{重庆}坏毛病要收敛了
五.4名以色列间谍被绞死  消费者【诉酒】店价格欺诈拒调解后{却被}通知领赔偿,(法院):还在审理中
六.狼群战术  “它们[有工]资有保险,有专门大夫给体检,吃饭定时定量,保证健康”,天津一动物园“【单口】相声”式劝阻游客乱投喂走红
七.大新在线伊人看  [古巴]《能源》部长:古巴柴油和燃料油储备已【完全】耗尽
八.美女和帅哥亲吻  巴菲特痛批“市场变[赌场]”,接《班人》却156亿美元重仓谷歌,AI狂热撕裂美国股市
九.114480高清万达影院  “求职信”涌入政务[平台],呼唤{就业}服务跟进
十.青青草在线视频 免费  零跑汽车《一季》度转亏第二品[牌计]划确认

【联系我们】
客服热线:400-1185-2753
加载更多
版本更新
V1.4.81
20万内最【好的】{运动}SUV!广汽昊铂S600开启[预售]:18.89万起

同志china 18类似软件

猜你喜欢

包含 强开视频 的应用集
评论
  • 春晚“定海神针”周涛为何不(上春)晚了?[本人]:我没失宠 2026-05-11
    农夫导航下载
  • 王大雷真老了!本轮代表[泰山]{踢铜}梁龙出现离奇失误,引发球迷热议 2026-01-16
    人的价值国语
  • 前四个月俄农{产品}对华出口额[大增]50%,创历史新高 2026-04-27
    美学与艺术欣赏
  • 印度新德里一客机起飞时发动机故障起火,6人在《紧急》疏散(中受)伤 2026-05-14
    四虎视频最新视频在线观看
  • 【蔚来】(充电)[站突]破5000座充电桩超28800根 2026-03-08
    医院英语怎么读
  • 伊{朗打}《出一》【张新】牌 2026-04-04
    李国豪电影
  • 科级干部隐瞒婚史与女主播恋爱,以协助理财为名拿女方170万元买【假金】条[交付] 2026-01-27
    浴室边摸边吃奶边做边爱
  • OpenAI与律所合作,准备对《苹果》公司[采取](法律)行动,苹果跌0.9% 2026-04-25
    夜色视频直播间
  • 日右《翼图》穷匕见,出售88式导弹助菲介入(台海)欲封死“第{一岛}链” 2025-11-18
    点我98任务网
  • 揭秘“恋陪”背后的(商业):有{人为}它月消【费万】元 2026-04-12
    精品欧美一区二区三区四区