标签：Transformer

共 2 篇相关文章

IT 累计浏览 309

科技爱好者周刊（第 398 期）：Token 费用难以负担

本期围绕 AI 编程的 Token 成本问题展开讨论。通过 OpenClaw 创始人每月消耗 6030 亿 Token、价值 130 万美元的案例，揭示了放开使用顶级 AI 模型的惊人开销。按此计算，单个程序员年费用可达数千万甚至上亿人民币，即便使用国内便宜模型也需数百万。文章指出，即便是 Uber 和微软等巨头也因费用过高而不得不限制 AI 使用，说明公司几乎必然会设置调用限制，这使得 AI 编程在大型项目中的成本远高于人工。由此得出结论：现阶段 AI 不会大规模替代程序员，除非未来 Token 费用大幅下降。此外，文章还提及了漏洞赏金计划在 AI 时代面临的新挑战。由于大模型能快速生成低质量漏洞报告，项目如 Turso 不得不终止赏金计划，这引发了对传统安全激励机制在 AI 背景下有效性的思考。其他内容包括科技动态（如气温上升导致动物增重、人工蛋壳技术）、多篇推荐文章以及一系列新发布的开发工具和资源，覆盖了从内存市场趋势到哲学思辨的广泛话题。

IT 累计浏览 76

拆解Manus：真正有用的深度报告的生成

传统大模型在执行大规模分析任务时，会因上下文窗口被持续填满而导致信息压缩和质量下降，即“上下文窗口陷阱”。为解决此问题，业界探索出两条主要技术路线。其一以Google Gemini Deep Research为代表，通过升级模型、扩大上下文窗口并强化多步推理能力，适合需要深度综合分析的任务。其二以Manus Wide Research为代表，采用分布式并行架构：将大型任务拆解为多个独立子任务，由数百个具备独立上下文的子Agent并行执行，最后由主Agent汇总。这种方式从结构上规避了单Agent上下文溢出的瓶颈，确保大量独立对象（如数十家公司）分析深度的一致性。其架构借鉴了CodeAct论文思想，结合ReAct执行循环、沙箱隔离环境、有向无环图任务分解以及动态质量检测机制，模拟了人类研究员“规划-检索-分析-迭代”的完整工作流，标志着AI从聊天助手向具备规划、工具使用、迭代验证与综合能力的研究助手演进。