IT技术博客大学习 共学习 共进步

标签:Transformer

共 2 篇相关文章

IT 累计浏览 16

科技爱好者周刊(第 398 期):Token 费用难以负担

本期围绕 AI 编程的 Token 成本问题展开讨论。通过 OpenClaw 创始人每月消耗 6030 亿 Token、价值 130 万美元的案例,揭示了放开使用顶级 AI 模型的惊人开销。按此计算,单个程序员年费用可达数千万甚至上亿人民币,即便使用国内便宜模型也需数百万。文章指出,即便是 Uber 和微软等巨头也因费用过高而不得不限制 AI 使用,说明公司几乎必然会设置调用限制,这使得 AI 编程在大型项目中的成本远高于人工。由此得出结论:现阶段 AI 不会大规模替代程序员,除非未来 Token 费用大幅下降。 此外,文章还提及了漏洞赏金计划在 AI 时代面临的新挑战。由于大模型能快速生成低质量漏洞报告,项目如 Turso 不得不终止赏金计划,这引发了对传统安全激励机制在 AI 背景下有效性的思考。其他内容包括科技动态(如气温上升导致动物增重、人工蛋壳技术)、多篇推荐文章以及一系列新发布的开发工具和资源,覆盖了从内存市场趋势到哲学思辨的广泛话题。

IT 累计浏览 2

拆解Manus:真正有用的深度报告的生成

传统大模型在执行大规模分析任务时,会因上下文窗口被持续填满而导致信息压缩和质量下降,即“上下文窗口陷阱”。为解决此问题,业界探索出两条主要技术路线。其一以Google Gemini Deep Research为代表,通过升级模型、扩大上下文窗口并强化多步推理能力,适合需要深度综合分析的任务。其二以Manus Wide Research为代表,采用分布式并行架构:将大型任务拆解为多个独立子任务,由数百个具备独立上下文的子Agent并行执行,最后由主Agent汇总。这种方式从结构上规避了单Agent上下文溢出的瓶颈,确保大量独立对象(如数十家公司)分析深度的一致性。其架构借鉴了CodeAct论文思想,结合ReAct执行循环、沙箱隔离环境、有向无环图任务分解以及动态质量检测机制,模拟了人类研究员“规划-检索-分析-迭代”的完整工作流,标志着AI从聊天助手向具备规划、工具使用、迭代验证与综合能力的研究助手演进。