IT技术博客大学习 共学习 共进步
全部 移动开发 后端 数据库 AI 算法 安全 DevOps 前端 设计 开发者

标签:Agent

共 8 篇相关文章

IT 累计浏览 6

Goal Workflow:目标驱动的研发闭环

Goal Workflow 是由 smallnest 开发的目标驱动研发闭环工具,基于流水线思维将功能开发从想法到上线划分为七个步骤:/prd 生成产品需求文档、/prd-to-spec 转化为技术规格(可选)、/to-issues 拆解为 Issue 卡片、/goal 基于 Issue 实现代码、/review-it 自动审查代码、/note-it 记录设计决策(可选)、/ship-it 提交 PR 并关闭 Issue。每个步骤定义明确的输入、输出和质量标准,步骤间无缝衔接,避免流程断点。与全自动工具如 autoresearch 相比,它在步骤间保留人工控制点,平衡自动化与用户干预,同时通过单 Agent 审查减少 token 消耗。工具基于 Skills 哲学,使用 npx skills 命令安装,支持 Claude Code、Codex、Antigravity CLI 等多种 AI 编码平台。文章详细介绍了安装配置、目录结构和平台兼容性,并对比了不同工具中 /goal 命令的实现差异,强调流水线思维如何提升 AI 辅助研发的可控性和效率。

IT 累计浏览 4

Loop Engineering:从提示 Agent 到设计循环

本文围绕“Loop Engineering”这一新兴概念,系统阐述了AI Agent工作模式从“人提示Agent”到“设计自动提示Agent的循环”的范式转变。其核心在于,工程师的角色从直接与Agent对话、下达指令,转变为设计和维护一套自动化运行系统(Loop),使Agent能够按时间或条件自主执行任务,例如代码修复、CI维护和功能开发。Loop由五个关键组件构成:用于定时触发的Automations、保障并行工作不冲突的Git Worktrees、提供可复用知识的Skills、连接外部工具的Connectors与Plugins、以及实现写-查分离以提升可信度的Sub-agents。此外,持久化的State文件解决了跨运行会话的记忆问题。文章进一步将Loop定位在Harness(运行环境)之上,并指出Dynamic Workflows提供了确定性的编排模式,如扇出聚合、分类执行等,将Loop的概念转化为可执行的脚本。最后,文章梳理了Loop Engineering从ReAct循环、AutoGPT、Ralph Loop到产品化/goal命令及当前编排式Loop的演进历程,强调其根本价值在于将工程师的智力投入从重复性提示提升到构建和优化自动生产系统本身。

IT 累计浏览 142

01 引言:软件工程范式的五十年之变

文章回顾了软件工程自1968年以来的范式演变,从瀑布模型到敏捷、DevOps,指出核心假设“代码由人编写”首次被大语言模型打破。AI Coding Agent的演进分为四层:补全、对话、任务、自主流程,逐步将人类角色从作者转变为指挥者和审查者。Vibe Coding虽降低编程门槛,但易导致代码质量陷阱,需通过Agentic Engineering和结构化方法提升产出。核心主张是从Prompt-Driven转向Skill-Driven,强调持久化、可复用的Skill系统,如Spec-Driven Development和Ralph Loop等方法论。这些变革基于“用结构化知识驾驭非结构化AI能力”的原则,为AI时代软件工程提供新框架,凸显工程素养的关键作用。

IT 累计浏览 116

antigravity-cli

Google在2026年I/O大会上发布Antigravity CLI,正式取代Gemini CLI,整合进Antigravity产品家族。该工具与Antigravity 2.0桌面版共享统一Agent引擎,支持自然语言交互,用户可通过对话指令Agent完成代码编辑、工作流编排等任务。核心特性包括Subagents(子智能体),允许主Agent派生子Agent并行处理后台任务如文档查询、构建验证,并拥有完整工具权限;终端沙箱利用操作系统原生能力(macOS sandbox-exec、Linux nsjail、Windows AppContainer)实现安全隔离,零启动开销;插件系统提供打包命名空间,可部署技能、智能体、规则等组件。安装通过一键脚本跨平台完成,认证支持本地和SSH环境。三大核心斜杠命令:/goal启用深度工作模式,自动执行复杂任务直到目标达成,使用独立模型评判;/schedule设置定时或循环任务,基于Cron调度实现自动化检查和报告;/grill-me用于方案对齐,确保AI输出准确。Antigravity CLI定位终端优先、键盘效率,与桌面版互补共享设置,提供统一AI开发工具链。

IT 累计浏览 203

AI Agent Orchestrator Landscape Report

AI Agent Orchestrator 赛道源于开发者需管理大量并行 AI 编码代理(如 Claude Code、Codex)的需求,旨在提供任务分配、成本控制等协作能力。报告将项目分为三层:L1编排层管理代理生命周期,L2协作层实现任务跟踪,L3公司层处理组织预算与对齐。 当前市场呈现九个项目竞争格局,技术栈以 TypeScript 为主。其中,LobeHub 生态最成熟但使用社区许可证,限制商业衍生;Paperclip 采用 MIT 协议,功能聚焦公司治理与预算,是构建商业产品的首选;Ruflo 虽增长迅速但遭社区质疑代码质量;Multica 架构扎实(Go 后端),支持最多代理类型但限制 SaaS 分发。 技术选型上,快速原型可考虑轻量级的 Agent of Empires;商业 SaaS 推荐 Paperclip;企业内部平台适合 Multica。报告同时指出,该领域面临大厂整合风险与技术债务问题(如部分项目停更或协议限制),且市场高度碎片化,预计将经历整合。核心建议是根据使用场景(商业、内部、原型)和许可证条款进行审慎选择。

IT 累计浏览 71

手搓一个 Agent 驱动的项目 Wiki 生成方案

作者在项目文档生成实践中,发现传统RAG方案如deepwiki在处理确定性结构(如目录、接口列表)与不确定性分析(如架构总结、ER图)时存在局限。其核心思路是:将确定性信息(如行号、Proto文件)明确处理,仅将归纳、推理等任务交由LLM,以实现各取所长。然而,deepwiki的独立页面架构难以满足基于已生成内容进行汇总的需求。 为此,作者转向基于Claude Code的方案。该工具采用工具驱动检索机制,通过Read、grep、LSP等确定性工具链精准定位代码,而非依赖向量化索引。这使生成的Wiki内容更准确可控,并可复用为跨项目Skill。尽管需要多轮调试且自动化程度较低,但其在内容质量、尤其是跨文件关联分析上优势明显。文章最终提出互补策略:项目初期用deepwiki快速搭建框架,成熟阶段则用CC方案精细打磨可控的文档体系。

IT 累计浏览 67

LongCat-Flash:美团发布的高效MoE大模型,支持智能体任务,推理速度达100 token/秒

美团发布LongCat-Flash大模型,总参数量达5600亿,是一款混合专家架构模型。其核心创新在于引入零计算专家机制,可根据上下文动态调整每个token激活的专家数量,实现计算资源的弹性分配,平均激活参数量约270亿。同时,模型采用快捷连接MoE结构,通过跨层设计将密集计算与通信重叠执行,大幅降低了训练和推理延迟。 训练方面,模型通过超参数迁移和模型增长初始化策略提升效率,并采用多阶段训练与数据配比调整,逐步强化代码与推理能力。推理部署上,结合多token预测、分层量化等技术,在H800上实现100 token/秒的生成速度。在智能体任务评测中,LongCat-Flash在终端操作和工具调用等场景表现突出,已全面开源权重与代码,为MoE架构与智能体研究提供重要参考。

IT 累计浏览 75

微博 × MCP:社交媒体新玩法解锁

这篇从作者的个人经历切入,讲的是如何将一个失败的AI产品蜕变为基于MCP协议的实用工具。受Twitter Personality启发,他曾开发微博性格报告,用提示工程分析用户画像,但后来被互动性更强的“评论罗伯特”类账号击败。代码先变为Agent插件,随着MCP协议爆火,最终以mcp-server-weibo形式重生——一个Model Context Protocol服务器,让大模型能直接获取微博数据。 项目提供了7个工具,比如通过search_users搜索用户、get_feeds抓取动态、get_trendings获取热搜,支持uid或关键词操作,并兼容stdio和streamable-http。它能在VS Code、Cursor等客户端使用,方便开发者集成。 作者认为AI更像一面镜子,从多角度观察人类,而MCP协议解锁了社交媒体分析的新玩法。这个复盘不仅展示了技术迁移的韧性,还为读者带来了一个可直接上手的工具,探索大模型与社交数据的结合。