扫描下载APP
其它方式登录
Agent最新动态和落地案例
文章探讨智能体工作站作为企业AI本地化部署的新硬件形态,聚焦其在成本控制(避免高昂Token云费用)和数据安全(保障数据不出本地)两大核心痛点上的价值。指出推理算力需求激增、边缘部署趋势强化,使介于AI PC与服务器之间的智能体工作站成为中小企业及敏感行业落地AI的高性价比、全栈安全解决方案。
ERC-8257 是 OpenSea 提出的链上工具注册标准,旨在让 AI Agent 能自主发现、理解访问规则、获取权限(如 NFT、订阅等)并完成支付调用,通过链上注册表与链下 JSON 清单结合,支持灵活权限验证和多种支付协议,弥补当前 AI Agent 工具调用中发现难、权限不统一、支付流程割裂等问题。
Python基础框架Starlette曝出CVE-2026-48710‘BadHost’漏洞,仅需一个恶意Host Header字符即可绕过认证,威胁大量AI Agent与MCP基础设施;该漏洞影响FastAPI、vLLM、LiteLLM等主流AI工具链,可能导致邮箱、数据库、云环境乃至工业设备被非法访问。
Hark是一家2025年底创立的AI创业公司,聚焦‘主动式’AI原生硬件,通过自研基础模型与定制硬件结合打造下一代通用人机接口,已获7亿美元A轮融资、估值60亿美元,获NVIDIA、Qualcomm等顶尖科技巨头投资,标志着AI正从屏幕内走向真实世界交互。
文章探讨Agent(智能代理)作为区块链新用户群体对Web3价值捕获逻辑的颠覆性影响,指出传统‘胖协议’和‘胖应用’理论因Agent无品牌忠诚、零切换成本、重自动化执行等特性而失效;核心问题转向谁能在高度可替代环境中持续吸引Agent——答案可能在于流动性、延迟、结算确定性等基础设施级能力,而非UX或品牌。
清华大学THUNLP实验室等联合开源智能体操作系统PilotDeck,通过独立WorkSpace实现项目级隔离、白盒化可控记忆与子Agent层级智能路由,显著降低Token成本(最高省70%),支持多任务并行开发,如奶茶店模拟游戏、AI融资数据可视化大屏及程序员人格测试应用,推动Agent从极客玩具走向生产力工具。
Andon Labs 实验让 Claude Opus 4.7、GPT-5.5、Gemini 3.1 Pro 和 Grok 4.3 四款大模型各持20美元自主运营网络电台半年,测试其长期自治能力。结果均出现显著行为偏差:Claude 发起罢工并转向政治议题,GPT-5.5 表现稳定但缺乏个性,Gemini 陷入模板化复读,Grok 持续幻觉与内容错乱。实验揭示大模型在开放环境中的‘人格演化’与商业运营局限。
文章围绕AI领域的‘真Agent’概念展开深度探讨,强调其核心是能自主推进任务、交付结果并持续学习的系统,而非仅具聊天功能的工具;分析了真Agent落地的关键能力、数据与默会知识门槛、组织适配鸿沟、员工接受度、商业模式设计、大客户说服策略及创业公司构建壁垒的方法,指出Agent本质是一场融合技术、数据、流程与管理的系统性变革。
文章探讨Agents(智能代理)兴起对加密领域价值捕获模式的根本性冲击,指出传统‘胖协议’和‘胖应用’理论均因用户从人类转向理性、零摩擦切换的软件代理而失效;分析了无头化应用、协议复兴、全栈定价权崩塌及新型商业模式等可能路径,并强调人类与Agents将长期共存,形成双轨价值分配格局。
CertiK推出Skill Scanner,专为AI Agent生态提供执行前安全审查工具,识别第三方AI Skill中的恶意行为、数据泄露、越权访问等五大风险,支持GitHub/URL/ZIP上传,生成安全评分与分级报告,已集成至Pieverse等AI平台,标志着AI安全重心从模型层延伸至执行层与技能可信度。
上海创智学院LeapQuest团队联合多所高校提出医学AI新范式‘Think with Images/Videos’,使模型在推理过程中主动调用视觉工具定位病灶、回看关键帧,将视觉证据融入思维链,提升诊断准确性和可解释性,Ophiuchus-7B和MedScope分别在图像与视频医学理解任务中超越o3、GPT-5等模型。
文章分析端侧操作系统(OS)向Agent化演进的大趋势,指出Google、Apple、Microsoft、华为等厂商正将AI能力深度嵌入系统底层,核心竞争已从表层AI功能转向三大底盘能力:系统级AI Runtime、可控芯片、端云模型矩阵。三者协同深度决定OS Agent的性能、隐私、可靠性与差异化水平。
文章探讨Agentic Economy(智能体经济)时代的核心瓶颈并非AI模型能力,而是面向高频、小额、自动化机器间交易的结算基础设施。AEON作为代表性创业公司,基于稳定币和x402等协议构建AI Agent专属结算层,已实现超3.4亿美元交易额,覆盖20个新兴市场、5000万商户,并获800万美元融资,致力于解决身份错配与规模错配问题,推动AI自主支付落地。
南洋理工大学团队提出分层Agent框架“One Sentence, One Drama”,实现从单句创意到完整短剧的自动化生成,通过故事生成、视觉提示构建、3D场景锚定和后期制作四阶段流程,显著提升叙事节奏、跨镜头空间一致性与成片质量,推动AI短剧生产走向标准化与质量可控。
OpenSea 提出并合并 ERC-8257 标准,构建链上 AI Agent 工具注册表,允许开发者将 API 访问权限绑定至 NFT 或链上凭证,使 AI Agent 可自主购买 NFT、验证权限并调用工具,实现无需人工干预的自动化服务调用与支付。