扫描下载APP
其它方式登录
文章深入探讨AI领域中'Skill'(技能)技术的本质、能力边界与认知局限,指出Skill可高效蒸馏陈述性知识和程序性规则(L1层),对风格化表达(L1.5)效果有限,但无法编码专家级隐性判断力(L2层的Utility)。通过多组实证研究揭示其在医疗等领域提升显著,在软件工程等高激活领域增益微弱,甚至有害,并指出反蒸馏工具的存在印证了语言表达的精度天花板。
斯坦福、伯克利与英伟达联合提出LLM-as-a-Verifier验证框架,通过提升评分粒度、重复验证和评估标准分解,解决传统LLM-as-a-Judge在长时序任务中评分粗糙、平局率高(27%)的问题,在Terminal-Bench和SWE-Bench Verified等AI编程基准上取得SOTA性能,显著提升Agent准确率与稳定性。
a16z创始人Marc Andreessen在播客中系统阐述AI发展本质:非突发奇点,而是80年技术积累后的实用化拐点;强调agent架构(LLM+shell+filesystem等)正引发比chatbot更深层的软件范式变革;指出交互方式将转向agent-first,人机关系、编程范式、基础设施瓶颈(GPU/CPU/memory)、开源与边缘推理价值,以及安全、身份、支付、制度阻力等现实挑战共同构成AI落地的关键图景。
文章探讨AI驱动工具与AI兼容工具的本质区别:前者将大模型强行嵌入为人设计的传统架构(如Notion、Google Docs),导致高摩擦、低协同;后者从底层重构数据模型与API,以LLM为先,实现无感协调、语义检索与自动知识管理,解决代理规模化下的文档爆炸与检索失效问题。
文章聚焦AI从语言大模型(LLM)向智能体(Agent)演进过程中的范式跃迁,指出APEX-Agents基准测试揭示了当前智能体在真实任务场景中表现低迷、稳定性差、成本畸高及数据饥渴等核心瓶颈,强调评测标准需从静态智力转向动态生产力,AGI远未成熟。
维基百科于3月26日通过投票实施新政策,明确禁止使用大语言模型(LLM)生成或重写文章内容,仅允许其作为辅助工具提供经人工审阅的编辑建议,旨在防范AI幻觉导致的错误信息,维护知识准确性与人类编辑主权。
京东加速AI全栈布局,开源JoyAI-LLM Flash大模型,推出‘龙虾’智能体并实现调用量激增455%;数字人技术覆盖7万商家、带动百亿GMV;具身智能项目JoyInside联合近百品牌,计划两年内建成全球最大的真实场景视频数据库,构建覆盖云、端、物理世界的AI闭环。
Unsloth AI 推出开源无代码本地可视化工具 Unsloth Studio,显著提升大语言模型微调效率:训练速度翻倍、显存节省70%,支持在单块消费级显卡(如RTX 4090/5090)上微调8B至70B参数模型,并集成数据处理、强化学习(GRPO)、一键导出部署等功能。
文章分析AI发展三阶段跃迁:从ChatGPT的可用性、o1模型的可靠性,到2025年底Agent(Opus 4.5/GPT-5.2-Codex)驱动的任务自主执行。作者指出AI正从辅助工具升级为执行基础设施,算力需求结构性上升,资本开支反映真实需求而非投机泡沫,核心驱动力在于agent harness带来的范式变革与企业级生产力重构。
文章聚焦AI Agent(以OpenClaw为代表)因被授予过高系统权限而引发的严重安全风险,揭示API盗刷、上下文溢出、技能包投毒、零点击接管、Node.js滥用等五类高危场景,并提出‘大脑与执行层物理隔离’的核心防御原则,推荐LLM Guard、Microsoft Presidio等安全工具及神鱼、余弦等实践者提出的规则体系。
文章面向加密行业从业者,系统梳理AI领域高频基础与进阶术语,涵盖LLM、AI Agent、多模态、Prompt、生成式AI、Transformer、RAG、幻觉、微调等30个核心概念,旨在帮助读者快速掌握AI技术语言体系,提升在AI相关活动和实践中的理解与沟通能力。
OpenAI计划为免费用户引入广告,被视为解决AI消费端货币化难题的关键路径。文章指出AI订阅转化率仅5-10%,多数用户用于低价值个人任务,难以支撑大规模付费;广告可助力触达十亿级用户,是互联网服务普惠扩展的历史性模式。文中还分析了基于意图、上下文、联盟商业等七类AI原生广告与货币化模型。
斯坦福毕业生Alex Atallah曾创办全球最大NFT平台OpenSea,后在泡沫破裂前退出。2023年他创立OpenRouter,打造AI大模型API聚合平台,支持300多个模型的统一接入与切换,并基于海量使用数据构建权威LLM排行榜。公司7个月增长10倍,获a16z、红杉等投资,估值达5亿美元,成为AI开发基础设施的重要玩家。
第三次浏览器战争正在展开,AI和大型语言模型(LLM)的崛起正在重塑浏览器的角色与交互方式。传统浏览器从信息展示工具转变为AI代理的任务调用平台,未来的竞争焦点将从用户点击转向AI调用。新兴项目如Browser Use、Perplexity等正尝试通过语义化页面结构和深度嵌入AI功能来重构浏览器架构。创业者需关注接口标准化、身份信任机制及任务链优化,以适配AI时代的调用需求,抢占新一代流量入口。