扫描下载APP
其它方式登录
文章聚焦AI大模型领域重大动态:DeepSeek首次启动超百亿美元融资,Sam Altman个人投资引发OpenAI治理争议,Qwen3.6-35B本地运行效果媲美Claude;同时涵盖芯片、人形机器人、地缘政治等多领域事件,但AI进展构成核心主线。
Anthropic通过实验验证‘弱监督强模型’可行性:用开源Qwen小模型(0.5B)监督大模型(4B),并部署9个Claude驱动的AI研究员自动迭代,将性能差距恢复率(PGR)从0.23提升至0.97,证明人类或可通过自动化方法监督未来超级AI,但泛化能力与现实对齐仍有局限。
中国开源大模型(如Qwen、Kimi K2.5、GLM系列)凭借高性价比和优异性能,被硅谷多家AI公司及科技巨头广泛采用,Cursor、Cognition、Meta、Shopify、爱彼迎等均基于其进行套壳、蒸馏或后训练,标志着全球开源AI主导权正向中国转移。
文章聚焦AI与加密货币交叉领域中的'AI Token中转站'赛道,分析其作为API聚合转发层的商业模式,涵盖低价接入海外AI服务、国产模型反向出海、加密货币支付等三大方向,并揭示资金、资源、合规三重现实门槛,强调该赛道依赖真实调用量而非Token炒作。
苹果团队提出“简单自蒸馏”(SSD)方法,通过高温采样与截断从大模型自身生成数据并直接用于监督微调,无需强化学习、教师模型或代码执行验证,在Qwen和Llama系列多个模型上显著提升代码生成能力,尤其在高难度任务中pass@1提升达30.4%,核心机制是重塑模型token概率分布以兼顾精度与探索。
文章介绍MyToken整理的OpenClaw真实世界代理任务基准测试,聚焦AI模型在23类实际任务中的成功率表现,采用自动化检查、LLM裁判和混合评分三种方式,公开透明可复现,并发布截至2026年4月7日的Top 10大模型成功率排行,其中Claude Opus 4.6以93.3%最高成功率居首。
Ollama发布0.19预览版,集成苹果MLX机器学习框架,显著提升Mac本地大模型推理性能:预填阶段提速1.6倍、生成阶段速度翻倍,M5芯片机型受益最明显;优化统一内存调度,支持长上下文流畅交互;首发适配阿里Qwen 3.5模型,推动本地AI向毫秒级响应演进。
阿里AI核心人物林俊旸突然卸任千问(Qwen)技术负责人,引发团队骨干接连离职;事件源于阿里通义实验室架构调整、技术路线分歧及开源理想与商业化目标冲突,标志阿里大模型战略从技术引领转向商业落地。
阿里巴巴Qwen深度研究新增一键生成网页和播客功能,测试中Qwen与Gemini在准确性上并列最优,Qwen在研究深度和网页输出上领先,Gemini在多媒体质量上占优。