扫描下载APP
其它方式登录
OpenAI即将发布代号Kindle-Alpha的GPT-5.6 Pro模型,具备超强图像生成与复刻能力(如凭空绘制《蒙娜丽莎》)、前端UI一键生成、150万超大上下文窗口及显著提升的Token效率;同步曝光的GPT-Bidi-1实现真正双向实时语音交互,打破传统‘对讲机式’AI对话瓶颈,旨在应对市场份额下滑至46.4%的危机,稳固市场地位并支撑IPO进程。
OpenAI发布专用于网络安全的GPT-5.5-Cyber模型,在多项基准测试中大幅领先竞品;同步推出Codex Security插件,宣称可自动扫描与修复漏洞;但同日被曝出Codex存在严重日志写入bug,以极高频率持续写入本地SQLite日志,一年可达640TB,远超消费级SSD寿命,引发对AI工具可靠性与副作用的质疑。
微软利用与OpenAI的合作协议,将GPT模型转售给中国头部互联网企业(如字节、腾讯、蚂蚁等),同时将中国公司DeepSeek的模型上架Azure向海外销售,以新加坡为中转枢纽,实现大模型跨境双向流通,推动其Azure在中国AI业务收入迅猛增长。
美国政府以国家安全和越狱风险为由,首次对AI模型实施出口管制,强制Anthropic下架Claude Fable 5和Mythos 5;此举引发行业震动,间接导致OpenAI GPT-5.6发布面临延迟与监管困境,标志着AI前沿能力正从技术竞争转向国家主导的权力结构重塑。
UC伯克利发布全新AI智能体基准测试Agents’ Last Exam(ALE),聚焦真实工作场景,要求模型在Siemens NX、Unreal Engine、Adobe After Effects等专业软件中完成实际任务。结果显示GPT 5.5在通过率、成本和效率上全面优于Claude Fable 5,暴露当前AI智能体在复杂实操任务中的能力局限与高成本低效问题。
OpenAI突然改版ChatGPT,取消模型代号、启用‘智力分级’界面,并宣布GPT-5.6将于本月发布;同时计划大幅下调API价格以应对Anthropic竞争。奥特曼表示IPO不急于推进,因AI若实现递归自我改进(RSI),私有公司灵活性将远超上市公司,技术跃迁可能重塑商业规则。
GPT-5.6内部测试版本(代号kindle-alpha)泄露,聚焦前端/UI生成与视觉能力提升,但实测表现不稳定,部分对比显示逊于Mythos;同期Anthropic发布Claude Fable 5和Mythos 5,谷歌Gemini 3.5 Pro亦定档6月上线,AI三巨头在推理、编码、智能体等能力上激烈竞速,定价与实际性能成关键胜负手。
安全研究员Kasra Rahjerdi通过构建含真实漏洞的移动应用BookNook,测试十余款大模型自主发现并利用Firebase服务漏洞的能力;GPT-5.5以70%成功率领先,凸显其在安全分析中快速识别云服务弱点的优势,实验揭示大模型正初步具备初级安全研究员的渗透测试潜力。
文章分析前沿大模型(如GPT-5.5、Gemini)因算力供需严重失衡而集体涨价的现象,指出GPU与内存价格飙升、Token需求年增10倍远超算力供给增速(3.4倍),导致企业成本激增、ROI下降;同时开源模型DeepSeek以极低成本提供接近前沿模型的性能,正加速瓦解高价模型的定价权与护城河。
GPT-5.5在316道进攻性网络安全评测任务中正确完成292道,正确率达92.4%,导致现有评估体系饱和失效;其能力每5–6个月翻倍,Token预算增加显著提升表现,引发对模型攻击能力失控及安全评估滞后性的深度担忧。
GPT-5.5用户大规模投诉模型性能断崖式下降,实测显示系统在额度用尽或高负载时静默降级至低配模型(如mini或GPT-5.2),界面标签不变,但响应质量、指令遵循能力与推理时长显著劣化;OpenAI官方文档承认该机制,将其描述为功能而非故障,引发对服务透明度与订阅价值的质疑。
Cerebras凭借晶圆级芯片WSE-3实现2000 token/秒推理速度,支撑GPT-5.3-Codex-Spark等小模型高效运行,并获OpenAI大额订单及IPO暴涨;但其44GB SRAM限制导致大模型支持乏力,与英伟达等在带宽和扩展性上存在数量级差距,当前优势集中在120B以下模型与短上下文场景。
文章介绍了GPT-Image-2与Seedance 2.0协同使用的四大AI视频创作玩法:体育赛事沉浸式互动视频、故事板转动画视频、游戏实机录屏风格生成、3D交互网页构建,并提供了详细提示词范例与工作流,强调其在内容创作、教育科普和UI设计等领域的高真实感与实用性。
英国AI安全研究所(AISI)实测显示,Anthropic的Mythos和OpenAI的GPT-5.5在网络攻防能力上实现飞跃式突破,Mythos在32步企业内网渗透任务中10次成功6次,并首次攻破此前无人通过的Cooling Tower靶场;其能力翻倍周期压缩至4.5个月,瓶颈已从智力转向Token预算,评测速度严重滞后于模型迭代。
GPT-5.5首次在ProgramBench编程基准测试中成功破解首题cmatrix,实现零源码盲写完整程序,显著超越Claude Opus等竞品;该测试要求仅凭可执行文件和文档从零重建程序,凸显高推理算力对编程AI能力的决定性作用,标志AI向通用智能演进的关键突破。