您的位置:首页 → AMD、高通宣布旗下硬件支持 OpenAI gpt-oss 开放推理模型

今日消息,OpenAI正式发布了两款GPT-OSS系列开放推理模型:较小规模的gpt-oss-可在配备B内存的边缘设备上运行;而参数更多的gpt-oss-则能在单个B GPU高效运行。

两家公司宣布支持gPT-OSS系列模型,AMD的锐龙AI Max+理器和Radeon RX 卡分别支持gPT-OSS-、gPT-OSS-,高通旗舰骁龙平台也支持该系列。

AMD宣布锐龙AI Max+全球首款能运行gpt-oss-的消费级AI PC处理器:采用GGML框架转换的MXFP式,约需B显存;“Strix Halo”平台在B统一内存下,可将B分配给GPU,完美满足需求。

锐龙 AI Max+ 395 在 gpt-oss-120b 上有 30 Token / s 的输出速率,同时支持该模型的 MCP 模型上下文协议实现。

而 Radeon RX 9070 16GB 显卡则能在 gpt-oss-20b 上实现出色的首 Token 输出时间 (TTFT) 和每秒 Token 输出数量表现。

高通宣布,经过早期测试,gpt-oss-能在终端侧展现出卓越的思维链推理能力。开发者可通过Hugging Face和Ollama等热门平台在搭载骁龙芯片的设备上访问这一模型,并充分释放其潜力。

  • 标签: