赋能轻量级Agent:瑞芯微重磅发布RK182X SDK 1.0.4版本
2026年6月12日,国内端侧AI芯片领军企业瑞芯微宣布RK182X SDK 1.0.4版本正式上线,其核心目标是为轻量级Agent提供全栈支持,加速端侧AI产品的量产进程。此次升级围绕工具链、Agent能力及模型体系推出三大关键改进,以下为具体亮点。
鉴于传统SoC在端侧运行大模型时面临物理限制,瑞芯微在RK3588之外独立开发了RK182X协处理器。RK182X作为一款内置多核高算力NPU(峰值算力达20 TOPS)的AI推理芯片,可与主处理器协同工作,为现有产品快速增加AI能力,显著缩短研发周期并降低时间成本。客户只需将此协处理器集成到现有产品中,即可满足AI算力的升级需求。

瑞芯微实测数据表明,RK182X在运行Qwen2.5-3B模型时输出速度突破百Token,达到市场对标产品的3倍;在运行Qwen3-VL-2B模型时输出速率接近百Tokens。
根据2026年第一季度财报,瑞芯微依靠RK3588等主力AIoT SoC平台及RK182X协处理器系列,实现营收12.05亿元,同比增长36.22%;净利润3.29亿元,同比增长57.15%;毛利率达43.04%。

财报中说明,尽管终端市场面临存储价格高涨的压力,AIoT市场仍延续增长态势,端侧AI正渗透千行百业并重塑产品体验。瑞芯微于2025年7月正式发布协处理器RK182X系列,9月迅速推出SDK,并在短时间内导入十几个行业、数百家客户,首批客户已进入产品发布及量产阶段,应用于各产品线旗舰产品的导入速度超出预期。
6月12日发布的最新RK182X SDK 1.0.4版本,由以下三大亮点构成:
1、量产级工具链,从开发到运维全闭环
1. 批量烧录+自动化测试:为产线提供一站式解决方案。
2. KV Cache导入导出:通过预计算上下文,加速首包处理。
3. 运维闭环:支持OTA远程升级及设备状态监控。
4. 模型加密:保护企业自研算法IP。
5. LoRA微调:允许基于私有数据微调,无需全量重训。
瑞芯微表示该版本已通过严苛测试,支持7×24小时连续稳定运行。
2、Agent能力大幅跃升
谷歌最新开源模型Gemma4在指令遵循、工具调用等Agent核心能力上显著提升,成为端侧Agent落地的优选基座。瑞芯微自研KV Cache压缩技术实现了上下文长度翻倍,Qwen3-4B最高支持37K token,使Agent能记住更长的对话和任务指令。
3、全模态模型体系,打造端侧AI完整链路
端侧AI不仅运行大模型,还需形成“听—看—想—做”的完整链路:音频入口采用Qwen3 ASR/TTS、VITS等模型,使设备具备听与说的能力;视觉入口整合PaddleOCR、SigLIP、DINOv2、Yolo系列和Depth-Anything等模型,让设备能识别视觉信息;Agent决策层覆盖Qwen全系列、GLM Edge、Gemma4、InternVL3等模型,支持从理解到执行的全过程。模型全景涵盖LLM(0.5B~8B)、VLM、Omni全模态、ViT/CNN等8大类40余款模型。
瑞芯微RK182X SDK 1.0.4版本通过突破传统SoC物理瓶颈、提升Agent决策能力与完善全模态模型体系,显著推动了端侧AI技术的量产落地,其第一季度的营收与利润双增长也印证了市场对端侧AI芯片的强劲需求。