赋能轻量级Agent：瑞芯微重磅发布RK182X SDK 1.0.4版本

时间：2026-06-30 08:39:41 来源：互联网

2026年6月12日，国内端侧AI芯片领军企业瑞芯微宣布RK182X SDK 1.0.4版本正式上线，其核心目标是为轻量级Agent提供全栈支持，加速端侧AI产品的量产进程。此次升级围绕工具链、Agent能力及模型体系推出三大关键改进，以下为具体亮点。

鉴于传统SoC在端侧运行大模型时面临物理限制，瑞芯微在RK3588之外独立开发了RK182X协处理器。RK182X作为一款内置多核高算力NPU（峰值算力达20 TOPS）的AI推理芯片，可与主处理器协同工作，为现有产品快速增加AI能力，显著缩短研发周期并降低时间成本。客户只需将此协处理器集成到现有产品中，即可满足AI算力的升级需求。

瑞芯微实测数据表明，RK182X在运行Qwen2.5-3B模型时输出速度突破百Token，达到市场对标产品的3倍；在运行Qwen3-VL-2B模型时输出速率接近百Tokens。

根据2026年第一季度财报，瑞芯微依靠RK3588等主力AIoT SoC平台及RK182X协处理器系列，实现营收12.05亿元，同比增长36.22%；净利润3.29亿元，同比增长57.15%；毛利率达43.04%。

财报中说明，尽管终端市场面临存储价格高涨的压力，AIoT市场仍延续增长态势，端侧AI正渗透千行百业并重塑产品体验。瑞芯微于2025年7月正式发布协处理器RK182X系列，9月迅速推出SDK，并在短时间内导入十几个行业、数百家客户，首批客户已进入产品发布及量产阶段，应用于各产品线旗舰产品的导入速度超出预期。

6月12日发布的最新RK182X SDK 1.0.4版本，由以下三大亮点构成：

1、量产级工具链，从开发到运维全闭环

1. 批量烧录+自动化测试：为产线提供一站式解决方案。

2. KV Cache导入导出：通过预计算上下文，加速首包处理。

3. 运维闭环：支持OTA远程升级及设备状态监控。

4. 模型加密：保护企业自研算法IP。

5. LoRA微调：允许基于私有数据微调，无需全量重训。

瑞芯微表示该版本已通过严苛测试，支持7×24小时连续稳定运行。

2、Agent能力大幅跃升

谷歌最新开源模型Gemma4在指令遵循、工具调用等Agent核心能力上显著提升，成为端侧Agent落地的优选基座。瑞芯微自研KV Cache压缩技术实现了上下文长度翻倍，Qwen3-4B最高支持37K token，使Agent能记住更长的对话和任务指令。

3、全模态模型体系，打造端侧AI完整链路

端侧AI不仅运行大模型，还需形成“听—看—想—做”的完整链路：音频入口采用Qwen3 ASR/TTS、VITS等模型，使设备具备听与说的能力；视觉入口整合PaddleOCR、SigLIP、DINOv2、Yolo系列和Depth-Anything等模型，让设备能识别视觉信息；Agent决策层覆盖Qwen全系列、GLM Edge、Gemma4、InternVL3等模型，支持从理解到执行的全过程。模型全景涵盖LLM（0.5B~8B）、VLM、Omni全模态、ViT/CNN等8大类40余款模型。

瑞芯微RK182X SDK 1.0.4版本通过突破传统SoC物理瓶颈、提升Agent决策能力与完善全模态模型体系，显著推动了端侧AI技术的量产落地，其第一季度的营收与利润双增长也印证了市场对端侧AI芯片的强劲需求。

上一篇：AI时代的系统设计模式探讨——从“领域描述”到“本体” 下一篇：1688商家版登录入口-1688商家后台网页版登录