炒股加杠杆平台 无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解
发布日期:2025-01-09 20:46    点击次数:123

炒股加杠杆平台 无问芯穹开源全球首款端侧全模态理解模型 Megrez-3B-Omni,支持图像、音频、文本理解

  IT之家 12 月 16 日消息,无问芯穹今日宣布,开源无问芯穹端侧解决方案中的全模态理解小模型 Megrez-3B-Omni 和它的纯语言模型版本 Megrez-3B-Instruct。

  官方表示,Megrez-3B-Omni 是一个为端而生的全模态理解模型,同时具备图片、音频、文本三种模态数据的处理能力:

  在图像理解方面,Megrez-3B-Omni 是目前 OpenCompass、MME、MMMU、OCRBench 等多个主流测试集上精度最高的图像理解模型之一。

  在文本理解方面,Megrez-3B-Omni 在 C-EVAL、MMLU / MMLU Pro、AlignBench 等多个权威测试集上取得端上模型最优精度。

综合市场分析来看,预计年内存在一次降准可能,以对冲政府债供给带来的流动性收紧。2025年,货币政策的支持力度可能进一步加大。

为了缓释资产端定价下行压力,甚至有民营银行年内发布了5次降息公告,驱动负债端成本改善,助力息差保卫战。

  在语音理解方面,Megrez-3B-Omni 支持中文和英文的语音输入,还能够处理复杂的多轮对话场景,也能支持对输入图片或文字的语音提问,实现不同模态间的自由切换。

  官方宣称,与上一代及其他端侧大语言模型相比,单模态版本的 Megrez-3B-Instruct 在推理速度上取得了显著提升,最大推理速度可以领先同精度模型 300%。

炒股加杠杆平台