开始扎堆了啊,字节跳动12小时前刚发了个新模型——BAGEL-7B-MoT,给大家带来实测!

这是个混合专家多模态模型,支持视觉理解,文本到图像生成,图像编辑,并且思考模式可以选择开启。官方说要比 Qwen2.5-VL 和 InternVL-2.5 表现好。这个模型本身是基于 Qwen2.5-7B-Instruct 和 siglip-so400m-14-98 ​​​https://mapp.api.weibo.cn/fx/6a64db4262d24a225e5441c7f6d77cb7.html
 
 
Back to Top