智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】

智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。

猜你喜欢
一大波“地王”项目即将上新,有望带动改善住房需求释放
8862
21鑫苑01、H20鑫苑1:发行人拟展期2年兑付
5863
问界M8最新谍照曝光 预计将于年底正式亮相
9041
1月理财产品新发数量环比减少25%,“受伤”之后何时能回稳?
1557
五部门回应 涉及发展改革、财政预算、商务、金融证券等热点问题
7365
玉禾田(300815SZ):预计上半年净利润同比增长000%-1000%
2888
央行缩量续作“麻辣粉”,预计LPR保持不变
2903
腾讯业绩大涨53%!段永平出手
7152
3月4日基金净值:易方达恒固18个月封闭式债券A最新净值10077,涨001%
4734
汉堡开启99元大战,大折扣时代的终局是什么?
678
2个月时间不到 高盛今年已两次上调美债收益率预期
百位精英齐聚共启行业盛会 你来了吗2019年蓝鲸新经济峰会
新能源的“新”有时比价格销量重要得多
网传SU7撞2人后起火焚毁,当地警方尚未回应
2025年5月5日甘肃武山县蔬菜产业发展中心价格行情
信保环球控股公布林炜桥已获委任为独立非执行董事
欧洲债市:德国国债随美债扩大跌幅 交易员下调降息押注
房地产开发板块跌023% 深振业A涨43%居首
售价3168元,一碗528元!74岁王石代言燕之屋推出总裁碗燕:号称全球首款男人的燕窝!网友吐槽:不坑穷人
【财经百科】联发科声明 暧昧回应耐人寻味
