智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】

智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。

猜你喜欢
腾讯音乐娱乐集团与环球音乐集团续签多年期战略协议
925
雍正短命并非因勤政而是荒淫?朝鲜使臣:皇帝天天和美女厮
393
下调估值应对市场压力!金茂首单消费基础设施REITs闯关倒计时
6730
"欧洲将产生第一个黑人领导人"
6729
北交所两融余额1177亿元 较上一日减少199257万元
2860
这种传染病您了解多少?
4375
股票配资:撬动财富的杠杆,亦是风险的深渊?
8128
卓胜微:4月30日获融资买入463609万元,占当日流入资金比例为2399%
977
分红新势力崭露头角
9793
图解古井贡B中报:第二季度单季净利润同比增2457%
882
2个月时间不到 高盛今年已两次上调美债收益率预期
百位精英齐聚共启行业盛会 你来了吗2019年蓝鲸新经济峰会
新能源的“新”有时比价格销量重要得多
网传SU7撞2人后起火焚毁,当地警方尚未回应
2025年5月5日甘肃武山县蔬菜产业发展中心价格行情
信保环球控股公布林炜桥已获委任为独立非执行董事
欧洲债市:德国国债随美债扩大跌幅 交易员下调降息押注
房地产开发板块跌023% 深振业A涨43%居首
售价3168元,一碗528元!74岁王石代言燕之屋推出总裁碗燕:号称全球首款男人的燕窝!网友吐槽:不坑穷人
【财经百科】联发科声明 暧昧回应耐人寻味
