智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】

智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。

猜你喜欢

一大波“地王”项目即将上新,有望带动改善住房需求释放


多氟多(002407)3月1日主力资金净买入299927万元


史上罕见的双引擎赛车 阿尔法罗密欧Bimotore


全面梳理新中国科技发展脉络 《中华人民共和国科学技术史纲》出版


京东2023消费观察:品类结构变化 消费意愿不减


贵丰配资交易端,安全稳定,下载即享高收益


宝发控股(08532HK)将于7月31日举行董事会会议以审批全年业绩


仁度生物RNA检测新产品获批上市 将助力2030年丙肝消除计划


我国又一特大房地产企业暴雷


24人被查,24人被处分……


信保环球控股公布林炜桥已获委任为独立非执行董事


欧洲债市:德国国债随美债扩大跌幅 交易员下调降息押注


房地产开发板块跌023% 深振业A涨43%居首


售价3168元,一碗528元!74岁王石代言燕之屋推出总裁碗燕:号称全球首款男人的燕窝!网友吐槽:不坑穷人


【财经百科】联发科声明 暧昧回应耐人寻味


中国资产爆发!多只中概股大涨,港股猛拉!


2025年5月5日全国主要批发市场加吉鱼价格行情


一大波“地王”项目即将上新,有望带动改善住房需求释放


浦发银行发行首单人工智能数智化主题金融债券


从珠三角到上海,晚清团练如何影响中国近代史进程?
