智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】

智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。

猜你喜欢

吸引力法则,读完《秘密》,总结了15个精华


日本政坛面临权力交接,岸田文雄却平地一声雷,宣布不参加9月的自民党总


埃斯顿(002747SZ)拟转让埃斯顿医疗10%股权 提高公司资产运营效率


韩国2023年婚姻登记数较10年前减少40% 新生儿数8年降幅473%


鼎石资本(00804HK)中期净亏损约80万港元


诸葛科技关荣雪:关于广州拟出台全国首个城中村改造条例的快评


打造“精灵耳”致双目失明、“高颅顶”致大片脱发……别让“微整”变“危整


广府庙会|欢笑不断!喜剧大师詹Sir惊喜亮相广府庙会


红海危机持续发酵 著名咨询公司警告:供应链受损程度已显著超过疫情早期


原油保持强势上攻姿态


星巴克中国的韧劲,比想象的更强


卓胜微:4月30日获融资买入463609万元,占当日流入资金比例为2399%


邦达亚洲: 中东紧张局势升温避险情绪 黄金早盘上行


太原迎泽公园:一座城市的跨世代休闲图鉴_姑娘_运动_年轻人


交易之道:等待、研究与精准执行的艺术


喜临门获得外观设计专利授权:“抱枕(卡致墨)”


期债中期上行基调未改


中国的每一次电影节都那么漂亮,票房却那么惨淡他们在搞神马_烂片_观众_水平


人民银行北京市分行、北京证监局:将常态化推进股票回购增持贷款银企对接工作


鲍威尔联手美联储制造美元血案!1月31日各投行美元、欧元、英镑、日元最新交易策略汇总
