智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】

智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。

猜你喜欢
茶叶金融化:“茶炒不喝”如何炼成?
445
股票单向杠杆:玩转股市,风险与收益并存的双刃剑
2473
美债收益率普遍下跌 10年期美债收益率跌79个基点
8724
黎真主党:若以军全面进攻,真主党将打击以全境
7862
传DA4年内发布
3690
2月国际航空市场恢复加快 旅游板块业绩整体改善
2632
2025年5月5日全国主要批发市场加吉鱼价格行情
4988
上海国泰君安证券资产管理有限公司副总裁吴楠离任
2206
比亚迪增强智能化布局,王传福:未来几年投资1000亿
8349
全面梳理新中国科技发展脉络 《中华人民共和国科学技术史纲》出版
9668
2个月时间不到 高盛今年已两次上调美债收益率预期
百位精英齐聚共启行业盛会 你来了吗2019年蓝鲸新经济峰会
新能源的“新”有时比价格销量重要得多
网传SU7撞2人后起火焚毁,当地警方尚未回应
2025年5月5日甘肃武山县蔬菜产业发展中心价格行情
信保环球控股公布林炜桥已获委任为独立非执行董事
欧洲债市:德国国债随美债扩大跌幅 交易员下调降息押注
房地产开发板块跌023% 深振业A涨43%居首
售价3168元,一碗528元!74岁王石代言燕之屋推出总裁碗燕:号称全球首款男人的燕窝!网友吐槽:不坑穷人
【财经百科】联发科声明 暧昧回应耐人寻味
