智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】

智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。

猜你喜欢

铁建重工:1月29日接受机构调研,中信证券、南方基金等多家机构参与


汉仪股份新提交“汉仪博物汉字”等12件商标注册申请


全面梳理新中国科技发展脉络 《中华人民共和国科学技术史纲》出版


美股三大股指集体高开 甲骨文涨超10%


龙湖集团“造血能力”强劲:经营性业务优化盈利结构,有息负债降154亿


巡境阿勒泰,与硬核大五座SUV揽巡一起走遍夏日


午睡可能影响寿命?再次提醒:过了50岁后,牢记午睡“三不要”


登云股份(002715SZ)控股股东拟变更为益科瑞海


绿康生化(002868SZ):拟定增募资不超过8000万元


【环球财经】基尔世界经济研究所预计德国2024年经济仅小幅增长01%


《炎性体质必看!鱼禽蛋肉摄入量的黄金标准》_瘦肉_营养_食用


京东外卖致歉:今日午高峰系统出现短暂故障,超时20分钟以上的外卖全部免单


福清:数智浪潮奔涌玉融 千亿蓝图擘画新篇


4月6日香港周大福黄金价格33680港币两


分红水平稳步提升,56家沪市公司连续三年股息率超5%


4月29日兴发转债下跌001%,转股溢价率6485%


“国门玫瑰”助力自主品牌汽车出口


杠杆炒股:放大收益,也放大风险?


十大股票配资公司:撬动财富杠杆,风险与机遇并存


股票账户配资:撬动财富的杠杆,亦是风险的双刃剑
