智谱AI开源视频理解模型CogVLM2-Video,可回答时间相关问题
2024-10-30 【 字体:大 中 小 】
智谱AI表示,CogVLM2-Video在公共视频理解基准和视频字幕生成等多方面表现出色。
品玩7月12日讯,智谱 AI 宣布,旗下视频理解模型CogVLM2-Video现已开源。
智谱 AI 提出了一种基于视觉模型的自动时间定位数据构建方法,生成了 3 万条与时间相关的视频问答数据。基于这个新数据集和现有的开放领域问答数据,引入了多帧视频图像和时间戳作为编码器输入,训练出 CogVLM2-Video 模型。
智谱 AI 表示,CogVLM2-Video 不仅在公共视频理解基准上达到了最新的性能,还在视频字幕生成和时间定位方面表现出色。
猜你喜欢
24人被查,24人被处分……
雌蛙会“暗送秋波”?我国科研人员证实蛙类存眨眼视觉信号
佰奥智能(300836SZ):研发的防爆关节机器人和本安型传感器经过验证,已获得了防爆合格证书
刘承司叛逃台湾后,所属部队的大小干部全部被免职
新的豪华风格 阿维塔07内饰正式发布
2024年首例!这家A股公司重大违法,被强制退市
【企业动态】聚龙退新增14件法院诉讼
8月19日-8月23日一致评级不断调高的个股(按参与机构数量由高到低排序)(2)
速看!唐山又双叒叕限产 对黑色系影响几何?
天振股份:9月6日高管方庆华增持股份合计1885万股
首周订单突破 35 万,这辆韩系SUV简直票房救星
花旗:对统一企业中国(00220)目标价为857港元 评级“买入”
美网友:为什么美国如此害怕中国崛起,而不害怕日本、印度等国家
富特科技(301607)新股概览,8月26日开始网上申购
福能东方(300173SZ):截至1月10日,公司股东总户数为44583户
多次风险提示,中小行依旧买债!四家农商行涉操纵债市价格
做商品管理,看这一篇文章就够了
全球首例!中国介入式脑机接口传感器血管内取出试验成功
REF HOLDINGS(01631HK)盈警:预期中期净利同比减少约40%至50%
今日评 引领网络文明新风尚