谷歌Gemini扳回一局!多模态能力和GPT-4V不分伯仲|港中文128页全面测评报告 在37个视觉理解任务上,Gemini-Pro表现出了和GPT-4V相当的能力。 AIcore 2023-12-22 大模型 GPT-4V 谷歌 Gemini 3.4万
当GPT-4V充当机器人大脑,可能你都没AI会规划 假如我们把 GPT-4V 带入现实世界,让它作为控制机器人的大脑,会有什么有趣的结果呢? 机器之心 2023-12-12 AIGC GPT-4V 2.6万
用GPT-4V和人类演示训练机器人:眼睛学会了,手也能跟上 微软提出使用人手运动视频直接教机器人完成任务的新方法,这种方法使用 GPT-4V 分解视频中的动作,结合大语言模型生成对应的行为表述并作为任务列表,训练机器人只需要动动手就能完成。 机器之心 2023-12-02 大模型 GPT-4V 8.0万
超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能 研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V,并在此基础上训练了一个7B模型,在多项多模态榜单上超越了其他同级模型。 AIGC 2023-11-30 大模型 GPT-4V ShareGPT4V 1.7万
GPT-4V新玩法登顶GitHub热榜,随手一画就能生成网页!web开发者:感受到了威胁 随手一画就能生成网页!GPT-4V新玩法登顶GitHub热榜,狂揽3000+星 AIcore 2023-11-17 大模型 GPT-4V 3.4万
GPT-4V连小学生都不如?最新基准测试错误率竟高达90%:红绿灯认错、勾股定理也不会 马里兰大学发布首个专为VLM设计的基准测试HallusionBench,全面测试GPT-4V视觉错误和语言幻觉。 AI梦工厂 2023-10-31 大模型 GPT-4V 2.8万
在视觉提示中加入「标记」,微软等让GPT-4V看的更准、分的更细 全新视觉提示方法 SoM(Set-of-Mark),让 OpenAI 多模态大模型 GPT-4V 在视觉内容理解方面有了质的提升。 机器之心 2023-10-24 AI OpenAI GPT-4V 1.7万
媲美GPT-4V,仅使用1.2M数据、8个A100,一天内完成训练,LLaVA-1.5刷新11个基准SOTA 多模态大模型落地的风,最终还是刮了起来。 机器之心 2023-10-10 AI AIGC GPT-4V 2.2万
正面硬刚GPT-4V!浙大校友开源多模态大模型LLaVA-1.5,130亿参数8个A100一天训完 GPT-4V的开源竞争对手——LLaVA-1.5,就已经来了! AIGC 2023-10-08 ChatGPT GPT-4V 2.5万