(资料图片仅供参考)
生成式人工智能程序可以根据文本提示生成图像。这些模型在生成单个对象的图像时效果最佳。但创建完整的场景仍然很困难。据外媒报道,荷兰特文特大学(University of Twente,UT)研究院、荷兰地理资讯科学与地球观察学院(Geo-Information Science and Earth Observation)场景理解小组(Scene Understanding Group)助理教授Michael Ying Yang近日开发出新方法,可以绘制图像中的场景,以生成逼真且连贯的图像。相关研究已发表于期刊《IEEE Transactions on Pattern Analysis and Machine Intelligence》。
图片来源:荷兰特文特大学
人类非常擅长定义对象之间的关系。Yang解释说:“我们可以看到一张椅子站在地板上,一只狗在街上行走。但人工智能模型却很难。”提高计算机检测和理解视觉关系的能力是图像生成所必需的,同时也可以帮助自动驾驶车辆和机器人更好地感知。
从两阶段到单阶段
目前已有用于绘制图像语义理解的方法,但其速度很慢。这些方法使用两阶段方法(two-stage approach):首先映射场景中的所有对象;然后特定的神经网络遍历所有可能的连接,并用正确的关系标记。
此方法必须经历的连接数量会随着对象数量呈指数增长。Yang表示:“我们的模型只需一步,即可同时自动预测主体、物体及其关系。”
检测关系
对于这种单阶段方法,模型会查看场景中对象的视觉特征,并重点关注最相关的细节来确定关系。它突出显示了对象相互作用或相互关联的重要领域。这些技术和相对较少的训练数据足以识别不同对象之间最重要的关系。最后,生成对连接的描述。
Yang表示:“该模型检测到,在示例图片中,该男子很可能与棒球棒互动。然后,它被训练来描述最可能的关系:‘人-挥杆-棒球棒’。”
关键词:
世界时讯:研究发现新人工智能方法 可从图像中绘制场景
巴西女足主帅谈玛塔入选女足世界杯名单:拥有她是球队之幸-环球观察
当前要闻:完美音调4什么时候上映_完美音调
每日播报!微软称未来会将 Windows 完全迁移到云端
新天药业:接受民生加银基金等机构调研
鲨齿龙模型_鲨齿龙资料 焦点热闻
快报:月子里可以吃什么菜?
彩涂板商品报价动态(2023-06-28)
当前消息!某企业宣传:女员工通宵加班流产,起底该宣传企业
索尼推送满血包:ZV-E1相机支持4K/120p和1080P/240p_环球时讯
最新 QS 世界大学排名发布:麻省理工蝉联榜首,北京大学排名第 17 位
绿叶制药跌11% 拟发行1.8亿美元可转换债券
@中考生 中考志愿填报一定要用好这些“线”-全球快讯
【天天新视野】注意!天水这些小区可以办房产证了,快看看有没有你家?
当前要闻:贵州省农村青年致富带头人协会与香港裕华国货有限公司签订战略合作协议并举办贵州产品采购启动会
“深圳惠民保”投保人群呈年轻化趋势 参保缴费倒计时2天|环球观焦点
恒逸石化:6月27日融资买入201.6万元,融资融券余额15.39亿元
郑州市惠济区艺术小学举行2022-2023学年下学期体音美工作总结会
全球新资讯:《糖豆人》港服登录不了是什么原因
大同市美术馆室内暂停对外开放公告
闯关东演员表全部图片大全介绍 闯关东演员表全部
U19男篮世界杯16强对阵安排出炉:今晚9点中国将战美国
笔记本电脑键盘fn切换(电脑键盘fn是哪个键)_环球观察
东方盛虹06月27日获深股通增持27.69万股
世界热资讯!晴雅集放映多少天_上映仅10天晴雅集下架
世界微头条丨五言律诗的平仄格式有哪些_五言律诗的平仄格式
车主注意!经济恢复刺激能源需求 油价或面临上调
湖人5换1 詹乔联手快船-全球资讯
热点聚焦:如何挽回前男友_怎样可以挽回前男友
天天微动态丨做手术成了内科医生的最高境界,如何造成的?