【最新点云数据增强综述】深度学习点云数据增强技术的进展

        深度学习(DL)已成为点云分析任务(如检测、分割和分类)的主流和有效方法之一。为了减少深度学习模型训练过程中的过拟合,提高模型性能,尤其是在训练数据的数量和/或多样性有限的情况下,增强往往至关重要。虽然各种点云数据增强方法已被广泛应用于不同的点云处理任务中,但目前还没有关于这些方法的系统调查或综述。因此,本文对这些方法进行了调查,并将它们归入一个分类框架,其中包括基本的和专门的点云数据增强方法。通过对这些扩增方法的综合评估,本文指出了它们的潜力和局限性,为选择合适的扩增方法提供了有用的参考。此外,还提出了未来研究的潜在方向。本调查报告有助于全面概述点云数据扩增的现状,促进其更广泛的应用和发展。

 

Basic point cloud augmentation 

Typical basic operations 

Affine transformation

        仿射变换涉及仿射空间的变换,它保留了共线性和距离比。在图像数据增强方面,常用的仿射变换方法包括缩放、平移、旋转、反射和剪切。同样,仿射变换也可用于点云数据增强。典型的方法包括平移、旋转、翻转和缩放,这些方法已被广泛用于生成额外的新训练数据。这些操作可应用于整个点云数据集,也可使用特定策略应用于点云数据中的选定实例(实例指语义对象,如图 2(a) 中所示的车辆),或选定实例的特定部分。通过仿射变换增强的数据可能会面临信息丢失或语义不合理的问题,具体操作将在下文中说明。 

        平移表示将选定的点云数据按特定距离和方向移动,如图 2(b)所示。这种增强功能可以帮助 DL 模型更好地学习不同位置的实例,降低模型对场景中实例空间变化的敏感性。不过,谨慎选择平移范围和方向非常重要。例如,平移可能会导致遮挡或使实例出现在语义不恰当的位置,如汽车与建筑物重叠时,就会偏离合理的场景。此外,大范围的平移可能会将实例移到目标场景之外,造成信息丢失。 

        旋转表示按照指定的方向和角度旋转选定的点云数据,如图 2(c) 所示。这种增强可用于模拟不同的物体方向或传感器视点,增强 DL 模型处理实例姿态变化的能力。在数据集中,实例的姿态主要是,旋转增强应考虑到现实世界中涉及传感器倾斜和实例旋转的情况。在旋转增强中,可能需要一组不同的旋转来充分代表不同的实例方向,尤其是不常见的方向。但是,这种增强可能不适合绝对物体方向至关重要的情况。此外,较大的旋转可能会扭曲实例,从而影响模型学习有意义特征的能力。

        缩放包括对选定的点云数据进行比例变换,如图 2(d) 所示。这种增强可以模拟各种物体尺寸,增强 DL 模型对比例变化的适应性。由于网络感受野的变化,原始输入数据可能不是网络的最佳比例。通过缩放操作,网络可以处理不同输入尺寸的点云数据。许多研究都强调了多尺度训练的有效性[10],尤其是在小目标感知方面[11]。不过,应注意选择适当的缩放比例,以避免引入不切实际的几何图形,从而影响数据点之间的空间关系。此外,缩放范围的选择应避免对点云数据中的实例或区域过度采样或采样不足,因为缩放会增加或减少点数据的密度。

        如图 2(e)所示,翻转表示将选定的点云数据沿指定轴翻转的操作。这种方法增强了 DL 模型对实例方向和对称特征的泛化能力。在实例级数据集中,水平翻转和垂直翻转都很常用。然而,在场景级数据集中,垂直翻转无助于提高模型的可区分性[12]。例如,在自动驾驶数据集 nuScenes [13]中,为了防止语义模糊,只使用了水平翻转。场景中垂直翻转的人和车的实例在语义上可能不真实,从而可能影响模型性能。

Drop

        如图 3 所示,删除指的是丢弃点云数据中的某些数据点。如何选择要删除的点取决于研究人员制定的具体策略。丢弃的点可以是整个点云数据的一部分,也可以是场景中随机选择的点。丢弃点扩增可以帮助 DL 模型更稳健地应对缺失或不完整的数据,这些数据代表了遮挡或部分可见的场景。它还可以防止 DL 模型过于依赖于训练数据集中的特定数据点。然而,丢失过多或关键的点云信息可能会导致训练数据中真实世界物体的表现不真实,并影响 DL 模型的训练,尤其是在数据密度较大或物体较小的情况下。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/610059.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[muduo网络库]——muduo库的Reactor模型(剖析muduo网络库核心部分、设计思想)

一、前言 在学习 C 服务端的过程中,必不可少的一项就是熟悉一个网络库,包括网络库的应用和其底层实现。我们熟知的网络库有 libevent、libev、muduo、Netty 等,其中 muduo 是由陈硕大佬个人开发的 TCP 网络库,最近跟着课程正在深…

Springboot+Vue项目-基于Java+MySQL的车辆管理系统(附源码+演示视频+LW)

大家好!我是程序猿老A,感谢您阅读本文,欢迎一键三连哦。 💞当前专栏:Java毕业设计 精彩专栏推荐👇🏻👇🏻👇🏻 🎀 Python毕业设计 &…

Java方法和数组

方法 Java中的方法就是c语言中的函数。 方法的定义 定义格式如下 修饰符 返回值 方法名([参数列表]){代码块[return 返回值;] } //方括号[]括起来代表可以没有,不是必须有的方法名采用小驼峰命名(就是有多个单词,第一个单词首字母小写其…

Redis学习1——redis简介、基础

介绍 redis简介 Redis(Remote Dictonary Server) 是由Salvatore Sanfilippo开发的key-value缓存数据库,基于C语言开发。目前市面上,Redis和MongoDB是当前使用最广泛的NoSQL,而就Redis技术而言,它的性能十分优越,可以…

回溯法、全排列、子集等

回溯法 感想:回溯算法本质是一个循环,有点像while循环 一些回溯法(递归)的经典应用 1.全排列 2.子集 其实上面两个点,也是对应着高中数学里面的“排列”与“组合” 1.全排列问题 给定一个集合S{a,b,c}&#xff0…

mysql数据库标识符的使用

ddl CREATE TABLE student (id int(11) NOT NULL AUTO_INCREMENT COMMENT 学号,createDate datetime DEFAULT NULL,userName varchar(20) DEFAULT NULL,pwd varchar(36) DEFAULT NULL,phone varchar(11) DEFAULT NULL,age tinyint(3) unsigned DEFAULT NULL,sex char(2) DEFAU…

crmeb的分销推广如何用

CRMBE分销推广说明 1、CRMEB分销模式 分销模式: 指定分销、人人分销、满额分销 指定分销: 用户默认无分销权限,需要后台开通分销权限后,才可以通过推广下级获得返佣; 人人分销: 用户在商城注册后自动获得分…

SpringBoot的图片上传

简介 该文档旨在介绍一个基于Spring Boot框架的简单文件上传功能的实现方式。本文档将详细介绍相关代码的功能和配置以及如何使用它们。 样例 技术栈 Spring Boot:一个用于快速开发基于Spring的应用程序的框架。Thymeleaf:一个用于在Web应用程序中创建…

超越机械抓手:看多指机器人如何灵活运用触觉?

论文标题: Learning Visuotactile Skills with Two Multifingered Hands 论文作者: Toru Lin, Yu Zhang, Qiyang Li, Haozhi Qi, Brent Yi, Sergey Levine, and Jitendra Malik 1. 机器人新挑战:多指手指操作 在自动化和智能化日益普及的…

winform图书管理系统

winform图书管理系统说明文档 运行前附加数据库.mdf(或sql生成数据库) 主要技术: 图书管理员 读者管理 图书管理 添加 修改 删除 查看 入库 书册列表 书册管理用户管理退出 借书 还书 系统管理员 修改图书管理权限 项目获取:…

java对象互换工具类

1:将Object类型转成json字符串 /*** 将对象转为字符串* param obj* return*/public static String toString(Object obj) {if(obj null) {return null;}if ("".equals(obj.toString())) {return null;}if (obj instanceof String) {return obj.toString();}try {Ob…

20232906 2023-2024-2 《网络与系统攻防技术》第九次作业

20232906 2023-2024-2 《网络与系统攻防技术》第九次作业 1.实验内容 本次实践的对象是一个名为pwn1的linux可执行文件。 该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。 该程序同时包含另一个代码片段,getShell&am…

vscode远程免密ssh原理与实操方法

什么是SSH SSH是一种加密协议,全称为Secure Shell,用于安全地远程登录到服务器或其他远程设备上执行命令或传输文件。它提供了一种安全的加密通信机制,使得远程登录和文件传输等操作不会被恶意攻击者窃取或篡改,确保了数据的保密…

全球10KM土地利用程度数据

全球10KM土地利用程度数据 数据介绍 “一带一路”监测区域土地利用程度指数平均值为0.34,不同区域利用程度差异明显,但总体上高值区域与人口分布的稠密区域吻合。中南半岛、南亚、欧洲和小亚细亚半岛等地海拔较低,水热组合条件较好&#xff…

SqlServer数据库导出表结构和数据为脚本文档

需求:把数据库里的数据结构及数据存为脚本,下次一键执行数据库 操作方法: 一、右击该数据库,选择任务 二、下一步 三、如果导出整个数据库就默认,若导出指定的表和视图就选择具体的数据库对象 四、选择另存为脚本文件…

分解质因数-第12届蓝桥杯国赛Python真题解析

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第61讲。 分解质因数&#…

亚信安慧AntDB:解锁数智化的新时代

亚信安慧AntDB的融合实时的特性使得它在数据库领域独树一帜。传统的数据库系统往往只能追求数据的准确性和一致性,但在实际的业务场景中,这些特性并不能满足企业的需求。AntDB的出现打破了传统束缚,为企业带来了全新的数据处理方式&#xff0…

测试用例设计方法-状态迁移图法

一、介绍: 在软件测试领域中,状态迁移图法是一种极为重要且有效的测试方法。状态迁移图法侧重于分析和测试系统中存在的各种状态以及它们之间的迁移关系。所谓状态,就是系统在特定条件下所处的情况或模式,而迁移则是状态之间的转换…

抖音又出王炸级APP,免费的AI写真神器,一键生成不同场景的写真大片(附保姆级教程)

以前想要拍出一组写真大片,是不是还得跑摄像馆,化妆、换装、各种摆 pose、场景布置,少说也要折腾一上午,而且花费还不少。 而现在,有了 AI,在家里,一个人,一部手机,就能…

微同城小程序源码 轻松制作本地生活活动赚钱 带完整的安装代码包以及搭建教程

近年来,本地生活服务市场蓬勃发展,人们对于周边的生活信息、活动资讯等需求日益增长。然而,传统的信息发布方式存在诸多不便,如信息更新不及时、传播范围有限等。微同城小程序源码应运而生。它利用小程序的便捷性和普及性&#xf…
最新文章