CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

文章图片

CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

文章图片

CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

文章图片

CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

文章图片

CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

文章图片

CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法

深圳大学黄惠团队独立推出 CLR-Wire:连续潜空间驱动的三维曲线框生成方法 , 首次实现了将复杂的三维曲线框结构统一编码到连续的潜空间中 , 解决了传统方法难以同时有效捕捉线框几何和拓扑信息的难题 。 这一创新技术能够实现复杂三维结构的高效生成与平滑插值 , 在工业设计、三维重建及内容创作等领域具有广泛的实际应用前景 。 第一作者为深圳大学可视计算研究中心 (VCC) 博士研究生马雪奇 , 合作者刘奕林、高天龙、黄期瑞均为 VCC 研究生 。 CLR-Wire 相关代码已全面开源 , 欢迎大家试用和建议 。

  • 项目主页:https://vcc.tech/research/2025/CLRWire
  • 项目代码:https://github.com/qixuema/CLR-Wire
  • 论文链接:https://arxiv.org/abs/2504.19174

在计算机图形学的世界里 , 当我们谈论三维线框插补时 , 我们在讨论些什么?
或许 , 是如何让一个圆柱平滑地演变为一个精致的碟状结构;或许 , 是如何巧妙地将一个醒酒器无缝过渡为圆润的花瓶;甚至 , 是如何从一栋带有屋顶的建筑物 , 逐渐变化为简单明朗的方形结构 , 以及诸如漏斗或盘状结构之间的自由形态过渡 。
聪明的 CLR-Wire (发音:Clear-Wire) 为我们提供了答案:
它创新地将几何曲线与拓扑结构统一编码至连续潜空间 , 实现了不同三维曲线框之间的平滑过渡 。 这不仅拓展了三维线框建模的边界 , 也为三维形状生成和交互式设计开启了全新的想象空间 。
接下来 , 让我们深入探索 CLR-Wire 的关键技术与背后机理 。
CLR-Wire 的关键技术与背后机理
三维曲线框作为对三维形状的简洁抽象表示 , 在形状简化 [Mehra et al. 2009
、曲面重建 [Pan et al. 2015
及交互式设计 [Gal et al. 2009
中具有重要意义 。 然而 , 早期方法多依赖高质量点云提取角点或边缘 [Liu et al. 2021; Zhu et al. 2023
, 缺乏对线框的拓扑重建;最新 B-rep 生成方法如 SolidGen [Jayaraman et al. 2023
、BrepGen [Xu et al . 2024
虽然可以建模顶点、边、面 , 但主要面向规则几何 , 对不规则形状支持不足 , 且采用几何与拓扑分离的建模方式 , 容易引入误差 。
该工作提出了 CLR-Wire , 首先 , 通过多层交叉注意力将神经参数化曲线及其离散拓扑关系联合编码为定长潜向量 , 并借助变分自编码器构建连续的潜空间分布; 随后 , 采用流匹配方法实现从高斯噪声到完整线框的生成 , 并支持无条件生成以及基于点云、图像的条件生成 。 实验结果表明 , 该方法在生成精度、新颖性和多样性方面均显著优于最先进方法 , 并能有效适应复杂拓扑结构 , 为 CAD 设计与三维内容创作提供了高效可靠的全新解决方案 。

本工作围绕三维曲线框的连续潜空间表示与生成 , 主要贡献如下:
  • 引入了线框的连续潜空间表示 , 实现了三维曲线框几何与拓扑的平滑插值;
  • 构建了基于连续潜空间的三维曲线框生成框架;
  • 支持无条件及条件驱动(点云或图像)的线框生成 。

CurveVAE
CurveVAE 模块的目标是将各类三维几何曲线映射为紧凑的潜向量表示 。 首先 , 该方法对每条曲线进行标准化处理 , 通过平移使曲线起点位于固定位置 , 并通过旋转和缩放对齐终点至另一固定位置 , 以消除不同曲线之间的位置、朝向和尺度差异 , 从而提升训练稳定性 。 随后 , 沿标准化后的曲线均匀采样若干点 , 利用交叉注意力机制对高维的曲线点云进行特征降维 , 再通过多层一维卷积压缩为潜向量 , 同时保留曲线的细节 。 在解码阶段 , 解码器先用一维上采样卷积恢复至较高维度的特征 , 再结合位置编码与交叉注意力机制 , 通过多层感知机将连续参数映射回曲线上对应的位置 , 最终实现曲线的连续化重建 。
WireframeVAE
WireframeVAE 模块旨在将来自曲线编码器的潜向量、对应的顶点坐标以及邻接关系列表进行融合编码 , 并把它们一起映射为一个全局潜向量 。 为此 , 该方法首先通过广度优先遍历的方式对邻接列表中的线段顺序进行排序 , 然后使用 Perceiver 聚合模块融合曲线特征、顶点信息和拓扑连接关系 , 生成统一的全局潜向量 。 在解码阶段 , 该方法使用一组可学习的查询向量对该全局潜向量进行交叉注意力操作 , 提取各条曲线的特征 , 再通过特征映射器分别预测邻接关系、顶点坐标和曲线潜向量 , 从而完整重建线框结构 。 此外 , 通过构建差分形式的邻接关系 , 该方法简化了邻接列表的表示 。 最后 , 在训练中结合均方误差损失、交叉熵损失和散度损失 , 以确保几何信息与拓扑信息的高效融合与高质量重建 。

WireframeVAE 流程图
Flow Matching
基于线框潜在表示的 Flow Matching 模块 , 旨在逐步从噪声中生成线框样本的潜向量表示 。 该方法通过训练一个速度场网络来描述潜向量随时间的演化 , 将初始噪声分布沿着一条概率路径演变为目标潜在分布 。 网络在训练过程中最小化预测速度与实际变化速度之间的误差 , 以学习到正确的演化场 。 训练完成后 , 只需求解该演化过程 , 即可生成新的潜空间样本 。 为了支持条件生成 , 方法还引入了预训练的图像特征提取模型和点云特征提取网络 , 从而兼顾无条件生成和基于稀疏点云或单视图图像的三维线框生成 。
结果展示
为了评估线框生成质量 , 该方法首先采用 CD 和 EMD 来度量生成线框与参考线框在几何形状上的相似性;随后引入分布式指标以衡量样本的多样性与一致性:COV 用于评估生成结果的覆盖率 , MMD 衡量结果与真实分布的差异 , 1-NN 则量化两者分布的相近程度 。 结合这些指标 , 该方法与 3Dwire [Ma et al. 2024
、DeepCAD [Wu et al. 2021
及 BrepGen [Xu et al. 2024
在无条件生成任务上进行了对比 。
在无条件生成实验中 , 3DWire 仅能生成由直线段构成的线框 , 无法描述曲线;DeepCAD 和 BrepGen 虽能生成带曲面模型 , 但其线框多依赖于表面生成 , 结构简单且缺乏细节 。 相比之下 , CLR-Wire 通过统一的连续潜空间同时编码几何与拓扑 , 能够直接生成完整且多样的自由曲线框 。

在 ABC 数据集上与其他方法的无条件生成结果对比
此外 , 通过从大量生成样本中进行多次随机抽样实验 , 该方法在各项评价指标上均显著超越其他方法:更高的覆盖率表明生成结果多样性更强 , 更低的分布差异度体现了几何一致性更好 , 而最近邻评分则证明了潜空间分布与测试集高度契合 , 进一步验证了该方法的建模能力和可靠性 。

与其他方法的无条件生成定量指标对比结果(左) 与基于点云的线框重建方法的对比(右)
在有条件生成实验中 , 该方法测试了以点云或图像为条件的线框生成能力 。 针对点云条件 , 该方法在稀疏和局部缺失场景下 , 与依赖密集点云的 RFEPS [Xu et al. 2022
和 NerVE [Zhu et al. 2023
进行了对比 。 CLR-Wire 在 CD、EMD 和 F1 Score 上均优于其他方法 , 且生成的线框在细节和拓扑上更为完整 。 传统方法依赖局部尖锐特征 , 面对平滑或缺失输入易产生不完整结构 , 而该方法凭借预训练的全局潜空间和几何 — 拓扑先验 , 有效弥补稀疏与不完整信息 , 保持重建完整性与一致性 。

点云条件下不同方法的重建结果对比 (左) 该方法在部分点云条件下生成结果(右)
此外 , 将单视图图像和草图作为条件输入时 , 该方法同样能够生成完整且具新颖性的三维曲线框 , 展现出良好的跨模态生成能力和应用潜力 。

该方法在单视图与草图条件下的生成结果
在潜空间插值实验中 , 该方法实现了不同线框之间的平滑过渡 。 该方法首先提取不同线框对应的潜向量 , 然后通过球面线性插值生成中间潜在表示序列 , 再解码为相应的三维曲线框 。 结果表明 , 该插值过程不仅在几何细节上保持了高保真度 , 还成功捕捉了起始与目标线框之间的拓扑变化 , 展示了该方法在直观编辑与交互式操作等应用场景中的潜在价值 。

潜空间插值可视化:(b)–(e) 展示了不同拓扑形状的连续过渡 , 其中 (e) 从瓶状结构平滑变换到开口碗状 , 体现了该方法对几何与拓扑变化的捕捉能力
总结与展望
【CLR-Wire:曲线框可生成?可交互?深大VCC带你见证魔法】该方法提出了将不规则三维曲线框统一映射至连续潜空间的框架 , 实现了在潜空间中融合几何细节与拓扑连接 , 保证了线框生成过程中的一致性与完整性 。 实验验证了该表示在潜空间插值、无条件与有条件生成方面均具备优异的多样性与精度 , 显著提升了复杂曲线框的生成能力 。 尽管该潜空间已展示出平滑插值的能力 , 但在可控生成与编辑方面仍需进一步研究 。 未来 , 仍需要将潜空间与文本描述更紧密地对齐 , 以实现更高层次的语义驱动控制 。

    推荐阅读