新智元报道
编辑:LRST
【新智元导读】哈尔滨工业大学团队提出HEROS-GAN技术,通过生成式深度学习将低成本加速度计信号转化为高精度信号,突破其精度与量程瓶颈。该技术利用最优传输监督和拉普拉斯能量调制,使0.5美元的传感器达到200美元高端设备的性能,为工业、医疗等领域应用带来变革。
低成本加速度计凭借体积小、易集成、可穿戴及量产化优势,在工业自动化、医疗监测和消费电子等领域广泛应用,但其精度受限、噪声显著且量程范围狭窄的问题严重制约了高动态场景下的应用。
为此,哈尔滨工业大学的研究人员提出HEROS-GAN,首次通过生成式深度学习将低成本加速度计信号映射为高成本等效信号,突破其精度与量程瓶颈。
目前,论文已被顶会AAAI 2025接收为Oral,具有一定的理论价值和启发性。
论文地址:https://arxiv.org/abs/2502.18064
针对无法获取配对训练标签的核心挑战,文中设计最优传输监督(OTS),利用最优传输理论挖掘未配对数据间的潜在一致性,从而最大化利用监督信息。
同时,提出调制拉普拉斯能量(MLE),通过自适应调节特征层能量,激励生成器突破量程限制、增强局部细节。
并且,文中还构建了首个低成本加速度计信号增强专用数据集LASED。
图1 HEROS-GAN框架图
实验结果表明,单独集成OTS或MLE的GAN模型即可超越现有信号增强方法一个数量级;而融合两者的HEROS-GAN显著优于最优基线,量程从8g扩展至16g,噪声降低两个数量级,使$0.5级传感器达到$200级工业产品的实测性能。
此外,文中提出物理可解释性评估体系(CSRE/ZVRE),可以评估生成信号的物理合理性,从而保证生成模型的可靠性与实用性。
研究背景
低成本加速度计凭借其微型化设计、易于集成和低成本优势,已成为现代工业自动化、医疗健康监测及消费电子领域的核心传感组件。
在工业场景中,此类传感器广泛应用于机械臂运动控制、生产线振动监测与设备故障预警;在消费电子领域,其支撑智能手机的姿态交互、增强现实(AR)应用及健康监测功能;在医疗领域,则实现患者运动追踪、康复训练评估与跌倒检测等关键任务。
然而,受限于硬件成本约束,主流低成本加速度计普遍存在两大技术瓶颈:精度不足(信号噪声显著)与动态范围狭窄(典型量程为±2g至±8g)。
例如,工业机械臂高速运动需±16g量程以精确捕捉复杂动作,而医疗场景中跌倒检测常需识别瞬时超10g的加速度信号。
现有低成本传感器在高动态场景下易因信号饱和导致数据失真或丢失,严重影响系统可靠性。尽管高端传感器(如Xsens系列,部分产品单价超1500美元)可满足性能需求,但其高昂成本阻碍了规模化部署。
因此,通过智能算法提升低成本硬件性能,实现“低硬件成本+高算法效能”的技术路径,对推动高精度传感技术的普惠化具有重要战略意义。
近年来,生成式深度学习的快速发展为传感器信号增强提供了新思路。通过构建从低成本信号到高成本信号的映射模型,理论上可突破硬件固有局限。
然而,此类方法的核心挑战在于:低成本与高成本传感器的信号难以实现帧级严格配对。硬件差异、采样率不匹配及动态环境干扰导致监督信息缺失,传统生成式深度学习模型无法充分利用非配对数据内隐藏的监督信息,因此易生成不满足物理合理性的失真信号。
现有研究多聚焦于信号降噪(如卡尔曼滤波、经验模态分解),但此类方法依赖先验假设,泛化能力受限;而数据驱动方法虽能自适应学习,却受限于配对数据的稀缺性。
针对上述问题,研究人员提出的HEROS-GAN(Honed-Energy Regularized and Optimal Supervised GAN),首次实现非配对数据监督下的加速度计信号精度提升与量程扩展双重目标,其核心创新包括:
最优传输监督(Optimal Transport Supervision, OTS):基于最优传输理论,挖掘未配对信号间的潜在特征分布一致性,构建柔性监督机制。通过最小化特征迁移代价,实现跨域特征对齐,突破传统方法对严格配对数据的依赖。
调制拉普拉斯能量(Modulated Laplace Energy, MLE):在生成器特征层引入拉普拉斯能量自适应调控机制。通过微分几何特征动态调节生成信号的高频能量分布,实现高动态场景下的量程突破与稳态噪声抑制,实现量程扩展与噪声抑制的双重优化。
本研究提出物理可解释性评估体系(CSRE/ZVRE),它可以验证生成信号的物理合理性,首次为生成模型的可靠性与工程实用性建立严格的数学验证框架,填补领域内生成信号质量评估的理论空白。
最优传输监督
考虑到配对的低成本与高成本传感器信号难以获取,无法对生成模型施加逐元素匹配的端到端监督,文中提出基于最优传输理论的特征对齐机制,通过挖掘非配对信号特征间的潜在关联性实现跨域监督。
其核心思想在于:尽管两类信号未严格配对,但其深层特征分布因物理量测本质的一致性(如加速度的动力学约束、物理运动的时空连续性等)呈现潜在关联性。
具体而言,最优传输理论通过量化特征间的全局迁移成本(如特征相似度与分布差异),动态构建低成本特征向高成本特征的最优映射关系。
这一过程不仅识别未配对数据中隐含的相似性模式(如动态响应特征与噪声分布规律),更通过最小化全局迁移代价实现特征空间的柔性对齐。
基于此映射关系,研究人员设计最优传输监督可以引导生成器逐步修正特征分布偏差,使得低成本信号特征在保持物理合理性的前提下逼近高成本信号特征。
该机制突破传统方法对严格配对数据的依赖,通过全局分布匹配而非逐点强制映射,在未配对数据下最大化利用跨域监督信息,为生成模型的可靠性与泛化性提供了理论保障。
图2 最优传输监督示意图
调制拉普拉斯能量
针对传统生成模型对信号细节刻画不足的问题,文中定义了深度学习特征的拉普拉斯能量,并在生成器特征层设计了一种拉普拉斯能量调制机制(Modulated Laplace Energy, MLE)。
该机制通过动态感知信号局部曲率特征,在高动态区间增强高频分量以突破量程限制,在稳态区间抑制噪声能量以提升信噪比,实现物理规律引导下的信号细节重构。
该方法首次将微分几何约束嵌入生成式模型,为物理信息驱动的信号增强提供了可扩展的算法框架。
图3 拉普拉斯能量调制机制流程图
实验
文中构建了首个包含10类智能设备的加速度计信号增强数据集LASED,并提出物理可解释性评估体系:CSRE/ZVRE。
在过载信号重构任务中,该方法在15g量程下的重构误差较传统方法降低83.4%,零速度残差(ZVRE)达到0.065m/s的物理一致性水平。
Allan方差分析表明,静态噪声中的量化噪声降低94%,达到高端传感器实测性能。在实际工业场景测试中,成功捕捉到13.2g的机械冲击峰值(传统传感器在8.0g即饱和),并通过高精度三维高速运动捕捉设备验证了信号波形的时频域保真度。
结论
首先,OTS机制为跨域非配对数据建模提供了新的优化范式,研究人员将其推广至多模态医疗影像分析、跨平台机器人感知等场景。
此外,MLE模块开创了微分算子约束与生成式模型的融合路径,为物理规律驱动的信号重建提供了方法论指导。
文中构建的评估体系建立了算法性能与物理可解释性的定量关联,为传感器信号处理领域确立了新的评价标准。
工程层面,该技术已应用于工业机械臂振动监测系统,使成本$0.5以内传感器的测量精度达到$200专业设备的水平,验证了算法落地应用的可行性。这项工作不仅突破了低成本传感器的性能极限,更启示了生成式模型在物理信息处理中的巨大潜力,为智能感知领域的算法-硬件协同创新提供了范式参考。
作者介绍
王一峰,哈工大博士生,2023年受国家留学基金委资助,赴新加坡国立大学进行博士联合培养,研究方向包括深度学习可解释性分析、传感器信号处理与分析、AI物理感知等。担任国际生物信息与生物医学工程会议(BIBE)、计算机技术与信息科学国际会议(CTIS)、机器人自动化与智能控制国际会议(ICRAIC)分会主席,CVPR、ECCV、AAAI、Information Fusion、Pattern Recognition, Information Science等人工智能顶级会议/期刊审稿人。
赵毅, 哈工大教授,应用数学研究中心主任和学科学术带头人,英国数学与应用学会会士,广东省数学学会理事,广东省工业与应用数学学会常务理事,研究方向包括应用动力系统、非线性时间序列分析、复杂网络和数据科学理论等。近五年以第一/通信作者发表SCI论文59篇,其中3篇论文入选ESI高被引论文。
参考资料:
https://arxiv.org/abs/2502.18064