
新版本 MVTec HALCON 引入基于深度学习的强大 Bin Picking 技术

MVTec HALCON 产品经理 Jan Gärtner 表示:“我们始终致力于为客户提供最新的机器视觉技术,并持续优化现有功能。在新版本 HALCON 中,我们再次实现了这一目标。Deep 3D Matching 是一种前所未有的创新技术。同时,我们也进一步提升了现有深度学习方法的性能与可用性。”
此前在旧版本中已以预览形式提供的 Deep 3D Matching,如今已全面推出,尤其适用于 Bin Picking 和 Pick-and-Place 等应用场景。根据具体需求,用户可使用一台或多台性价比高的标准 2D 相机进行目标定位。
本次更新还包括对用于基于深度学习的文本识别的神经网络的优化;同时,二维码识别器也得到了增强,新增一组图像采集算子,以及众多其他细节优化。
Jan Gärtner 补充道:“目前对 MVTec 来说,尤为重要的一项工作是全新集成开发环境 HDevelopEVO 的研发。用户已经可以提前体验该工具,而新版本中我们进一步扩展了可用的功能范围。”
自主训练 Deep 3D Matching 模型

Deep 3D Matching 是一种全新的基于深度学习的技术,用于快速、稳健地进行三维目标检测与位姿估计,仅需使用 2D 图像即可完成。该技术几乎无需参数配置,性能出色,尤其适用于如 Bin Picking 和机器人操作等高要求应用场景,即便在复杂条件下也能表现优异。
借助 HALCON 25.05,用户现可自主训练自己的 Deep 3D Matching 模型,无需依赖 MVTec 的支持服务。全新开发的渲染器可通过目标物体的 CAD 模型生成训练数据,从而实现完全基于合成数据的模型训练。这一功能极具灵活性,可根据物体特性(如反光或透明)模拟不同场景。
有了这一训练能力,客户可以打造更贴合自身需求与应用环境的三维匹配解决方案。当然,若有需要,也可选择由 MVTec 提供付费模型训练服务。
基于对齐修正的更强大 Deep OCR 功能
在某些应用中,由于对周期时间(cycle time)有严格限制,可能无法运行 Deep OCR 的检测模型来自动定位图像中的文本区域。这种情况下,用户通常需手动或通过基于规则的图像处理方法来定义文本区域,但这可能导致剪裁不准确,从而降低识别效果。
HALCON 25.05 引入了一个对齐步骤,在识别前对粗略剪裁的文本区域进行优化。该步骤显著提高了识别准确率,即使文本区域并未精确定位,也能获得可靠的 OCR 结果。
通过这一新特性,用户可以在跳过检测模型的同时,依然获得高质量的文本识别结果,从而大幅缩短处理时间。该对齐步骤本身计算效率很高,几乎不会增加额外的处理负担。
此功能不仅提升了文本识别流程的灵活性,也让整体运行速度更快,因为不再需要精确设定 ROI(感兴趣区域)。
核心功能改进
在 HALCON 25.05 中,二维码识别器新增了 QR 码矫正功能,即使二维码位于弯曲或变形的表面上,也能实现稳定识别。这一改进拓展了在物流、包装、食品加工和瓶身贴标等行业的应用可能性——这些行业中,二维码常常印刷在非平坦材料上。矫正过程能够显著提高可读性,无需要求完美平整的表面。该功能为可选项,用户可按需启用。虽然其处理时间略长于标准二维码读取,但因识别更加稳健,对于高要求应用来说具有重要价值。
此外,HALCON 25.05 还新增了中断 Generic Shape Matching 训练过程的功能,赋予用户更高的灵活性与控制力。现在,训练过程可以手动停止,或通过设置超时时间(例如:1 秒后自动停止)来限制训练时长,从而确保操作效率,避免无谓等待。此前,训练一旦启动就必须运行至结束,可能会导致延迟,特别是在资源受限的嵌入式应用中。通过这项改进,用户可将训练过程无缝集成进工作流程中,避免长时间处理,提升系统响应能力。
面向现代相机技术的全新图像采集接口
HALCON 25.05 推出了一组全新的图像采集算子,旨在实现与先进相机技术的无缝集成。尽管 MVTec 始终专注于高效的相机连接,但诸如 GigE Vision 和 USB3 Vision 等现代标准的兴起,也带来了新的机遇与挑战。
这一新接口在简化相机操作的同时,仍提供对高级配置的完整控制。新算子拥有更清晰、更直观的界面,针对典型应用场景进行了优化,同时仍完全支持 GenICam GenTL 架构。
此外,如果所使用的 GenICam GenTL 设备支持多数据流,该接口也可以提供相应支持。用户可以预期,新算子的性能与之前版本相当甚至更优,从而确保在过渡到最新相机技术时依然体验顺畅、稳定可靠。
HDevelopEVO 新版本发布
随着 HALCON 25.05 的推出,全新版本的 HDevelopEVO 也同步发布,为用户带来了多项新功能。
HDevelopEVO 25.05 现在支持引用存储在外部文件中的过程,用户可以将程序拆分为多个文件,并在这些文件之间调用过程。这不仅有助于实现更清晰的程序结构,也为未来支持模块化库打下了基础。
为了满足机器视觉工作流程中的常见需求,新版本还新增了灰度值直方图功能——这是图像分析中最常用的工具之一。该功能允许用户可视化图像中像素强度的分布,并通过交互方式设定阈值,从而选取感兴趣的区域进行后续处理。
此外,为了更好地支持开发人员,HDevelopEVO 25.05 还引入了 AI 助手。这些助手包括交互式聊天、用于 IDE 命令和 Shell 命令的智能代理,以及自动代码补全功能。用户可在云端部署、自主托管或本地运行 AI 模型之间进行选择,同时保有对数据与模型使用的完全控制。AI 助手需由用户手动激活方可使用。