分类解决方案
由于产品种类繁多且规则经常变化,这可能会变得复杂。即使是专家,人类也只能在 10 次中正确获取 7 次代码,手动产品分类也是额外的工作负担。
另一种解决方案是编写一个包含所有规则的计算机程序。行业专家 classify 产品,软件工程师添加专家遵循的规则。这样的系统可以在 10 次中正确获取约 9 次代码。我知道这一点,因为我们在 Zonos 的团队已经做到了。我们创建的规则关注以下几点:
- 产品的描述方式
- 用于宣传产品的图像
- 谁在销售该产品
- 产品的成本
关注这些因素可以实现最大分类准确性。
拥有 9/10 的项目分类准确性是令人惊叹的,但我们还没有完成。那一个分类错误的项目对我们来说是有价值的,因为我们将其作为数据来识别困难模式,以提高我们的准确性和结果。例如,我最近在一家在线商店看到一款产品被描述为“在定制西装中看起来不错,并且将是昂贵的正装鞋的完美补充”的袜子,这可能很难 classify。人类知道该产品是袜子,但描述可能与西装或鞋子有关。
为了防止计算机混淆,规则变得越来越复杂。您可以想象,当仅使用品牌名称、拼写错误或产品图片包含多个项目时,这会变得更加困难。
面对所有这些可能导致问题的因素,为了在 100 次中至少正确分类 99 次,我们使用机器学习。机器学习意味着我们将停止告诉计算机每一个可能重要的小细节,而是让计算机自己学习什么是重要的。我们仍然有专家和规则,但计算机的工作量更大,通常可以获得比人类更好的结果。
机器学习:识别模式
我们要求计算机为我们解决这个问题的一种方法是提供产品图像,并要求计算机在这些图像中寻找模式。一旦准备就绪,计算机就可以识别出人类可能会忽视的差异。
这是汽车大灯的一个例子。给定成千上万张汽车大灯的图片,我要求计算机根据图像之间的差异来组织它们。我没有告诉计算机任何关于这些图像的信息。当它这样做时,计算机决定有三种或四种不同类型的图像通常用于销售汽车大灯。每种类型的产品图像示例如下:
在这些图像中,有两种形状的汽车大灯和一种在汽车上的大灯。如果我查看每组中的其他图像,我会发现每组都充满了相似的图像。如果汽车零件商店开始销售带有盒子图片的汽车大灯,机器学习工具会注意到并自动适应。我将这些信息用于数千个不同的产品类别,涵盖数百万种产品。
机器学习工具通常可以注意到人类忽视的模式。例如,摩托车大灯与汽车大灯看起来略有不同;或者,美容产品通常是与一位女性将物品靠近她的脸一起销售,或者一件昂贵的衣物通常放在模特身上,而一件便宜的衣物则通常放在模特旁边或仅仅折叠在桌子上。这些似乎是容易注意到的简单模式和细节,但实际上很容易被忽视。
机器也可以学习常识。如果一家商店专注于健康和美容产品,我们知道某些产品图像中的花朵和葡萄并不是在销售;它们只是装饰品。或者如果一辆半挂车的售价为24.99美元,它可能是一辆玩具卡车或一件T恤。这些常见的混淆源被机器处理的方式与您或我处理它们的方式大致相同。系统使用得越多,它就越能改进。
我们可以教机器从我们的错误中学习。在第一次分类混淆图像中的葡萄或花朵后,可以教它忽略这些无关的装饰物,专注于图像中心的美容霜桶。这种情况在某些新事物出现时经常发生。我们总是可以请人类分类器来查看困难或新问题。
让计算机寻找模式并让专家审查这些模式是以更少的麻烦发货更多产品的好方法。归根结底,这会创造信心。跨境发送产品不应该要求您了解所有投入的努力;但知道工作已经完成,您可以信任我们的分类系统是发展您业务的重要工具。
HS 关税代码分类与机器学习的结合
在 Zonos,我们的行业和软件专家团队始终致力于简化跨境贸易。其中一个方面是确保任何跨境运输产品的企业都能正确分类这些商品。所有国家使用相同的系统来描述您销售的产品,称为协调编码系统。通过使用 HS 或 HTS 代码正确分类您的产品,有助于确保在边境检查您的包裹时的一致性。
在跨境运输产品时存在许多复杂性;但在 HS 代码方面,准确的自动分类可以作为推动您业务增长的关键工具。尽管过去准确的产品分类是一个繁琐且昂贵的过程,但我们正在解决这个问题。Zonos 拥有一款行业变革性工具 Classify,可以为产品描述分配协调代码。
作为行业专家和软件工程师,我可以从独特的角度解释这一过程。让我们来分析一下 HS 分类如何与跨境贸易中的机器学习相结合。
如果您销售的产品名为“男士金趾温莎羊毛袜(12双)黑色”,我们的系统可能会为其分配一个代码 6115.94。检查运往该国的物品的海关官员可以查看该代码,了解包裹内的内容,并迅速处理该物品。
前两个数字 61 告诉官员该物品是针织或钩编服装,而不是 62 表示非针织物品。第二组两个数字 15 表示这些是袜子。最后两个数字 94 表示这些是全长袜。
看似显而易见,像“男士金趾温莎羊毛袜(12双)黑色”这样的产品名称会符合 6115.94 的描述,但根据线材厚度或其他考虑,可能会选择许多类似的代码。我们的分类工具需要将代码与产品匹配,并找到最佳匹配。
一旦我们知道物品的运输目的地,这就变得更加复杂。每个国家都会分配额外的代码。例如,6115.94.00 末尾的额外 00 告诉加拿大海关官员这是羊毛袜,而 6115.94.0000 提供了更多细节,让他们知道该物品的税费远高于普通羊毛袜。我找不到为什么会有这种差异的解释,这就是为什么正确分类如此重要;在分类产品时很容易出错。
6115.94.0000 的描述与 6115.94.00 的描述相同,但这两个额外的 0 可以增加 rate。我们的工具不仅必须理解最正确的分类,还必须理解我们的决策如何影响我们的客户。