April 16, 2021 byDavid Richards

HS関税コード分類と機械学習の出会い

April 16, 2021
David Richards

Zonosでは、業界とソフトウェアの専門家チームが常に越境貿易を簡素化する方法を模索しています。その一環として、製品を国境を越えて移動させるビジネスが、適切に分類されたアイテムを持つことを確保することが重要です。すべての国は、販売する製品を説明するために、調和コードシステムと呼ばれる同じシステムを使用しています。HSまたはHTSコードを使用して製品を適切に分類することで、パッケージが国境で検査される際の一貫性を確保するのに役立ちます。

越境で製品を発送する際には多くの複雑さがありますが、HSコードに関しては、正確な自動分類がビジネスを成長させるための重要なツールとなります。過去には正確な製品分類が面倒で高価なプロセスでしたが、私たちはそれを改善しています。Zonosには、製品説明に調和コードを割り当てる業界を変えるツールであるClassifyがあります。

業界の専門家でありソフトウェアエンジニアとして、私はこの仕組みを独自の視点から説明できます。越境貿易のためのHS分類が機械学習とどのように出会うのかを分解してみましょう。

私の画像

「メンズゴールドトーウィンザーウール(12ペア)ブラック」という製品を販売している場合、私たちのシステムはそれに6115.94というコードを割り当てるかもしれません。国に発送されるアイテムを検査する税関職員は、そのコードを見て、パッケージの中身を理解し、遅延なくアイテムを進めることができます。

最初の2桁の61は、アイテムが編み物またはかぎ針編みの衣料品であることを示し、62は非編み物アイテムを示します。次の2桁の15は、これが靴下であることを示しています。最後の2桁の94は、これがフルレングスの靴下であることを明らかにします。

「メンズゴールドトーウィンザーウール(12ペア)ブラック」という名前の製品が6115.94の説明に合致するのは明らかに思えるかもしれませんが、糸の太さや他の考慮事項によって選ばれる可能性のある類似のコードがたくさんあります。私たちの分類ツールは、製品にコードを一致させ、利用可能な最良の一致を見つける必要があります。

アイテムがどこに発送されるかがわかると、さらに複雑になります。各国は追加のコードを割り当てます。たとえば、6115.94の末尾にある追加の00は、カナダの税関職員に対して、これはウールの靴下であることを示し、6115.94.0000はさらに詳細を提供し、アイテムに対する税金が単なるウールの靴下よりもかなり高いことを知らせます。なぜこれが異なるのかの説明を見つけることができなかったため、適切な分類が非常に重要です。製品を分類する際に間違いを犯すのは非常に簡単です。

6115.94.0000の説明は6115.94.00の説明と同じですが、これらの2つの追加の0は関税rateを増加させる可能性があります。私たちのツールは、最も正確な分類を理解するだけでなく、私たちの決定が顧客にどのように影響するかを理解する必要があります。

分類の解決策 

さまざまな製品と頻繁に変わるルールがあるため、これは複雑になる可能性があります。人間、特に専門家でも、コードを正しく取得するのは約10回中7回であり、手動の製品分類は追加の負担となります。

別の解決策は、すべてのルールを持つコンピュータプログラムを書くことです。業界の専門家がclassify製品を分類し、ソフトウェアエンジニアが専門家が従うルールを追加します。そのようなシステムは、約10回中9回正しいコードを取得できます。これは、Zonosのチームがこれを行ったからです。私たちが作成するルールは、以下の点に注意を払います。

  • 製品の説明の仕方
  • 製品を宣伝するために使用される画像
  • 製品を販売している人
  • 製品のコスト

これらの要因に注意を払うことで、最大の分類精度が得られます。

アイテム分類の精度が9/10であることは素晴らしいですが、私たちはまだ終わっていません。その1つの誤分類されたアイテムは、私たちにとって貴重です。なぜなら、それをデータとして使用して、難しいパターンを特定し、精度と結果を改善するからです。たとえば、最近、オンラインストアで「テーラードスーツに合う靴下で、高価なドレスシューズにぴったりの補完物」と説明された製品を見ました。これはclassifyするのが難しいかもしれません。人間はその製品が靴下であることを知っていますが、説明はスーツや靴についてのものである可能性があります。

コンピュータが混乱しないようにするために、ルールはますます複雑になります。ブランド名だけが使用されている場合、単語が誤って綴られている場合、または製品の画像に複数のアイテムが含まれている場合、さらに難しくなることを想像できます。

これらの問題を引き起こす要因がすべて存在する中で、分類を正しく行うために100回中少なくとも99回を達成するために、私たちは機械学習を使用します。機械学習は、コンピュータに重要なことをすべて教えるのをやめ、コンピュータに自分で重要なことを学ばせることを意味します。私たちはまだ専門家とルールを持っていますが、コンピュータにははるかに大きな仕事があり、人間よりもはるかに良い結果を得ることができることがよくあります。

機械学習:パターンの認識 

私たちがコンピュータにこの問題を解決してもらう方法の一つは、製品画像を提供し、コンピュータにそれらの画像の中からパターンを見つけるように頼むことです。準備が整うと、コンピュータは人間が見逃すかもしれない違いを特定できます。

私の画像

これは自動車のヘッドライトの例です。自動車のヘッドライトの何千もの写真を与え、コンピュータにそれらの画像がどれほど異なるかによって整理するように頼みました。画像については何も教えませんでした。この作業を行った際、コンピュータは自動車のヘッドライトを販売するために一般的に使用される3種類または4種類の異なる画像があると判断しました。各タイプの製品画像の例は次のようになります:

私の画像

これらの画像には、2つの形状の自動車のヘッドライトと、車に取り付けられたものがあります。各グループの他の画像を見ると、各グループは類似した画像で満たされていることがわかります。自動車部品店が箱の写真を使って自動車のヘッドライトを販売し始めた場合、機械学習ツールはそれに気づき、自動的に適応します。この情報は、数百万の製品にわたる数千の異なる製品カテゴリに利用しています。

しばしば、機械学習ツールは人間が見逃すパターンに気づくことができます。例えば、オートバイのヘッドライトは自動車のヘッドライトとはわずかに異なります。また、美容製品はしばしば女性がそのアイテムを顔の近くで持っている写真で販売されますし、高価な衣類はモデルに着せられ、安価なアイテムはマネキンに置かれたり、テーブルの上に折りたたまれて置かれたりします。これらは一度気づくと簡単に見えるパターンや詳細ですが、実際には見逃しやすいものです。

機械も常識を学ぶことができます。もし店舗が健康と美容製品に焦点を当てている場合、製品画像にある花やぶどうは販売されていないことがわかります。それらは単に装飾的なものです。また、セミトラックが$24.99で販売されている場合、それはおそらくおもちゃのトラックかTシャツです。これらの一般的な混乱の原因は、機械が私たちが扱うのとほぼ同じように扱います。システムが使用されるほど、改善されます。

私たちは機械に私たちの間違いから学ばせることができます。最初に分類が画像の中のぶどうや花を混乱させた場合、それはこれらの無関係で装飾的なアイテムを無視し、画像の中心にある美容クリームの tub に焦点を当てるように教えることができます。これは何かが新しいときによく発生します。難しいまたは新しい問題を見てくれる人間の分類者を呼ぶこともできます。

コンピュータにパターンを探させ、専門家がそのパターンをレビューすることは、より多くの製品をトラブルを少なくして出荷するための素晴らしい方法です。最終的には、これが信頼を生み出します。製品を国境を越えて送ることは、その努力に何が必要かをすべて知っている必要はありませんが、作業が行われたことを知ることで、私たちの分類システムがビジネスを成長させるための重要なツールであると信頼できます。

Author
David Richards
Published: April 16, 2021
Share