April 16, 2021 byDavid Richards

Klassifisering av HS-tariffkoder møter maskinlæring

April 16, 2021
David Richards

Hos Zonos jobber vårt team av bransje- og programvareeksperter alltid med måter å forenkle grenseoverskridende handel på. En del av dette er å sikre at enhver virksomhet som flytter produkter over landegrensene har disse varene riktig klassifisert. Alle land bruker det samme systemet for å beskrive produktene du selger, kalt Harmonized Code-systemet. Å ha produktene dine riktig klassifisert ved å bruke HS- eller HTS-koder bidrar til å sikre konsistens når pakkene dine blir undersøkt ved grensen.

Det er mange kompleksiteter når det gjelder frakt av produkter over landegrensene; men når det gjelder HS-koder, kan nøyaktige automatiserte klassifiseringer fungere som et kritisk verktøy for å vokse virksomheten din. Selv om nøyaktig produktklassifisering har vært en tidkrevende og kostbar prosess tidligere, jobber vi med å fikse det. Zonos har et bransjeendrende verktøy kalt Classify som tildeler en Harmonized Code til produktbeskrivelser.

Som både bransjespesialist og programvareingeniør kan jeg forklare hvordan dette fungerer fra et unikt perspektiv. La oss bryte ned hvordan HS-klassifisering for grenseoverskridende handel møter maskinlæring.

Min bilde

Hvis du selger et produkt kalt, “Men’s Gold Toe Windsor Wool (12 Pairs) Black,” kan systemet vårt tildele en kode til det, 6115.94. Tollinspektøren som undersøker varer som sendes til landet kan se på koden, forstå hva som er i pakken, og sende varen videre uten forsinkelse.

De første to tallene, 61, forteller inspektøren at varen er strikket eller heklet bekledning, i stedet for 62 for ikke-strikkede varer. De neste to tallene, 15, indikerer at dette er sokker. De siste to tallene, 94, avslører at dette er helsokker.

Det kan virke åpenbart at et produkt med navnet, “Men’s Gold Toe Windsor Wool (12 Pairs) Black” ville passe til beskrivelsen 6115.94, men det finnes mange lignende koder som kunne vært valgt avhengig av trådtykkelsen eller andre hensyn. Vårt klassifiseringsverktøy må matche en kode til et produkt og finne den beste tilgjengelige matchen.

Dette blir mer komplisert når vi vet hvor varen skal sendes. Hvert land tildeler ekstra koder. For eksempel, de ekstra 00 på slutten av 6115.94.00 forteller en kanadisk tollinspektør at dette er en ullsokk, og 6115.94.0000 gir enda mer detaljert informasjon som lar dem vite at skattene som skal betales på varen er betydelig høyere enn for en vanlig ullsokk. Jeg kunne ikke finne en forklaring på hvorfor dette er annerledes, og derfor er riktig klassifisering så viktig; det er så lett å gjøre en feil når man klassifiserer produkter.

Beskrivelsen 6115.94.0000 er identisk med beskrivelsen 6115.94.00, men de to ekstra 0-ene kan øke avgiften rate. Våre verktøy må ikke bare forstå den mest korrekte klassifiseringen, men også forstå hvordan beslutningene våre påvirker kundene våre.

Løsninger for klassifisering 

Fordi det finnes så mange forskjellige produkter og hyppig skiftende regler, kan dette bli komplisert. Mennesker, selv eksperter, får koden riktig omtrent 7 av 10 ganger, og manuell produktklassifisering er en ekstra arbeidsbelastning.

En annen løsning er å skrive et dataprogram med alle reglene. Bransjeeksperter classify produkter og programvareingeniører legger til reglene ekspertene følger. Et slikt system kan få den riktige koden omtrent 9 av 10 ganger. Jeg vet dette fordi vårt team hos Zonos har gjort dette. Reglene vi lager tar hensyn til følgende:

  • Hvordan et produkt er beskrevet
  • Hvilket bilde som brukes til å reklamere for produktet
  • Hvem som selger produktet
  • Kostnaden for produktet

Å ta hensyn til disse faktorene resulterer i maksimal klassifiseringsnøyaktighet.

Å ha 9/10 klassifiseringsnøyaktighet for varer er utrolig, men vi er ikke ferdige ennå. Den ene feilklassifiserte varen er verdifull for oss fordi vi bruker den som data for å identifisere vanskelige mønstre for å forbedre nøyaktigheten og resultatene våre. For eksempel så jeg nylig et produkt i en nettbutikk beskrevet som sokker som “ser bra ut i en skreddersydd dress og ville være det perfekte komplementet til et dyrt par dressko,” som kan være vanskelig å classify. Mennesker vet at produktet er sokker, men beskrivelsen kan handle om dresser eller sko.

For å forhindre at datamaskinen blir forvirret, blir reglene mer og mer kompliserte. Du kan forestille deg at dette blir enda vanskeligere når bare et merkenavn brukes, et ord er feilstavet, eller bildet for et produkt inkluderer flere varer.

Med alle disse eksisterende problemfaktorene, for å få klassifiseringen riktig minst 99 ganger av 100, bruker vi maskinlæring. Maskinlæring sier at vi skal slutte å fortelle datamaskinen hver lille ting som kan være viktig og be datamaskinen lære hva som er viktig for seg selv. Vi har fortsatt eksperter og regler, men datamaskinen har en mye større oppgave og kan ofte oppnå mye bedre resultater enn mennesker.

Maskinlæring: Gjenkjenne mønstre 

En måte vi ber datamaskinen om å løse dette problemet for oss, er å gi den produktbildene og be datamaskinen om å finne mønstre i disse bildene. Når den er klar, kan datamaskinen identifisere forskjeller som mennesker kanskje overser.

Mitt bilde

Her er et eksempel på billys. Gitt tusenvis av bilder av billys, ba jeg datamaskinen om å organisere dem etter hvor forskjellige bildene er fra hverandre. Jeg fortalte ikke datamaskinen noe om bildene. Når den gjorde dette, bestemte datamaskinen at det var tre eller fire forskjellige typer bilder som vanligvis brukes for å selge et billys. Eksempler på hver type produktbilde ser slik ut:

Mitt bilde

I disse bildene er det to former for billys og ett som er på en bil. Hvis jeg ser på andre bilder i hver gruppe, ser jeg at hver gruppe er fylt med bilder som er like. Hvis bildelerbutikker begynte å selge billys med bilder av esken, ville maskinlæringsverktøyene legge merke til det og tilpasse seg automatisk. Jeg bruker denne informasjonen for tusenvis av forskjellige produktkategorier på tvers av millioner av produkter.

Ofte kan maskinlæringsverktøyene legge merke til mønstre som mennesker overser. For eksempel ser et motorsykkellys litt annerledes ut enn et billys; eller, et skjønnhetsprodukt blir ofte solgt med en kvinne som holder varen nær ansiktet sitt, eller et dyrt klesplagg blir ofte plassert på en modell, mens et billigere plagg ofte plasseres på en mannekeng eller bare brettes på et bord. Disse virker som enkle mønstre og detaljer å legge merke til når jeg først ser dem, men de er faktisk ganske lette å overse.

Maskinene kan også lære sunn fornuft. Hvis en butikk fokuserer på helse- og skjønnhetsprodukter, vet vi at blomstene og druene som er i noen av produktbildene ikke blir solgt; de er bare dekorative. Eller hvis en semi-lastebil blir solgt for $24.99, er det sannsynligvis en leketøylastebil eller en t-skjorte. Disse vanlige kildene til forvirring blir behandlet av maskinen mer eller mindre på samme måte som du eller jeg ville behandlet dem. Jo mer systemet brukes, jo mer forbedres det.

Vi kan lære maskiner å lære av våre feil. Etter at en klassifisering forvirrer druene eller blomstene i bildet første gang, kan den læres opp til å ignorere disse irrelevante, dekorative elementene og fokusere på tuben med skjønnhetskrem i midten av bildet. Dette skjer ofte når noe er nytt. Vi kan alltid ta inn en menneskelig klassifiserer for å se på vanskelige eller nye problemer.

Å la datamaskinen se etter mønstre og en ekspert vurdere disse mønstrene er en flott måte å få flere produkter sendt med mindre problemer. På slutten av dagen skaper dette tillit. Å sende et produkt over landegrenser bør ikke kreve at du vet alt som går inn i arbeidet; men ved å vite at arbeidet er gjort, kan du stole på at vårt klassifiseringssystem er et viktig verktøy for å vokse virksomheten din.

Author
David Richards
Published: April 16, 2021
Share