フォーマット異なるコマーシャル・インボイスの54項目を高精度で自動読み取り
AIを活用したソリューションを提供するシナモンは8月9日、世界中で幅広く使用されているものの、国や企業ごとにフォーマットが異なる貿易書類のコマーシャル・インボイス(Commercial Invoice)向けに、54項目を自動認識してテキストを抽出するオリジナルのAI-OCR(光学式文字読み取り装置)「Flax Scanner for 貿易書類 Commercial Invoice汎用モデル」を同日発売したと発表した。
コマーシャル・インボイスのようにフォーマットが無数に存在する書類を読み取ることが可能なAI-OCRシステムの開発には、抽出項目の座標定義を必要としない高度なAI-OCR の技術(特徴量学習型)が必要になる。今回発表した特徴量学習型のAI-OCR「Flax Scanner for 貿易書類 Commercial Invoice汎用モデル」は、使用頻度の高さや優先度などで整理した54項目を自動で読み取ることができるほか、そのうち特に重要度の高い24項目はテストの結果、文字単位精度で平均91.24%、項目別精度で平均82.74%と、高精度の読み取りを実現しているという。
シナモンAは専用モデル構築までのコストと時間が不要で、スピーディに導入することができる、汎用性の高い高精度なAI-OCRにより、貿易業界のDXを推進していきたい考え。
特徴量学習型AI-OCRは、複数の帳票で項目ごとに共通する様々な特徴を学習して項目を特定し、記載内容と項目をひも付けることができる技術。何の帳票か、どこに何が書かれているのかを自動で判断するため、顧客側での設定が不要なのがメリット。シナモンは多種多様なフォーマットの非定型帳票に強いAI-OCRと表現している。
シナモンはこれまで、貿易業界の帳票に特化した専用AI-OCR「Flax Scanner for 貿易書類」を提供してきたほか、貿易業務実務者で構成される「貿易コンソーシアムへ入会」するなど、貿易業界のAI導入によるDX推進に注力し、導入実績とノウハウを蓄積してきた。
顧客専用のAI-OCRモデルの開発は、項目別精度(全項目を正確に読み取れているかどうかの指標)85~90%、文字単位精度(何文字中何文字読み取れているかの指標)90~95%を達成してきた。しかし、帳票ごとに専用のAI-OCRモデルを開発するためコストがかさみ、導入できる企業は限られていたのが課題だった。
そこで、より多くの企業でAI-OCRを導入できるよう、まずは顧客のニーズが高い「Commercial Invoice汎用モデル」の開発に着手。シナモンの高度なAIテクノロジーにより、幅広いコマーシャル・インボイスのフォーマットを読み取ることができる実用レベルの汎用AI-OCRが完成した。
AI-OCRシステムの多くは、フォーマット化された書類から、どこに何の記載があるのかを事前に定義する「座標定義型」で開発されるが、世界的な貿易取引はフォーマットが無数にあるため「座標定義型」で対応するのは実質的に不可能だった。
今回発表の「Flax Scanner for 貿易書類 Commercial Invoice汎用モデル」を開発する際に用いた「特徴量学習型AI-OCR」は、AIに膨大なデータを学習させることで、特徴(パターンや一貫性)を見つけ出し、そのデータが何のデータであるのかをAI自身で特定させる学習方法。事前の座標定義が不要なため、フォーマットが無数に存在する貿易書類にも対応できるのが強み。
今後はコマーシャル・インボイスに続いてニーズのあるPacking List(包装明細書)、Bill of Lading (船荷証券)、Arrival Notice(貨物到着通知 )など、帳票ごとの汎用AI-OCRの開発・導入拡大を目指す。
「Flax Scanner for 貿易書類 Commercial Invoice汎用モデル」読み取り対象54項目(重要度の高いものは*)
※(明細)と付いている項目は、表形式で読み取る
◇読み取り精度(シナモンAIによるテストデータ値)
重要項目精度 ●文字単位精度:平均91.24% / ●項目別精度:平均82.74%
全項目精度 ●文字単位精度:平均87.23% / ●項目別精度:平均78.86%
No. |
読み取り項目名 |
1 |
Shipper/Exporter Name* |
2 |
Shipper/Exporter Address* |
3 |
Shipper/Exporter Phone No. |
4 |
Shipper/Exporter FAX No. |
5 |
Shipper/Exporter Department |
6 |
Consignee/Messrs/Shipped to Name* |
7 |
Consignee/Messrs/Shipped to Address* |
8 |
Consignee/Messrs/Shipped to Phone No. |
9 |
Buyer/Accountee/Sold to Name* |
10 |
Buyer/Accountee/Sold to Address* |
11 |
Buyer/Accountee/Sold to Phone No. |
12 |
Invoice Date |
13 |
Invoice No. * |
14 |
B/L No. |
15 |
Customer No./Account No. |
16 |
Contract No./Contract No. |
17 |
Order No. |
18 |
P/O No. |
19 |
Booking No. |
20 |
Vessel Name/Means of Transport & Route* |
21 |
Voyage No. * |
22 |
Port of Loading/From* |
23 |
Shipment Date/Date of Departure/ON |
24 |
Via |
25 |
Port of Discharge* |
26 |
Final Destination |
27 |
Country of Origin* |
28 |
Payment Terms* |
29 |
L/C No. |
30 |
Item Name/Description of Goods(明細)* |
31 |
HS Code(明細)* |
32 |
Item No./Lot No.(明細)* |
33 |
Item Quantity/Unit Quantity(明細)* |
34 |
Total Quantity per item(明細)* |
35 |
Unit(明細)* |
36 |
Unit Price(明細)* |
37 |
Amount per item(明細)* |
38 |
Tax* |
39 |
Case Mark/Marks & Nos./No. of Packages |
40 |
Incoterms/Trade Terms* |
41 |
Total Quantity/Total Packages |
42 |
Subtotal Amount |
43 |
Freight Cost |
44 |
Bank Name |
45 |
Bank Branch Name |
46 |
Account Name |
47 |
Bank Account Number |
48 |
Bank Address |
49 |
Swift Code/Swift Address/BIC Code |
50 |
Payment Date/Due Date |
51 |
Signatory Company |
52 |
Signed by |
53 |
Currency* |
54 |
IBAN Code |
(藤原秀行)※いずれもシナモン提供