テキスト入力のみで作業把握、全体の最適化に貢献
NECは8月27日、複数のカメラでなければカバーできないような物流倉庫・工場や建設現場などの広い作業エリアで、複数の作業員の作業行動を、現場映像を用いた事前学習なしで認識し、データ化できるAI技術を開発したと発表した。
産業現場で即座に導入できるため、これまで実現できていなかった作業現場全体の可視化を加速し、作業効率の向上、人的リソースの最適配分、ワークフローの適切化などに貢献できると見込む。2026年度までの実用化を目指す。
カメラ映像から作業行動を認識する技術は既に存在しているが、現場における特定の作業行動を認識するためには、現場映像データの収集とAIモデルの学習といった事前準備に多くの時間や手間を要していた。
また、多数のカメラをまたいで広い作業エリア全体の作業行動をデータ化するためには、映像中の複数の作業者をカメラ間で同定し、作業行動認識結果を作業者ごとに統合することが必要だが、これまでの技術では、同一の作業服を着ている複数の作業者を正しく見分け、複数のカメラ間で誤りなく同一人物を同定し続けることが困難だった。
こうした課題を解決するため、新技術開発にこぎ着けた。
ピッキング作業に対しては「棚から荷物を取り出している」、台車運搬作業に対しては「台車を押して運んでいる」といった作業行動の説明テキストを入力するだけで認識することが可能。旧来は作業を認識させるために映像データの収集・正解付け(アノテーション)・AIモデル学習などに数週間程度の時間を要していたほか、人が触れたり操作したりする物体の特定が難しく、雑多な物体が混在している作業現場における映像から作業行動の認識が困難だった。
作業員を服装など外観の特徴に頼ることなく識別し、現場全体で長時間に渡って作業員ごとの作業行動実績をデータ化できるようにしている。人物の位置推定に必要となるカメラパラメータ(カメラの位置や姿勢)を自動で推定するため、現場導入の手間を軽減できると見込む。
(藤原秀行)