アノテーション作業の中でも、バウンディングボックス付与は一見簡単なようで、習熟度や物体検出の理解度の違いにより、学習データの精度にばらつきが生じます。クラウドソーシングによりアノテータを調達することでコストは抑えられますが、学習データのクオリティが低いと、いつまでたってもモデルの精度が向上せず、結果として学習コストが膨らんでしまう、あるいはチューニング工数が想定以上にかかる、という事になります。
サイバーテックが提供する、アノテーションによる学習データ作成代行(バウンディングボックス)作業では、自社直営オフショア拠点にて、経験豊富な直接雇用のスタッフがアノテーション作業をリーズナブルに代行いたします。
AIの普及が進むにつれ、統計処理的な古いAIではなく、ディープラーニングに代表される新しいAIがどんどん浸透しています。そのような中、一昔前の大規模かつ多大なコストが必要とされてきたディープラーニングですが、昨今は手軽に試すことが可能なフレームワークや、学習モデルを構築するためのインフラ基盤がクラウドで簡単に活用できるため、一部の大手企業だけではなく、中小企業でも試すことが出来る状況となり、ディープラーニングを活用する上でのすそ野が広がりつつあります。
その際どうしても必要とされるのが学習データとなりますが、人が実施する業務を補完する程度の目的であれば、物体検出レベルのAIを導入することにより、多少なりとも人手による業務負荷の軽減を行う事ができます。そのような場合、精緻なセグメンテーションまでのアノテーションは不要となり、手軽にアノテーションを実施する、バウンディングボックスによる物体検出によるデータセットの準備が必要となる場合があります。既存のデータセットが存在すればそちらを活用することにより学習モデルを構築することが出来ますが、データセットが存在しない場合は、ヒューマン ラベリングなどにより学習データセットを準備する必要があります。
バウンディングボックスによるアノテーションは、単純なものであれば単価が安くなりがちであり、クラウドソーシングによるスタッフを集めて管理すると、クオリティコントロールさえうまく行う事が出来れば、コスト的にはリーズナブルに実施することが可能です。しかし、バウンディングボックスによるアノテーションを行った後、さらにセグメンテーションを実施する、といった高度なアノテーションの場合、ディープラーニングの知識に乏しいアノテータ・スタッフ、あるいはアノテーションマネージャが実施するためには、手順書の整備や見直し、クラス付与の判断など、専門的な知識と経験が求められます。
サイバーテックがフィリピン・セブ島に有する自社直営オフショア拠点である「セブITアウトソーシングセンター」では、日本品質で様々なBPO・ITアウトソーシングサービスを提供しており、アノテーション作業においても数十名のスタッフが画像データに対する様々なアノテーション作業に携わっております。オフショア拠点では指示書によるクオリティコントロールは十分可能ですが、複合的なアノテーションを設計し、実施することはなかなか困難です。そのような場合は、本社サイドにて都度コンサルティングに入ることが可能となりますので、どのような背景で、何を考慮しながらバウンディングボックスによる物体検出をしなければならないか、といった事を考慮しつつ、アノテーション・プロジェクト全体を通して、高いクオリティのアノテーションを実現いたします。
ディープラーニングによる校正AIを自社で構築し、サービス提供を行っているため、当社はディープラーニング自体のノウハウも有しています。したがって、手順書の作成や、セグメンテーションやクラシフィケーションなども含んだ、複合的なアノテーション・プロジェクトを実施することが可能です。フィリピンの直営オフショア拠点で実施するため、単純なバウンディングボックスのみ付与する業務に関しても、クラウドソーシングによるアノテーション・プロジェクトに匹敵した低コストによるアノテーションが可能です!
当社はフィリピン、セブ島に自社オフィスを所有しているため、直接雇用の日本人マネージャーと、同じく直接雇用のフィリピン人アノテータによるヒューマン ラベリングを実施します。特にバウンディングボックス単体のアノテーションの場合、価格重視となりがちですので、クラウドワーカーによる在宅作業も多くなります。その場合、プロジェクト内容や実施企業名といった情報の流出や、データ自体の流出や紛失といったセキュリティ面が心配です。当社の場合、指紋認証付きエントランスや監視カメラの設置、日本人管理者常駐などのセキュリティ管理の下で作業を実施するため、セキュリティ面での不安もありません。
バウンディングボックス付与を実施するセブITアウトソーシングセンターでは、正社員によるアノテーション作業を繰り返し実施しているため、経験豊富なスタッフがスピーディなアノテーション作業を行います。さらに経験豊富なアノテーションマネージャが進捗管理やチェック体制の構成、指示書の作成や見直しなどを行うため、アノテーション経験が豊富なチーム体制での作業となるため、属人的な「バラツキ・誤差」を極力なくし、高品質なバウンディングボックス付与作業を実現します。
また、正社員による実施体制のため、クライアント企業のアノテーション部門として、Bynameによる要員固定を行っていただくことが可能です。これにより、長期的な視点において、さらなる品質向上とコストダウンを実現することが可能となります。
バウンディングボックス~AI向け学習データ作成(アノテーション)サービスの流れは以下の通りとなります。
学習データの作成対象となる画像データのサンプルと作業手順書を拝見した上で、作業概要(一画像当たりの平均バウンディングボックス数や全体の画像数、納品形態など)をお聞きします。作業手順書が存在しない場合は、バウンディングボックスの付与基準などの仕様に応じた形で、作業手順書もしくはバウンディングボックスの付与ガイドラインを別途作成する事も可能です。構築予定の学習モデルや想定用途・業務などについてもお聞かせいただくと、より最適なご提案が可能です。秘密保持契約の締結が必要となる場合は、いつでもお申しつけください。
全画像データに対して、ご要望の仕様やツールで学習データ作成(画像データのアノテーション - バウンディングボックス付与)を行った場合の想定体制、および想定期間と概算費用をご提示いたします。特にクオリティに関して、アノテーションマネージャを日本人もしくはフィリピン人のいずれが担当するか・クロスチェックの有無、などの条件により費用は変わるため、ご予算も伺いつつ、最適なプランをご提案いたします。
ご提案プランの内容で着手指示頂く前提、もしくは少額のご発注により、少ロットの画像データを用いた学習データ作成(画像データのアノテーション - バウンディングボックス付与)を実施いたします。想定体制でご要望のクオリティと量産スピードを両立させることが出来るかどうかに着目した形で進めさせていただき、作成したバウンディングボックスの付与済学習データをご指定の形式で納品するとともに、作業手順書の見直しを実施します。トライアルプロジェクトにおける納品物は、少量とはなりますが、実際のAI学習データとして活用いただけます。
小ロットの画像データを用いたアノテーション(バウンディングボックス付与)作業のトライアルプロジェクトを行った結果について、評価・検証を行います。その上で、主にクオリティや作成スピードの面において、当初ご提案した体制やメンバー通りで良いか、あるいは別の体制やメンバーを再検討すべきか、といった内容を本フェーズで検証させていただきます。プロジェクト体制や仕様の変更が発生した場合は、3.に戻り再度トライアルプロジェクトによる学習データの作成を実施することも可能です。トライアルプロジェクトでの成果物をご確認後、正式にご発注頂けますので、オフショア委託が初めてのお客さまでも安心してご依頼いただけます。全体の画像枚数やバウンディングボックスの付与数が少ない場合は、トライアルプロジェクトを延長する形でそのまま本番プロジェクトとした上で、検収を実施して頂く場合もございます。
画像データのアノテーション(バウンディングボックス付与)・トライアルプロジェクトの評価・検証を行った結果、問題無いとご判断頂いた後、全ての画像データに対して、バウンディングボックスを付与いたします。プロジェクトの途中であっても、画像データの追加や変更・バウンディングボックス付与仕様の変更などにより実施フローの見直しが必要となった場合は、軽微なものであればプロジェクト内で吸収した形で進めることが可能です。大きな方向性の見直しが必要となった場合は、3.もしくは4.のフェーズに戻り、アノテーション・プロジェクトの体制やクオリティ基準の再検討から進めさせていただきます。
概要 | バスケットボールの画像データセットに対して、バウンディングボックスを付与するアノテーション作業により教師データを作成(クラス数:1、1画像あたりの平均オブジェクト:2-3)。データチェックは弊社側100%にて実施。 |
---|---|
ボリューム | 50,000ファイル |
使用ツール・技術 | labelImg、YOLO |
作業場所 | セブITアウトソーシングセンター(フィリピンの自社オフショア拠点) |
その他 |
|
価格・費用 | お問合せください |
概要 | ディープラーニング(深層学習)用の学習データとして、支給された画像に対して矩形アノテーションを実施(クラス数:10、1画像あたりの平均オブジェクト:5)。データチェックは弊社側100%にて実施。 |
---|---|
ボリューム | 10,000ファイル |
使用ツール・技術 | LabelImg、JSON |
作業場所 | セブITアウトソーシングセンター(フィリピンの自社オフショア拠点) |
その他 |
|
価格・費用 | お問合せください |
上記は一般的なバウンディングボックス~AI向け学習データ作成(アノテーション)サービスの事例となります。そのほか多数の事例がございます、詳細はお問合せください。
バウンディングボックス~AI向け学習データ作成(アノテーション)サービスに関する次のような課題をお持ちではありませんか?
バウンディングボックスを付与する画像データのアノテーション作業は、サイバーテックがフィリピンに有する自社直轄オフショア拠点「セブITアウトソーシングセンター」で実施いたしますが、ご契約および受発注をはじめ、東京本社から様々なフォローアップを行わせて頂きます。特に画像データのアノテーションは品質が重要です。「安かろう・悪かろう」といった事が起こりやすい海外ベースのオフショア企業とは異なり、日系企業の海外オフショア拠点として責任を持って取り組ませて頂きます!
バウンディングボックスを付与する対象画像が大量に存在する場合は、週次で成果物を納品いたしますので、お客様の方で最終チェック頂くという流れが基本となります。ただし、バウンディングボックスを付与する画像データのアノテーションの場合、約1000枚の画像であれば1~2週間程度で終了する場合も多々ありますので、一括納品後、最終チェックを行って頂き、微修正があれば対応させて頂く、といった流れでもご対応可能です。
もちろん可能です。画像データのアノテーション(バウンディングボックスの付与)仕様、およびご予算とご希望の納期をお聞かせ頂けると、どれぐらいのアノテーション・レベルで実施可能となるか、すぐに回答させていただきます。自社オフショア拠点ならではの高品質かつ低価格にて、ヒューマンラベリングによるアノテーション作業をご提案いたします。詳細はお問合せください。
バウンディングボックスの付与仕様や手順書などが日本語で書かれていても問題ございません。全ての案件に現地日本人スタッフが付きますので、お客様とのコミュニケーションは日本人が担当させて頂きます。日本語が分かる外国籍、あるいは翻訳者や通訳を介したプロジェクト進行とは異なりますので、海外委託における一番のリスクであるコミュニケーションの齟齬を防ぐことができます。
AI関連プロジェクトをご担当されるお客様の中には、日本語・英語のどちらでも普通にコミュニケーションを取って頂ける方がおられます。そのような場合、英語で指示を出して頂くと、日本人コミュニケータのコストが不要となりますので、大変リーズナブルにバウンディングボックスの付与が可能となります。
御相談、ご質問はこちら |
サービスご案内資料や、特別資料「神は細部に宿る~アノテーションを駆使したAIシステムの精度向上」がダウンロードできます。 |
最新事例の公開情報や、イベント・セミナー情報をお届けします。 |